Principale » negoziazione algoritmica » Campionamento casuale stratificato

Campionamento casuale stratificato

negoziazione algoritmica : Campionamento casuale stratificato
Che cos'è il campionamento casuale stratificato?

Il campionamento casuale stratificato è un metodo di campionamento che prevede la divisione di una popolazione in sottogruppi più piccoli noti come strati. In stratificazione casuale stratificata o stratificazione, gli strati sono formati in base agli attributi o alle caratteristiche condivise dei membri come reddito o livello di istruzione.

Il campionamento casuale stratificato è anche chiamato campionamento casuale proporzionale o campionamento casuale di quota.

[Importante: il campionamento stratificato viene utilizzato per evidenziare le differenze tra i gruppi in una popolazione, al contrario del semplice campionamento casuale, che tratta tutti i membri di una popolazione come uguali, con la stessa probabilità di essere campionati.]

01:40

Campionamento casuale stratificato

Come funziona il campionamento casuale stratificato

Quando si completano analisi o ricerche su un gruppo di entità con caratteristiche simili, un ricercatore potrebbe scoprire che la dimensione della popolazione è troppo grande per cui completare la ricerca. Per risparmiare tempo e denaro, un analista può adottare un approccio più fattibile selezionando un piccolo gruppo dalla popolazione. Il piccolo gruppo viene indicato come dimensione del campione, che è un sottoinsieme della popolazione utilizzato per rappresentare l'intera popolazione. Un campione può essere selezionato da una popolazione in vari modi, uno dei quali è il metodo di campionamento casuale stratificato.

Un campionamento casuale stratificato comporta la divisione dell'intera popolazione in gruppi omogenei chiamati strati (plurale per strato). Campioni casuali vengono quindi selezionati da ogni strato. Ad esempio, si consideri un ricercatore accademico che vorrebbe conoscere il numero di studenti MBA nel 2007 che hanno ricevuto un'offerta di lavoro entro tre mesi dalla laurea.

Scoprirà presto che c'erano quasi 200.000 laureati in MBA per l'anno. Potrebbe decidere di prelevare un semplice campione casuale di 50.000 laureati ed eseguire un sondaggio. Meglio ancora, potrebbe dividere la popolazione in strati e prelevare un campione casuale dagli strati. Per fare ciò, avrebbe creato gruppi di popolazione in base a genere, fascia di età, razza, paese di nazionalità e carriera. Un campione casuale di ogni strato viene prelevato in un numero proporzionale alla dimensione dello strato rispetto alla popolazione. Questi sottoinsiemi degli strati vengono quindi raggruppati per formare un campione casuale.

Key Takeaways

  • Il campionamento casuale stratificato consente ai ricercatori di ottenere una popolazione campione che rappresenta al meglio l'intera popolazione studiata.
  • Il campionamento casuale stratificato implica la divisione dell'intera popolazione in gruppi omogenei chiamati strati.
  • Il campionamento casuale stratificato differisce dal semplice campionamento casuale, che comporta la selezione casuale di dati da un'intera popolazione, quindi è probabile che si verifichi ugualmente ogni possibile campione.

Esempio di campionamento casuale stratificato

Supponiamo che un gruppo di ricerca voglia determinare il GPA degli studenti universitari negli Stati Uniti. Il gruppo di ricerca ha difficoltà a raccogliere dati da tutti i 21 milioni di studenti universitari; decide di prelevare un campione casuale della popolazione utilizzando 4.000 studenti.

Ora supponiamo che il team guardi i diversi attributi dei partecipanti del campione e si chieda se ci siano differenze negli GPA e nelle major degli studenti. Supponiamo di scoprire che 560 studenti sono laureati in inglese, 1.135 laurea in scienze, 800 in informatica, 1.090 in ingegneria e 415 in matematica. Il team vuole utilizzare un campione casuale stratificato proporzionale in cui lo strato del campione è proporzionale al campione casuale nella popolazione.

Supponiamo che il team ricerca i dati demografici degli studenti universitari negli Stati Uniti e trovi la percentuale di ciò che gli studenti sono più importanti nel 12% in inglese, 28% in scienze, 24% in informatica, 21% in ingegneria e 15% in ingegneria in matematica. Pertanto, vengono creati cinque strati dal processo di campionamento casuale stratificato.

Il team deve quindi confermare che lo strato della popolazione è proporzionale allo strato nel campione; tuttavia, trovano che le proporzioni non sono uguali. Il team deve quindi ricampionare 4.000 studenti della popolazione e selezionare casualmente 480 studenti di inglese, 1.120 scienze, 960 informatica, 840 ingegneria e 600 studenti di matematica.

Con questi, ha un campione casuale stratificato proporzionato di studenti universitari, che fornisce una migliore rappresentazione dei principali studenti universitari negli Stati Uniti. I ricercatori possono quindi evidenziare uno strato specifico, osservare i vari studi degli studenti universitari statunitensi e osservare le varie medie dei voti .

Campioni casuali semplici contro campioni casuali stratificati

Campioni casuali semplici e campioni casuali stratificati sono entrambi strumenti di misurazione statistica. Un semplice campione casuale viene utilizzato per rappresentare l'intera popolazione di dati. Un campione casuale stratificato divide la popolazione in gruppi più piccoli, o strati, in base a caratteristiche condivise.

Il semplice campione casuale viene spesso utilizzato quando sono disponibili pochissime informazioni sulla popolazione di dati, quando la popolazione di dati presenta troppe differenze da dividere in vari sottoinsiemi o quando esiste solo una caratteristica distinta tra la popolazione di dati.

Ad esempio, un'azienda produttrice di caramelle potrebbe voler studiare le abitudini di acquisto dei suoi clienti al fine di determinare il futuro della sua linea di prodotti. Se ci sono 10.000 clienti, è possibile scegliere 100 di questi clienti come campione casuale. Può quindi applicare ciò che trova da quei 100 clienti al resto della sua base. A differenza della stratificazione, campionerà 100 membri puramente a caso senza alcun riguardo per le loro caratteristiche individuali.

Stratificazione proporzionata e sproporzionata

Il campionamento casuale stratificato garantisce che ciascun sottogruppo di una determinata popolazione sia adeguatamente rappresentato nell'intera popolazione campione di uno studio di ricerca. La stratificazione può essere proporzionata o sproporzionata. In un metodo stratificato proporzionato, la dimensione del campione di ogni strato è proporzionata alla dimensione della popolazione dello strato.

Ad esempio, se il ricercatore voleva un campione di 50.000 laureati utilizzando la fascia di età, il campione casuale stratificato proporzionato verrà ottenuto usando questa formula: (dimensione del campione / dimensione della popolazione) x dimensione dello strato. La tabella seguente presuppone una dimensione della popolazione di 180.000 MBA laureati all'anno.

Fascia di età


24-28


29-33


34-37


Totale


Numero di persone nello strato


90.000


60.000


30.000


180.000


Dimensione del campione degli strati


25.000


16.667


8.333


50.000


La dimensione del campione di strati per laureati in MBA nella fascia di età compresa tra 24 e 28 anni è calcolata come (50.000 / 180.000) x 90.000 = 25.000. Lo stesso metodo viene utilizzato per le altre fasce di età. Ora che la dimensione del campione di strati è nota, il ricercatore può eseguire un semplice campionamento casuale in ogni strato per selezionare i partecipanti al sondaggio. In altre parole, 25.000 laureati della fascia di età 24-28 saranno selezionati in modo casuale da tutta la popolazione, 16.667 laureati dalla fascia di età 29-33 saranno selezionati in modo casuale dalla popolazione e così via.

In un campione stratificato sproporzionato, la dimensione di ogni strato non è proporzionale alla sua dimensione nella popolazione. Il ricercatore può decidere di campionare 1/2 dei laureati nella fascia di età 34-37 e 1/3 dei laureati nella fascia di età 29-33.

È importante notare che una persona non può adattarsi a più strati. Ogni entità deve inserirsi in un solo strato. Avere sottogruppi sovrapposti significa che alcuni individui avranno maggiori possibilità di essere selezionati per il sondaggio, il che annulla completamente il concetto di campionamento stratificato come tipo di campionamento di probabilità.

[Importante: i gestori di portafoglio possono utilizzare il campionamento casuale stratificato per creare portafogli replicando un indice come un indice obbligazionario.]

Vantaggi del campionamento casuale stratificato

Il vantaggio principale del campionamento casuale stratificato è che acquisisce le caratteristiche chiave della popolazione nel campione. Simile a una media ponderata, questo metodo di campionamento produce caratteristiche nel campione proporzionali alla popolazione complessiva. Il campionamento casuale stratificato funziona bene per popolazioni con una varietà di attributi, ma è altrimenti inefficace se non si possono formare sottogruppi.

La stratificazione dà un errore minore nella stima e una maggiore precisione rispetto al semplice metodo di campionamento casuale. Maggiore è la differenza tra gli strati, maggiore è il guadagno in precisione.

Svantaggi del campionamento casuale stratificato

Sfortunatamente, questo metodo di ricerca non può essere utilizzato in tutti gli studi. Lo svantaggio del metodo è che devono essere soddisfatte diverse condizioni per un corretto utilizzo. I ricercatori devono identificare ogni membro di una popolazione studiata e classificare ciascuno di essi in un'unica sottopopolazione. Di conseguenza, il campionamento casuale stratificato è svantaggioso quando i ricercatori non possono classificare con sicurezza ogni membro della popolazione in un sottogruppo. Inoltre, trovare un elenco esauriente e definitivo di un'intera popolazione può essere una sfida.

La sovrapposizione può essere un problema se ci sono soggetti che rientrano in più sottogruppi. Quando viene eseguito un semplice campionamento casuale, è più probabile che vengano scelti coloro che fanno parte di più sottogruppi. Il risultato potrebbe essere una rappresentazione errata o un riflesso impreciso della popolazione.

Gli esempi di cui sopra lo rendono semplice: studenti universitari, laureati, maschi e femmine sono gruppi chiaramente definiti. In altre situazioni, tuttavia, potrebbe essere molto più difficile. Immagina di incorporare caratteristiche come razza, etnia o religione. Il processo di selezione diventa più difficile, rendendo il campionamento casuale stratificato un metodo inefficace e tutt'altro che ideale.

Confronta i conti di investimento Nome del fornitore Descrizione Descrizione dell'inserzionista × Le offerte che compaiono in questa tabella provengono da società di persone da cui Investopedia riceve un compenso.

Termini correlati

Esempio Un campione è una versione più piccola e gestibile di un gruppo più grande. I campioni vengono utilizzati nei test statistici quando le dimensioni della popolazione sono troppo grandi. altro Come funzionano i campioni casuali semplici Un campione casuale semplice è un sottoinsieme di una popolazione statistica in cui ciascun membro del sottoinsieme ha la stessa probabilità di essere scelto. Un semplice campione casuale deve essere una rappresentazione imparziale di un gruppo. più campione rappresentativo viene spesso utilizzato per estrapolare un sentimento più ampio Un campione rappresentativo è un sottoinsieme di una popolazione che riflette le caratteristiche dell'intera popolazione. altro I dettagli del campionamento sistematico Il campionamento sistematico è un metodo di campionamento probabilistico in cui viene selezionato un campione casuale da una popolazione più ampia. altro Definizione del campionamento Il campionamento è un processo utilizzato nell'analisi statistica in cui un gruppo di osservazioni viene estratto da una popolazione più ampia. più T-Test Definizione Un t-test è un tipo di statistica inferenziale utilizzata per determinare se esiste una differenza significativa tra le medie di due gruppi, che può essere correlata in alcune caratteristiche. più collegamenti dei partner
Raccomandato
Lascia Il Tuo Commento