Principale » dirigenti d'azienda » Definizione statistica Chi Square (χ2)

Definizione statistica Chi Square (χ2)

dirigenti d'azienda : Definizione statistica Chi Square (χ2)
Che cos'è una statistica Chi Square?

A chi square ( χ 2 ) la statistica è un test che misura il modo in cui le aspettative si confrontano con i dati effettivamente osservati (o i risultati del modello). I dati utilizzati nel calcolo di una statistica chi quadrato devono essere casuali, grezzi, reciprocamente esclusivi, tratti da variabili indipendenti e ricavati da un campione sufficientemente ampio. Ad esempio, i risultati del lancio di una moneta 100 volte soddisfano questi criteri.

I test del chi quadro sono spesso utilizzati nel test delle ipotesi.

La formula per Chi Square è

χc2 = ∑ (Oi − Ei) 2 Ovunque: c = gradi di libertàO = valore / i osservato / i E = valore / i atteso / i \ inizio {allineato} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {dove:} \\ & c = \ text {gradi di libertà} \\ & O = \ text {valori osservati} \\ & E ​​= \ text {valori attesi )} \\ \ end {allineato} χc2 = ∑Ei (Oi −Ei) 2 dove: c = gradi di libertàO = valore / i osservato / i E = valore / i atteso / i

Cosa ti dice una statistica di Chi Square?

Esistono due tipi principali di test del chi quadro: il test di indipendenza, che pone una domanda di relazione, come ad esempio "Esiste una relazione tra genere e punteggi SAT?"; e il test di bontà di adattamento, che chiede qualcosa del tipo "Se una moneta viene lanciata 100 volte, verrà fuori testa 50 volte e croce 50 volte?"

Per questi test, i gradi di libertà vengono utilizzati per determinare se una determinata ipotesi nulla può essere respinta in base al numero totale di variabili e campioni all'interno dell'esperimento.

Ad esempio, quando si considerano gli studenti e la scelta del corso, una dimensione del campione di 30 o 40 studenti non è probabilmente abbastanza grande da generare dati significativi. Ottenere gli stessi risultati o simili da uno studio usando una dimensione del campione di 400 o 500 studenti è più valido.

In un altro esempio, considera di lanciare una moneta 100 volte. Il risultato atteso dal lancio di una moneta equa 100 volte è che le teste saliranno 50 volte e le code saliranno 50 volte. Il risultato reale potrebbe essere che la testa sale 45 volte e la coda sale 55 volte. La statistica del chi quadro mostra eventuali discrepanze tra i risultati attesi e quelli effettivi.

Key Takeaways

  • A chi square (χ 2 ) la statistica è un test che misura il confronto tra le aspettative e i dati effettivamente osservati.
  • Esistono due tipi principali di test del chi quadro: il test di indipendenza per i dati e i test di bontà di adattamento per un modello.
  • Questi test possono essere utilizzati per determinare se una determinata ipotesi nulla può essere respinta nel test di ipotesi.

Esempio di test Chi quadrato

Immagina che un sondaggio casuale sia stato condotto su 2000 diversi elettori, sia maschi che femmine. Le persone che hanno risposto sono state classificate in base al loro genere e indipendentemente dal fatto che fossero repubblicane, democratiche o indipendenti. Immagina una griglia con le colonne etichettate repubblicana, democratica e indipendente, e due file etichettate maschio e femmina. Supponiamo che i dati dei 2000 intervistati siano i seguenti:

RepubblicanoDemocraticoIndipendenteTotale
Maschio400300100800
Femmina5006001001200
Totale9009002002000

Il primo passo per calcolare la statistica chi quadrato è trovare le frequenze previste. Questi sono calcolati per ogni "cella" nella griglia. Poiché ci sono due categorie di genere e tre categorie di visione politica, ci sono sei frequenze totali previste. La formula per la frequenza prevista è:

E (r, c) = n (r) × c (r) nwhere: r = riga nella domanda c = colonna nella domanda n = totale corrispondente \ inizio {allineato} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {dove:} \\ & r = \ text {riga in questione} \\ & c = \ text {colonna in questione} \\ & n = \ text {totale corrispondente } \\ \ end {allineato} E (r, c) = nn (r) × c (r) dove: r = riga nella domanda c = colonna nella domanda n = totale corrispondente

In questo esempio, le frequenze previste sono:

  • E (1, 1) = (900 x 800) / 2.000 = 360
  • E (1, 2) = (900 x 800) / 2.000 = 360
  • E (1, 3) = (200 x 800) / 2.000 = 80
  • E (2, 1) = (900 x 1.200) / 2.000 = 540
  • E (2, 2) = (900 x 1.200) / 2.000 = 540
  • E (2, 3) = (200 x 1.200) / 2.000 = 120

Successivamente, vengono utilizzati i valori per calcolare la statistica chi quadrato utilizzando la seguente formula:

Chi-quadrato = ∑ [O (r, c) −E (r, c)] 2E (r, c) dove: O (r, c) = dati osservati per la riga e colonna date \ begin {allineato} & \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {dove:} \\ & O (r, c) = \ text {dati osservati per la riga e la colonna indicate} \\ \ end {allineato} Chi-quadrato = ∑E (r, c) [O (r, c) −E (r, c)] 2 dove: O (r, c) = dati osservati per la riga e la colonna specificate

In questo esempio, l'espressione per ciascun valore osservato è:

  • O (1, 1) = (400 - 360) 2/360 = 4.44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500-540) 2/540 = 2, 96
  • O (2, 2) = (600-540) 2/540 = 6, 67
  • O (2, 3) = (100-120) 2/120 = 3, 33

La statistica chi quadrato quindi equivale alla somma di questi valori, ovvero 32, 41. Possiamo quindi guardare una tabella statistica al quadrato per vedere, dati i gradi di libertà nel nostro set-up, se il risultato è statisticamente significativo o meno.

Confronta i conti di investimento Nome del fornitore Descrizione Descrizione dell'inserzionista × Le offerte che compaiono in questa tabella provengono da società di persone da cui Investopedia riceve un compenso.

Termini correlati

Definizione dei gradi di libertà I gradi di libertà si riferiscono al numero massimo di valori logicamente indipendenti, che sono valori che hanno la libertà di variare, nel campione di dati. più T-Test Definizione Un t-test è un tipo di statistica inferenziale utilizzata per determinare se esiste una differenza significativa tra le medie di due gruppi, che può essere correlata in alcune caratteristiche. altro Cosa ci dice la correlazione inversa Una correlazione inversa, nota anche come correlazione negativa, è una relazione contraria tra due variabili tali da spostarsi in direzioni opposte. altro Come funziona la deviazione standard residua La deviazione standard residua è un termine statistico usato per descrivere la differenza nelle deviazioni standard dei valori osservati rispetto ai valori previsti, come mostrato dai punti in un'analisi di regressione. altro Come funziona l'analisi della varianza (ANOVA) L'analisi della varianza (ANOVA) è uno strumento di analisi statistica che separa la variabilità totale rilevata all'interno di un insieme di dati in due componenti: fattori casuali e sistematici. altro Correlazione La correlazione è una misura statistica di come due titoli si muovono l'uno rispetto all'altro. più collegamenti dei partner
Raccomandato
Lascia Il Tuo Commento