Correlazione spuria
Cos'è la correlazione spuriaIn statistica, una correlazione spuria, o spuria, si riferisce a una connessione tra due variabili che appare causale ma non lo è. Le relazioni spurie hanno spesso l'aspetto di una variabile che influisce su un'altra. Questa correlazione spuria è spesso causata da un terzo fattore che non è evidente al momento dell'esame, a volte chiamato fattore di confondimento.
Key Takeaways
- La correlazione spuria, o spuria, è quando due fattori appaiono casualmente correlati ma non lo sono.
- La comparsa di una relazione causale è spesso dovuta a un movimento simile su un diagramma che risulta essere una coincidenza o causato da un terzo fattore "confondente".
- La correlazione spuria può essere spesso causata da campioni di piccole dimensioni o endpoint arbitrari.
Come funziona la correlazione spuria
Quando due variabili casuali si inseguono strettamente su un grafico, è facile sospettare una correlazione o una relazione tra i due fattori, in cui una modifica influisce sull'altra. Mettendo da parte la "causalità", un altro argomento, questa osservazione può indurre il lettore del diagramma a credere che il movimento della variabile A sia collegato al movimento nella variabile B o viceversa. ma a volte, a un esame statistico più attento, i movimenti allineati sono casuali o causati da un terzo fattore che influenza i primi due. Questa è una correlazione spuria. La ricerca condotta con campioni di piccole dimensioni o endpoint arbitrari è particolarmente sensibile alla falsità.
Esempio di correlazioni spurie
Non è troppo impegnativo scoprire interessanti correlazioni. Molti si riveleranno falsi, però. Per le specie maschili di Wall Street, due popolari correlazioni spurie riguardano donne e sport. Nata negli anni '20 è la teoria della lunghezza della gonna, secondo la quale le lunghezze della gonna e la direzione del mercato azionario sono correlate. Se le lunghezze della gonna sono lunghe, ciò significa che il mercato azionario sta scendendo; se sono bassi, il mercato sta salendo. Verso la fine di gennaio si parla del cosiddetto indicatore del Super Bowl, il che suggerisce che una vittoria del team AFC probabilmente significa che il mercato azionario scenderà nel prossimo anno, mentre una vittoria del team NFC presume un aumento del mercato. Dal 1966, l'indicatore ha avuto un tasso di precisione dell'80%. È un pezzo di conversazione divertente ma probabilmente non è qualcosa che un serio consulente finanziario consiglierebbe come strategia di investimento per i clienti.
Ecco alcuni altri esempi di correlazioni spurie comuni:
- Gli annegamenti aumentano quando aumentano le vendite di gelati. Può sembrare che un aumento delle vendite di gelati causi più annegamenti, ma in realtà l'aumento del calore può far nuotare più persone, oltre a comprare più gelati.
- Il tasso di omicidi negli Stati Uniti dal 2006-2011 è sceso allo stesso ritmo dell'utilizzo di Microsoft Internet Explorer.
- I dirigenti che dicono per favore e ringraziano più spesso godono di migliori prestazioni condivise.
- Le persone che indossano l'equipaggiamento del team Oakland Raiders hanno maggiori probabilità di commettere crimini.
Come individuare le correlazioni spurie
Gli statistici e altri scienziati che analizzano i dati devono essere sempre alla ricerca di relazioni spurie. Esistono numerosi metodi che usano, tra cui:
- Garantire un campione rappresentativo adeguato.
- Ottenere una dimensione del campione adeguata.
- Diffidare di endpoint arbitrari.
- Controllando il maggior numero possibile di variabili esterne.
- Usando un'ipotesi nulla e verificando un valore p forte.