Principale » negoziazione algoritmica » Test di ipotesi in finanza: concetto ed esempi

Test di ipotesi in finanza: concetto ed esempi

negoziazione algoritmica : Test di ipotesi in finanza: concetto ed esempi

Il tuo consulente per gli investimenti ti propone un piano di investimenti con reddito mensile che promette un rendimento variabile ogni mese. Ci investirai solo se avrai la certezza di un reddito mensile medio di $ 180. Il tuo consulente ti dice anche che negli ultimi 300 mesi, il sistema ha avuto rendimenti degli investimenti con un valore medio di $ 190 e una deviazione standard di $ 75. Dovresti investire in questo schema? Il test di ipotesi viene in aiuto per tale processo decisionale.

Questo articolo presuppone la familiarità dei lettori con i concetti di una normale tabella di distribuzione, formula, valore p e basi di statistica correlate.

Che cos'è il test di ipotesi?

I test di ipotesi o significatività sono un modello matematico per testare un'affermazione, un'idea o un'ipotesi su un parametro di interesse in un determinato insieme di popolazione, usando i dati misurati in un set di campioni. I calcoli vengono eseguiti su campioni selezionati per raccogliere informazioni più decisive sulle caratteristiche dell'intera popolazione, che consente un modo sistematico di testare affermazioni o idee sull'intero set di dati.

Ecco un semplice esempio: un dirigente scolastico riferisce che gli studenti nella sua scuola ottengono in media 7 voti su 10 negli esami. Per testare questa "ipotesi", registriamo marchi di circa 30 studenti (campione) dell'intera popolazione studentesca della scuola (diciamo 300) e calcoliamo la media di quel campione. Possiamo quindi confrontare la media del campione (calcolata) con la media della popolazione (riportata) e tentare di confermare l'ipotesi.

Per fare un altro esempio, il rendimento annuo di un determinato fondo comune è dell'8%. Supponiamo che il fondo comune di investimento esiste da 20 anni. Prendiamo un campione casuale di rendimenti annuali del fondo comune per, diciamo, cinque anni (campione) e calcoliamo la sua media. Confrontiamo quindi la media del campione (calcolata) con la media della popolazione (dichiarata) per verificare l'ipotesi.

I criteri decisionali devono essere basati su determinati parametri di set di dati.

Esistono diverse metodologie per il test delle ipotesi, ma sono coinvolti gli stessi quattro passaggi di base:

Passaggio 1: definire l'ipotesi

Di solito, il valore riportato (o le statistiche del reclamo) è dichiarato come ipotesi e si presume che sia vero. Per gli esempi sopra, l'ipotesi sarà:

  • Esempio A: gli studenti nella scuola ottengono in media 7 voti su 10 negli esami.
  • Esempio B: il rendimento annuo del fondo comune è dell'8% annuo.

Questa descrizione dichiarata costituisce la " Ipotesi nulla (H 0 ) " e si presume che sia vera - il modo in cui un imputato in un processo con giuria è ritenuto innocente fino a prova contraria dalle prove presentate in tribunale. Allo stesso modo, il test delle ipotesi inizia affermando e assumendo una "ipotesi nulla", quindi il processo determina se è probabile che l'ipotesi sia vera o falsa.

Il punto importante da notare è che stiamo testando l'ipotesi nulla perché c'è un elemento di dubbio sulla sua validità. Qualsiasi informazione contraria all'ipotesi nulla dichiarata viene catturata nell'ipotesi alternativa (H 1 ). Per gli esempi sopra, l'ipotesi alternativa sarà:

  • Gli studenti segnano una media che non è uguale a 7.
  • Il rendimento annuo del fondo comune non è pari all'8% annuo.

In altre parole, l'ipotesi alternativa è una contraddizione diretta dell'ipotesi nulla.

Come in un processo, la giuria assume l'innocenza dell'imputato (ipotesi nulla). Il pubblico ministero deve dimostrare il contrario (ipotesi alternativa). Allo stesso modo, il ricercatore deve dimostrare che l'ipotesi nulla è vera o falsa. Se il pubblico ministero non prova l'ipotesi alternativa, la giuria deve lasciare andare l'imputato (basando la decisione sull'ipotesi nulla). Allo stesso modo, se il ricercatore non riesce a provare un'ipotesi alternativa (o semplicemente non fa nulla), allora si assume che l'ipotesi nulla sia vera.

Passaggio 2: impostare i criteri

I criteri decisionali devono essere basati su determinati parametri di set di dati ed è qui che entra in scena la connessione alla distribuzione normale.

Secondo il postulato statistico standard sulla distribuzione del campionamento, "Per qualsiasi dimensione del campione n, la distribuzione del campionamento di X̅ è normale se la popolazione X da cui viene prelevato il campione è normalmente distribuita". Pertanto, le probabilità di tutti gli altri possibili campioni indicano che si potrebbe selezionare sono normalmente distribuiti.

Ad esempio, determinare se il rendimento medio giornaliero, di qualsiasi titolo quotato sul mercato azionario XYZ, intorno a Capodanno è superiore al 2%.

H 0 : Ipotesi nulla: media = 2%

H 1 : Ipotesi alternativa: media> 2% (questo è ciò che vogliamo dimostrare)

Prendi il campione (diciamo di 50 stock su un totale di 500) e calcola la media del campione.

Per una distribuzione normale, il 95% dei valori si trova all'interno di due deviazioni standard della media della popolazione. Pertanto, questa normale assunzione di distribuzione e limite centrale per il set di dati di esempio ci consente di stabilire il 5% come livello di significatività. Ha senso poiché, in base a questo presupposto, esiste una probabilità inferiore al 5% (100-95) di ottenere valori anomali che vanno oltre le due deviazioni standard dalla media della popolazione. A seconda della natura dei set di dati, altri livelli di significatività possono essere presi all'1%, 5% o 10%. Per i calcoli finanziari (compresa la finanza comportamentale), il 5% è il limite generalmente accettato. Se troviamo calcoli che vanno oltre le solite due deviazioni standard, allora abbiamo un forte caso di valori anomali per rifiutare l'ipotesi nulla.

Graficamente, è rappresentato come segue:

Nell'esempio sopra, se la media del campione è molto maggiore del 2% (diciamo 3, 5%), allora rifiutiamo l'ipotesi nulla. L'ipotesi alternativa (media> 2%) è accettata, il che conferma che il rendimento giornaliero medio delle scorte è effettivamente superiore al 2%.

Tuttavia, se è probabile che la media del campione non sia significativamente superiore al 2% (e rimanga, per esempio, intorno al 2, 2%), allora NON POSSIAMO respingere l'ipotesi nulla. La sfida arriva su come decidere su casi così ravvicinati. Per trarre una conclusione da campioni e risultati selezionati, è necessario determinare un livello di significatività, che consenta di trarre una conclusione sull'ipotesi nulla. L'ipotesi alternativa consente di stabilire il livello di significatività o il concetto di "valore critico" per decidere su casi così ravvicinati.

Secondo la definizione standard del libro di testo, “Un valore critico è un valore di soglia che definisce i confini oltre i quali è possibile ottenere meno del 5% delle medie campionarie se l'ipotesi nulla è vera. Le medie del campione ottenute oltre un valore critico comporteranno la decisione di rifiutare l'ipotesi nulla. "Nell'esempio sopra, se abbiamo definito il valore critico come 2, 1% e la media calcolata arriva al 2, 2%, allora rifiutiamo l'ipotesi nulla Un valore critico stabilisce una chiara delimitazione sull'accettazione o sul rifiuto.

Passaggio 3: calcolare la statistica

Questo passaggio prevede il calcolo delle figure richieste, note come statistiche di test (come media, punteggio z, valore p, ecc.), Per il campione selezionato. (Vedremo questi in una sezione successiva.)

Passaggio 4: raggiungere una conclusione

Con i valori calcolati, decidere l'ipotesi nulla. Se la probabilità di ottenere una media campionaria è inferiore al 5%, la conclusione è di respingere l'ipotesi nulla. Altrimenti, accetta e mantieni l'ipotesi nulla.

Tipi di errori

Vi possono essere quattro possibili esiti nel processo decisionale basato su campioni, per quanto riguarda la corretta applicabilità all'intera popolazione:

Decisione di trattenere


Decisione di rifiuto


Si applica a tutta la popolazione


Corretta


scorretto

(Errore TIPO 1 - a)


Non si applica a tutta la popolazione


scorretto

(Errore TIPO 2 - b)


Corretta


I casi "corretti" sono quelli in cui le decisioni prese sui campioni sono veramente applicabili a tutta la popolazione. I casi di errori sorgono quando si decide di conservare (o rifiutare) l'ipotesi nulla in base ai calcoli del campione, ma tale decisione non si applica realmente all'intera popolazione. Questi casi costituiscono errori di tipo 1 (alfa) e di tipo 2 (beta), come indicato nella tabella sopra.

La selezione del valore critico corretto consente di eliminare gli errori alfa di tipo 1 o di limitarli a un intervallo accettabile.

Alpha indica l'errore a livello di significatività ed è determinato dal ricercatore. Per mantenere la significatività standard del 5% o il livello di confidenza per i calcoli delle probabilità, questo viene mantenuto al 5%.

Secondo i parametri e le definizioni decisionali applicabili:

  • “Questo criterio (alfa) è generalmente fissato a 0, 05 (a = 0, 05) e confrontiamo il livello alfa con il valore p. Quando la probabilità di un errore di tipo I è inferiore al 5% (p <0, 05), decidiamo di respingere l'ipotesi nulla; altrimenti, manteniamo l'ipotesi nulla ".
  • Il termine tecnico usato per questa probabilità è p-value . È definita come "la probabilità di ottenere un risultato di esempio, dato che il valore dichiarato nell'ipotesi nulla è vero. Il valore p per ottenere un risultato del campione viene confrontato con il livello di significatività ".
  • Un errore di tipo II, o errore beta, è definito come "la probabilità di mantenere erroneamente l'ipotesi nulla, quando in realtà non è applicabile all'intera popolazione".

Alcuni altri esempi dimostreranno questo e altri calcoli.

Esempio 1

Esiste un piano di investimento mensile che promette rendimenti mensili variabili. Un investitore investirà in esso solo se gli viene garantito un reddito mensile medio di $ 180. Ha un campione di resi di 300 mesi che ha una media di $ 190 e una deviazione standard di $ 75. Dovrebbe investire in questo schema ">

Risolviamo il problema. L'investitore investirà nel sistema se gli viene garantito il rendimento desiderato di $ 180.

H 0 : Ipotesi nulla: media = 180

H 1 : Ipotesi alternativa: media> 180

Metodo 1: approccio al valore critico

Identificare un valore critico X L per la media del campione, che è abbastanza grande da rifiutare l'ipotesi nulla - cioè rifiutare l'ipotesi nulla se la media del campione> = valore critico X L

P (identifica un errore alfa di tipo I) = P (rifiuta H 0 dato che H 0 è vero),

Ciò si otterrebbe quando la media del campione supera i limiti critici.

= P (dato che H 0 è vero) = alfa

Graficamente, appare come segue:

Prendendo alfa = 0, 05 (ovvero livello di significatività del 5%), Z 0, 05 = 1, 645 (dalla tabella Z o dalla tabella di distribuzione normale)

=> X L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

Poiché la media del campione (190) è maggiore del valore critico (187.12), l'ipotesi nulla viene respinta e la conclusione è che il rendimento mensile medio è effettivamente maggiore di $ 180, quindi l'investitore può considerare di investire in questo schema.

Metodo 2: utilizzo di statistiche di prova standardizzate

Si può anche usare il valore standardizzato z.

Test Statistic, Z = (media campione - media popolazione) / (std-dev / sqrt (n. Di campioni).

Quindi, la regione di rifiuto diventa la seguente:

Z = (190 - 180) / (75 / sqrt (300)) = 2.309

La nostra regione di rifiuto con un livello di significatività del 5% è Z> Z 0, 05 = 1, 645.

Poiché Z = 2.309 è maggiore di 1.645, l'ipotesi nulla può essere respinta con una conclusione analoga sopra menzionata.

Metodo 3: calcolo del valore P

Miriamo a identificare P (media campionaria> = 190, quando media = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

La tabella seguente per inferire i calcoli del valore p conclude che esistono prove confermate di rendimenti mensili medi superiori a 180:

p-value


Inferenza


meno dell'1%


Prove confermate a supporto di ipotesi alternative


tra l'1% e il 5%


Forti evidenze a supporto di ipotesi alternative


tra il 5% e il 10%


Prove deboli a supporto di ipotesi alternative


maggiore del 10%


Nessuna prova a sostegno di ipotesi alternative


Esempio 2

Un nuovo agente di cambio (XYZ) afferma che le sue commissioni di intermediazione sono inferiori a quelle del tuo attuale agente di borsa (ABC). I dati disponibili da una società di ricerca indipendente indicano che la media e lo std-dev di tutti i clienti di broker ABC sono rispettivamente di $ 18 e $ 6.

Viene prelevato un campione di 100 clienti di ABC e le commissioni di intermediazione vengono calcolate con le nuove tariffe del broker XYZ. Se la media del campione è $ 18, 75 e std-dev è lo stesso ($ 6), si può fare qualche deduzione sulla differenza nella fattura media di intermediazione tra il broker ABC e XYZ ">

H 0 : Ipotesi nulla: media = 18

H 1 : Ipotesi alternativa: media 18 (Questo è ciò che vogliamo dimostrare.)

Regione di rifiuto: Z <= - Z 2.5 e Z> = Z 2.5 (assumendo un livello di significatività del 5%, dividere 2, 5 ciascuno su entrambi i lati).

Z = (media campionaria - media) / (std-dev / sqrt (n. Di campioni))

= (18.75 - 18) / (6 / (sqrt (100)) = 1.25

Questo valore Z calcolato rientra tra i due limiti definiti da:

- Z 2, 5 = -1, 96 e Z 2, 5 = 1, 96.

Questo conclude che non ci sono prove sufficienti per dedurre che ci sia qualche differenza tra le tariffe del tuo broker esistente e il nuovo broker.

In alternativa, il valore p = P (Z1.25)

= 2 * 0, 1056 = 0, 2112 = 21, 12% che è maggiore di 0, 05 o 5%, portando alla stessa conclusione.

Graficamente, è rappresentato dal seguente:

Punti di critica per il metodo di test ipotetico:

  • Un metodo statistico basato su ipotesi
  • A rischio di errore come dettagliato in termini di errori alfa e beta
  • L'interpretazione del valore p può essere ambigua, portando a risultati confusi

La linea di fondo

Il test di ipotesi consente a un modello matematico di convalidare un reclamo o un'idea con un certo livello di confidenza. Tuttavia, come la maggior parte degli strumenti e dei modelli statistici, è limitato da alcune limitazioni. L'uso di questo modello per prendere decisioni finanziarie dovrebbe essere considerato con un occhio critico, tenendo presente tutte le dipendenze. Vale la pena esplorare anche metodi alternativi come l'inferenza bayesiana per analisi simili.

Confronta i conti di investimento Nome del fornitore Descrizione Descrizione dell'inserzionista × Le offerte che compaiono in questa tabella provengono da società di persone da cui Investopedia riceve un compenso.
Raccomandato
Lascia Il Tuo Commento