Principale » negoziazione algoritmica » Regressione lineare multipla - Definizione MLR

Regressione lineare multipla - Definizione MLR

Che cos'è la regressione lineare multipla - MLR?

La regressione lineare multipla (MLR), nota anche semplicemente come regressione multipla, è una tecnica statistica che utilizza diverse variabili esplicative per prevedere l'esito di una variabile di risposta. L'obiettivo della regressione lineare multipla (MLR) è quello di modellare la relazione lineare tra le variabili esplicative (indipendenti) e la variabile di risposta (dipendente).

In sostanza, la regressione multipla è l'estensione della regressione dei minimi quadrati ordinari che coinvolge più di una variabile esplicativa.

La formula per la regressione lineare multipla è

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵwhere, per i = n osservazioni: yi = variabile dipendentexi = variabili espanatorieβ0 = intercetta y (termine costante) βp = coefficienti di pendenza per ciascuna variabile esplicativaϵ = termine di errore del modello (noti anche come residui) \ begin {align} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {dove, per} i = n \ textbf {osservazioni:} \\ & y_i = \ text {variabile dipendente} \\ & x_i = \ text {variabili espanatorie} \\ & \ beta_0 = \ text {intercetta y (costante termine)} \\ & \ beta_p = \ text {coefficienti di pendenza per ciascuna variabile esplicativa} \\ & \ epsilon = \ text {termine di errore del modello (noto anche come residuo)} \\ \ end {allineato} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵwhere, per osservazioni i = n: yi = variabile dipendentexi = variabili espanatorieβ0 = intercetta y (termine costante) βp = Coefficienti di pendenza per ciascuna variabile esplicativaϵ = termine di errore del modello (noto anche come residuo)

Spiegazione della regressione lineare multipla

Una semplice regressione lineare è una funzione che consente a un analista o statistico di fare previsioni su una variabile in base alle informazioni note su un'altra variabile. La regressione lineare può essere utilizzata solo quando si hanno due variabili continue: una variabile indipendente e una variabile dipendente. La variabile indipendente è il parametro utilizzato per calcolare la variabile o il risultato dipendenti. Un modello di regressione multipla si estende a diverse variabili esplicative.

Il modello di regressione multipla si basa sui seguenti presupposti:

Esiste una relazione lineare tra le variabili dipendenti e le variabili indipendenti.
Le variabili indipendenti non sono troppo correlate tra loro.
Sì, le osservazioni sono selezionate in modo indipendente e casuale dalla popolazione.
I residui dovrebbero essere normalmente distribuiti con una media di 0 e varianza σ.

Il coefficiente di determinazione (R-quadrato) è una metrica statistica che viene utilizzata per misurare quanta parte della variazione del risultato può essere spiegata dalla variazione delle variabili indipendenti. R ² aumenta sempre quando vengono aggiunti più predittori al modello MLR anche se i predittori potrebbero non essere correlati alla variabile di risultato.

R ² da solo non può quindi essere utilizzato per identificare quali predittori dovrebbero essere inclusi in un modello e quali dovrebbero essere esclusi. R ² può essere solo tra 0 e 1, dove 0 indica che il risultato non può essere previsto da nessuna delle variabili indipendenti e 1 indica che il risultato può essere previsto senza errori dalle variabili indipendenti.

Quando si interpretano i risultati di una regressione multipla, i coefficienti beta sono validi mantenendo costanti tutte le altre variabili ("tutti gli altri uguali"). L'output di una regressione multipla può essere visualizzato orizzontalmente come un'equazione o verticalmente sotto forma di tabella.

Esempio di utilizzo della regressione lineare multipla

Ad esempio, un analista potrebbe voler sapere come il movimento del mercato influisce sul prezzo di Exxon Mobil (XOM). In questo caso, la sua equazione lineare avrà il valore dell'indice S&P 500 come variabile indipendente o predittore e il prezzo di XOM come variabile dipendente.

In realtà, ci sono molti fattori che predicono il risultato di un evento. Il movimento dei prezzi di Exxon Mobil, ad esempio, dipende da qualcosa di più della semplice performance del mercato globale. Altri predittori come il prezzo del petrolio, i tassi di interesse e il movimento dei prezzi dei future sul petrolio possono influenzare il prezzo di XOM e i prezzi delle azioni di altre compagnie petrolifere. Per comprendere una relazione in cui sono presenti più di due variabili, viene utilizzata una regressione lineare multipla.

La regressione lineare multipla (MLR) viene utilizzata per determinare una relazione matematica tra un numero di variabili casuali. In altri termini, MLR esamina come più variabili indipendenti sono correlate a una variabile dipendente. Una volta determinato ciascuno dei fattori indipendenti per prevedere la variabile dipendente, le informazioni sulle variabili multiple possono essere utilizzate per creare una previsione accurata sul livello di effetto che hanno sulla variabile di risultato. Il modello crea una relazione sotto forma di una linea retta (lineare) che approssima meglio tutti i singoli punti dati.

Facendo riferimento all'equazione MLR sopra, nel nostro esempio:

y _i = variabile dipendente: prezzo di XOM
x _i1 = tassi di interesse
x _i2 = prezzo del petrolio
x _i3 = valore dell'indice S&P 500
x _i4 = prezzo dei futures sul petrolio
B ₀ = intercetta y al tempo zero
B ₁ = coefficiente di regressione che misura una variazione unitaria nella variabile dipendente quando x _i1 cambia - la variazione del prezzo XOM quando cambiano i tassi di interesse
B ₂ = valore del coefficiente che misura una variazione unitaria nella variabile dipendente quando x _i2 cambia - la variazione del prezzo XOM quando cambiano i prezzi del petrolio

Le stime dei minimi quadrati, B ₀, B ₁, B ₂ ... B _p, sono solitamente calcolate da software statistico. Come molte variabili possono essere incluse nel modello di regressione in cui ogni variabile indipendente è differenziata con un numero — 1, 2, 3, 4 ... p. Il modello di regressione multipla consente a un analista di prevedere un risultato in base alle informazioni fornite su più variabili esplicative.

Tuttavia, il modello non è sempre perfettamente accurato in quanto ogni punto dati può differire leggermente dal risultato previsto dal modello. Il valore residuo, E, che è la differenza tra il risultato effettivo e il risultato previsto, è incluso nel modello per tenere conto di tali lievi variazioni.

Supponendo che eseguiamo il nostro modello di regressione dei prezzi XOM attraverso un software di calcolo delle statistiche, che restituisce questo risultato:

Un analista interpreterebbe questo risultato nel senso che se le altre variabili vengono mantenute costanti, il prezzo di XOM aumenterà del 7, 8% se il prezzo del petrolio nei mercati aumenterà dell'1%. Il modello mostra anche che il prezzo di XOM diminuirà dell'1, 5% a seguito di un aumento dell'1% dei tassi di interesse. R ² indica che l'86, 5% delle variazioni del prezzo delle azioni di Exxon Mobil può essere spiegato dalle variazioni del tasso di interesse, del prezzo del petrolio, dei futures sul petrolio e dell'indice S&P 500.

Key Takeaways

La regressione lineare multipla (MLR), nota anche semplicemente come regressione multipla, è una tecnica statistica che utilizza diverse variabili esplicative per prevedere l'esito di una variabile di risposta.
La regressione multipla è un'estensione della regressione lineare (OLS) che utilizza solo una variabile esplicativa.
MLR è ampiamente utilizzato in econometria e inferenza finanziaria.

La differenza tra regressione lineare e multipla

La regressione lineare (OLS) confronta la risposta di una variabile dipendente dato un cambiamento in alcune variabili esplicative. Tuttavia, è raro che una variabile dipendente sia spiegata da una sola variabile. In questo caso, un analista utilizza la regressione multipla, che tenta di spiegare una variabile dipendente utilizzando più di una variabile indipendente. Le regressioni multiple possono essere lineari e non lineari.

Le regressioni multiple si basano sul presupposto che esiste una relazione lineare tra le variabili dipendenti e indipendenti. Non presuppone inoltre una correlazione maggiore tra le variabili indipendenti.

Confronta i conti di investimento Nome del fornitore Descrizione Descrizione dell'inserzionista × Le offerte che compaiono in questa tabella provengono da società di persone da cui Investopedia riceve un compenso.

Termini correlati

Cosa misura la regressione La regressione è una misurazione statistica che tenta di determinare la forza della relazione tra una variabile dipendente (generalmente indicata da Y) e una serie di altre variabili mutevoli (note come variabili indipendenti). altro Che cos'è un termine di errore "> Un termine di errore è definito come una variabile in un modello statistico, che viene creato quando il modello non rappresenta completamente la relazione effettiva tra le variabili indipendenti e dipendenti. più Come funziona il metodo dei minimi quadrati Il metodo dei quadrati è una tecnica statistica per determinare la linea di adattamento migliore per un modello, specificata da un'equazione con determinati parametri ai dati osservati. più Econometria: cosa significa e come viene utilizzata L'econometria è l'applicazione di modelli statistici e matematici all'economia dati allo scopo di testare teorie, ipotesi e tendenze future. più R-al quadrato R-al quadrato è una misura statistica che rappresenta la proporzione della varianza per una variabile dipendente spiegata da una variabile indipendente. di più Come funziona il coefficiente di determinazione Il coefficiente di determinazione è una misura utilizzata nell'analisi statistica per valutare quanto bene un modello spiega e prevede i risultati futuri rtner Links

← Guadagni mensili indicizzati medi - AIME

Delaware Corporation →

Raccomandato

Lascia Il Tuo Commento