Principale » negoziazione algoritmica » Nozioni di base sulla regressione per l'analisi aziendale

Nozioni di base sulla regressione per l'analisi aziendale

Se ti sei mai chiesto in che modo due o più parti di dati si relazionano tra loro (ad es. In che modo il PIL è influenzato dalle variazioni della disoccupazione e dell'inflazione) o se hai mai avuto il tuo capo ti chiedeva di creare una previsione o di analizzare previsioni basate sulle relazioni tra variabili, quindi l'apprendimento dell'analisi di regressione varrebbe la pena.

In questo articolo, imparerai le basi della semplice regressione lineare, a volte chiamata "minimi quadrati ordinari" o regressione OLS, uno strumento comunemente usato nella previsione e nell'analisi finanziaria. Inizieremo apprendendo i principi fondamentali della regressione, imparando prima la covarianza e la correlazione, e poi passando alla costruzione e all'interpretazione di un risultato di regressione. I software aziendali più diffusi come Microsoft Excel possono eseguire per te tutti i calcoli e gli output di regressione, ma è comunque importante apprendere le meccaniche di base.

variabili

Al centro di un modello di regressione c'è la relazione tra due diverse variabili, chiamate variabili dipendenti e indipendenti. Ad esempio, supponiamo di voler prevedere le vendite per la tua azienda e di aver concluso che le vendite della tua azienda aumentano o diminuiscono a seconda delle variazioni del PIL.

Le vendite che stai prevedendo sarebbero la variabile dipendente perché il loro valore "dipende" dal valore del PIL e il PIL sarebbe la variabile indipendente. Dovresti quindi determinare la forza della relazione tra queste due variabili per prevedere le vendite. Se il PIL aumenta / diminuisce dell'1%, quanto aumenteranno o diminuiranno le tue vendite?

covarianza

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {allineato} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {allineato} Cov (x, y) = ∑N (xn −xu) (yn −yu)

La formula per calcolare la relazione tra due variabili è chiamata covarianza. Questo calcolo mostra la direzione della relazione. Se una variabile aumenta e anche l'altra variabile tende ad aumentare, la covarianza sarebbe positiva. Se una variabile sale e l'altra tende a scendere, la covarianza sarebbe negativa.

Il numero effettivo che si ottiene calcolando questo può essere difficile da interpretare perché non è standardizzato. Una covarianza di cinque, ad esempio, può essere interpretata come una relazione positiva, ma si può dire che la forza della relazione è più forte che se il numero fosse quattro o più debole che se il numero fosse sei.

Coefficiente di correlazione

Correlazione = ρxy = Covxysxsy \ begin {align} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {align} Correlazione = ρxy = sx sy Covxy

Dobbiamo standardizzare la covarianza per consentirci di interpretarla e utilizzarla meglio nelle previsioni, e il risultato è il calcolo della correlazione. Il calcolo della correlazione prende semplicemente la covarianza e la divide per il prodotto della deviazione standard delle due variabili. Ciò vincolerà la correlazione tra un valore di -1 e +1.

Una correlazione di +1 può essere interpretata per suggerire che entrambe le variabili si muovono perfettamente positivamente l'una con l'altra e un -1 implica che sono perfettamente correlate negativamente. Nel nostro esempio precedente, se la correlazione è +1 e il PIL aumenta dell'1%, le vendite aumenterebbero dell'1%. Se la correlazione è -1, un aumento dell'1% del PIL comporterebbe una diminuzione dell'1% delle vendite, esattamente l'opposto.

Equazione di regressione

Ora che sappiamo come viene calcolata la relazione relativa tra le due variabili, possiamo sviluppare un'equazione di regressione per prevedere o prevedere la variabile che desideriamo. Di seguito è la formula per una semplice regressione lineare. "Y" è il valore che stiamo cercando di prevedere, "b" è la pendenza della linea di regressione, "x" è il valore del nostro valore indipendente e "a" rappresenta l'intercetta y. L'equazione di regressione descrive semplicemente la relazione tra la variabile dipendente (y) e la variabile indipendente (x).

y = bx + a \ inizio {allineato} & y = bx + a \\ \ end {allineato} y = bx + a

L'intercetta, o "a", è il valore di y (variabile dipendente) se il valore di x (variabile indipendente) è zero, e quindi a volte viene semplicemente indicato come "costante". Quindi, se non vi fosse alcuna variazione nel PIL, la vostra azienda continuerebbe a fare delle vendite - questo valore, quando la variazione del PIL è zero, è l'intercettazione. Dai un'occhiata al grafico qui sotto per vedere una rappresentazione grafica di un'equazione di regressione. In questo grafico, ci sono solo cinque punti dati rappresentati dai cinque punti sul grafico. La regressione lineare tenta di stimare una linea che si adatta meglio ai dati (una linea di migliore adattamento) e l'equazione di quella linea risulta nell'equazione di regressione.

Figura 1: linea della migliore misura

Fonte: Investopedia

Regressioni in Excel

Ora che hai compreso alcuni dei retroscena di un'analisi di regressione, facciamo un semplice esempio usando gli strumenti di regressione di Excel. Baseremo sull'esempio precedente di provare a prevedere le vendite del prossimo anno in base alle variazioni del PIL. La tabella seguente elenca alcuni punti di dati artificiali, ma questi numeri possono essere facilmente accessibili nella vita reale.

Anno	I saldi	PIL
2014	100	1, 00%
2015	250	1, 90%
2016	275	2, 40%
2017	200	2, 60%
2018	300	2, 90%

Solo guardando la tabella, puoi vedere che ci sarà una correlazione positiva tra vendite e PIL. Entrambi tendono ad andare insieme. Utilizzando Excel, tutto ciò che devi fare è fare clic sul menu a discesa Strumenti, selezionare Analisi dei dati e da lì scegliere Regressione . La finestra popup è facile da compilare da lì; il tuo intervallo di input Y è la colonna "Vendite" e il tuo intervallo di input X è la variazione nella colonna del PIL; scegli l'intervallo di output per cui desideri visualizzare i dati sul foglio di lavoro e premi OK. Dovresti vedere qualcosa di simile a quanto indicato nella tabella seguente:

Coefficienti statistici di regressione

Multiple R	0.8292243	Intercettare	34, 58, 409 mila
Piazza R	0.687613	PIL	88, 15, 552 mila
Aggiustato Piazza R	0.583484	-	-
Errore standard	51.021807	-	-
osservazioni	5	-	-

Interpretazione

I principali risultati di cui devi preoccuparti per la semplice regressione lineare sono il R-quadrato, l'intercetta (costante) e il coefficiente beta (b) del PIL. Il numero R-quadrato in questo esempio è del 68, 7% - questo dimostra quanto bene il nostro modello preveda o preveda le vendite future, suggerendo che le variabili esplicative nel modello hanno previsto il 68, 7% della variazione nella variabile dipendente. Successivamente, abbiamo un'intercettazione di 34, 58, che ci dice che se la variazione del PIL fosse prevista pari a zero, le nostre vendite sarebbero di circa 35 unità. Infine, la beta del PIL o il coefficiente di correlazione di 88, 15 ci dice che se il PIL aumenta dell'1%, le vendite probabilmente aumenteranno di circa 88 unità.

La linea di fondo

Quindi come useresti questo semplice modello nella tua attività ">

Naturalmente, questa è solo una semplice regressione e ci sono modelli che è possibile creare che utilizzano diverse variabili indipendenti chiamate regressioni lineari multiple. Ma le regressioni lineari multiple sono più complicate e presentano diversi problemi che dovrebbero essere discussi da un altro articolo.

Confronta i conti di investimento Nome del fornitore Descrizione Descrizione dell'inserzionista × Le offerte che compaiono in questa tabella provengono da società di persone da cui Investopedia riceve un compenso.

← Flusso commerciale

Quando (e quando no) rifinanziare il mutuo →

Raccomandato

Lascia Il Tuo Commento