Saturday 7 October 2017

Autocorrelazione Function Mobile Media Processo


2.1 modello a media mobile (MA) modelli modelli di serie tempo noti come modelli ARIMA possono includere termini autoregressivi eo movimento termini medi. In settimana 1, abbiamo imparato un termine autoregressivo in un modello di serie temporale per la variabile x t è un valore ritardato di x t. Per esempio, un ritardo 1 termine autoregressivo è x t-1 (moltiplicato per un coefficiente). Questa lezione definisce lo spostamento termini medi. Un termine media mobile in un modello di serie storica è un errore di passato (moltiplicata per un coefficiente). Sia (wt Overset N (0, sigma2w)), il che significa che la w t sono identicamente, indipendentemente distribuite, ciascuna con una distribuzione normale con media 0 e la stessa varianza. Il modello a media mobile 1 ° ordine, indicato con MA (1) è (xt mu peso theta1w) L'ordine di 2 ° modello a media mobile, indicato con MA (2) è (mu XT peso theta1w theta2w) La q ° ordine modello a media mobile , indicato con MA (q) è (MU XT WT theta1w theta2w punti thetaqw) Nota. Molti libri di testo e programmi software definiscono il modello con segni negativi prima dei termini. Ciò non modificare le proprietà teoriche generali del modello, anche se non capovolgere i segni algebrici di valori dei coefficienti stimati ei termini (unsquared) nelle formule per ACFS e varianze. È necessario controllare il software per verificare se vi siano segni negativi o positivi sono stati utilizzati al fine di scrivere correttamente il modello stimato. R utilizza segnali positivi nel suo modello di base, come facciamo qui. Proprietà teoriche di una serie storica con un MA (1) Modello nota che l'unico valore diverso da zero nella ACF teorico è di lag 1. Tutti gli altri autocorrelazioni sono 0. Quindi un ACF campione con un autocorrelazione significativa solo in ritardo 1 è un indicatore di un possibile MA (1) modello. Per gli studenti interessati, prove di queste proprietà sono in appendice a questo volantino. Esempio 1 Supponiamo che un MA (1) modello è x t 10 w t 0,7 w t-1. dove (WT overset N (0,1)). Così il coefficiente 1 0.7. L'ACF teorica è data da una trama di questa ACF segue. La trama appena mostrato è l'ACF teorico per un MA (1) con 1 0.7. In pratica, un campione abituato di solito forniscono un modello così chiara. Utilizzando R, abbiamo simulato n 100 valori di esempio utilizzando il modello x t 10 w t 0,7 w t-1 dove w t IID N (0,1). Per questa simulazione, un appezzamento serie storica dei dati di esempio segue. Non possiamo dire molto da questa trama. L'ACF campione per i dati simulati segue. Vediamo un picco in ritardo 1 seguito da valori generalmente non significativi per ritardi passato 1. Si noti che il campione ACF non corrisponde al modello teorico della MA sottostante (1), vale a dire che tutte le autocorrelazioni per i ritardi del passato 1 saranno 0 . un campione diverso avrebbe un po 'diverso ACF esempio riportato di seguito, ma probabilmente hanno le stesse caratteristiche generali. Theroretical proprietà di una serie storica con un modello MA (2) Per la (2) il modello MA, proprietà teoriche sono i seguenti: Si noti che gli unici valori diversi da zero nel ACF teorica sono per ritardi 1 e 2. Autocorrelazioni per ritardi superiori sono 0 . Così, un ACF campione con autocorrelazioni significativi a ritardi 1 e 2, ma autocorrelazioni non significative per ritardi più elevato indica una possibile mA (2) modello. iid N (0,1). I coefficienti sono 1 0,5 e 2 0.3. Poiché si tratta di un MA (2), l'ACF teorica avrà valori diversi da zero solo in caso di ritardi 1 e 2. I valori delle due autocorrelazioni diversi da zero sono un grafico della ACF teorica segue. è come quasi sempre accade, i dati di esempio solito si comportano abbastanza così perfettamente come teoria. Abbiamo simulato n 150 valori di esempio per il modello x t 10 w t 0,5 w t-1 .3 w t-2. dove w t iid N (0,1). La trama serie storica dei dati segue. Come con la trama serie per la MA (1) i dati di esempio, non puoi dire molto da esso. L'ACF campione per i dati simulati segue. Il modello è tipico per le situazioni in cui un modello MA (2) può essere utile. Ci sono due picchi statisticamente significative a ritardi 1 e 2 seguiti da valori non significativi per altri ritardi. Si noti che a causa di errore di campionamento, l'ACF campione non corrisponde al modello teorico esattamente. ACF per General MA (q) Models Una proprietà di modelli MA (q), in generale, è che ci sono autocorrelazioni diversi da zero per i primi ritardi Q e autocorrelazioni 0 per tutti i GAL gt q. Non unicità di collegamento tra i valori di 1 e (rho1) in MA (1) Modello. Nella (1) Modello MA, per qualsiasi valore di 1. il reciproco 1 1 dà lo stesso valore per esempio, utilizzare 0,5 per 1. e quindi utilizzare 1 (0,5) 2 per 1. Youll ottenere (rho1) 0,4 in entrambi i casi. Per soddisfare una limitazione teorica chiamato invertibilità. abbiamo limitare MA (1) modelli di avere valori con valore assoluto inferiore 1. Nell'esempio appena dato, 1 0.5 sarà un valore di parametro ammissibile, che non sarà 1 10.5 2. Invertibilità dei modelli MA Un modello MA si dice che sia invertibile se è algebricamente equivalente a un modello AR ordine infinito convergenti. Facendo convergere, si intende che i coefficienti AR diminuiscono a 0 mentre ci muoviamo indietro nel tempo. Invertibilità è una limitazione programmata nel software di serie storiche utilizzate per stimare i coefficienti dei modelli con i termini MA. La sua non è una cosa che controlliamo per l'analisi dei dati. Ulteriori informazioni sul restrizione invertibilit'a per MA (1) modelli è riportato in appendice. Avanzate teoria Note. Per un modello MA (q) con un determinato ACF, vi è un solo modello invertibile. La condizione necessaria per invertibilità è che i coefficienti hanno valori tali che l'equazione 1- 1 y-. - Q q y 0 ha soluzioni per y che non rientrano nel cerchio unitario. R Codice per gli esempi in Esempio 1, abbiamo tracciato l'ACF teorica del modello x t 10 w t. 7W t-1. e poi simulato n 150 valori di questo modello e tracciato le serie temporali del campione e l'ACF campione per i dati simulati. I comandi R utilizzati per tracciare la ACF teoriche sono state: acfma1ARMAacf (Mac (0,7), lag. max10) 10 ritardi di ACF per MA (1) con theta1 0,7 lags0: 10 crea una variabile denominata ritardi che va da 0 a 10. trama (ritardi, acfma1, xlimc (1,10), ylabr, typeh, principale ACF per MA (1) con theta1 0,7) abline (H0) aggiunge un asse orizzontale per la trama il primo comando determina l'ACF e lo memorizza in un oggetto chiamato acfma1 (la nostra scelta del nome). Il comando plot (il 3 ° comando) trame in ritardo rispetto ai valori ACF per ritardi da 1 a 10. Il parametro ylab Contrassegni l'asse Y e il parametro principale mette un titolo sul terreno. Per visualizzare i valori numerici della ACF è sufficiente utilizzare il comando acfma1. La simulazione e le trame sono state fatte con i seguenti comandi. xcarima. sim (N150, elenco (Mac (0,7))) Simula n 150 valori da MA (1) xxc10 aggiunge 10 per rendere medi default 10. simulazione a significare 0. plot (x, TypeB, mainSimulated MA (1) i dati) ACF (x, xlimc (1,10), mainACF per dati campione simulati) nell'Esempio 2, abbiamo tracciato l'ACF teorica del modello xt 10 wt .5 w t-1 .3 w t-2. e poi simulato n 150 valori di questo modello e tracciato le serie temporali del campione e l'ACF campione per i dati simulati. I comandi R utilizzati sono stati acfma2ARMAacf (Mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (ritardi, acfma2, xlimc (1,10), ylabr, typeh, principale ACF per MA (2) con theta1 0.5, theta20.3) abline (H0) xcarima. sim (N150, l'elenco (Mac (0,5, 0,3))) xxc10 plot (x, TypeB, principale simulato MA (2) Serie) ACF (x, xlimc (1,10), mainACF per simulato MA (2) dati) Appendice: prova di proprietà di MA (1) per gli studenti interessati, qui ci sono prove per le proprietà teoriche del (1) modello MA. Varianza: (testo (xt) testo (mu peso theta1 w) 0 di testo (in peso) di testo (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Quando h 1, l'espressione precedente 1 w 2. Per ogni h 2, l'espressione precedente 0 . il motivo è che, per definizione di indipendenza della wt. E (w k w j) 0 per ogni k j. Inoltre, perché la w t hanno media 0, E (w j w j) E (w j 2) w 2. Per una serie temporale, applicare questo risultato per ottenere l'ACF cui sopra. Un modello MA invertibile è uno che può essere scritta come modello AR ordine infinito che converge in modo che i coefficienti AR convergono a 0, mentre ci muoviamo infinitamente indietro nel tempo. Bene dimostrare invertibilità per la (1) Modello MA. Abbiamo poi sostituto relazione (2) per w t-1 nell'equazione (1) (3) (ZT WT theta1 (z - theta1w) peso theta1z - theta2w) Al tempo t-2. l'equazione (2) diventa Abbiamo poi rapporto sostituto (4) per w t-2 nell'equazione (3) (ZT peso theta1 z - theta21w WT theta1z - theta21 (z - theta1w) WT theta1z - theta12z theta31w) Se dovessimo continuare a ( infinitamente), otterremmo il modello AR ordine infinito (ZT peso theta1 z - theta21z theta31z - theta41z punti) Nota però, che se 1 1, i coefficienti moltiplicando i ritardi di z aumenterà (infinitamente) in termini di dimensioni, come ci muoviamo nel tempo. Per evitare questo, abbiamo bisogno di 1 LT1. Questa è la condizione per un MA (1) Modello invertibile. Infinite Modello di ordine MA In settimana 3, e vedere che un AR (1) modello può essere convertito in un modello di ordine MA infinite: (xt - mu peso phi1w phi21w punti phik1 w punti riassumono phij1w) Questa somma dei termini di rumore bianco del passato è conosciuto come la rappresentazione causale di un AR (1). In altre parole, x t è un tipo speciale di MA con un numero infinito di termini che vanno indietro nel tempo. Questo è chiamato un ordine infinito MA o MA (). Un ordine MA finito è un AR ordine infinito ed ogni AR ordine finito è un ordine MA infinita. Ricordiamo a settimana 1, abbiamo notato che un requisito per un AR fisso (1) è che 1 LT1. Consente di calcolare il Var (x t) utilizzando la rappresentazione causale. Questo ultimo passo utilizza un fatto di base sulla serie geometrica che richiede (phi1lt1) altrimenti i diverge serie. NavigationAutocorrelation di Moving Average processo Questo esempio mostra come introdurre autocorrelazione in un processo di rumore bianco per il filtraggio. Quando introduciamo autocorrelazione in un segnale casuale, manipoliamo il suo contenuto in frequenza. Un filtro a media mobile attenua le componenti ad alta frequenza del segnale, efficace lisciandolo. Creare la risposta all'impulso di un punto mobile di 3 filtro a media. Filtro di N (0,1) sequenza di rumore bianco con il filtro. Impostare il generatore di numeri casuali per le impostazioni predefinite per risultati riproducibili. Ottenere l'autocorrelazione campione viziato fuori per 20 GAL. Tracciare la autocorrelazione campione insieme con l'autocorrelazione teorica. L'autocorrelazione campione cattura la forma generale della autocorrelazione teorica, anche se le due sequenze non concordano in dettaglio. In questo caso, è chiaro che il filtro ha introdotto significativa autocorrelazione solo su ritardi -2,2. Il valore assoluto della sequenza decade rapidamente a zero al di fuori di tale intervallo. Per vedere che il contenuto in frequenza è stata colpita, la trama Welch stima delle densità spettrale di potenza dei segnali originali e filtrati. Il rumore bianco è stato colorato dal filtro media mobile. MATLAB e Simulink sono marchi registrati di The MathWorks, Inc. Si prega di consultare mathworkstrademarks per un elenco di altri marchi registrati di proprietà di The MathWorks, Inc. Altri nomi di prodotti o marchi sono marchi o marchi registrati dei rispettivi proprietari. Seleziona il tuo CountryPurpose: Vedi Casualità trame autocorrelazione (. Box e Jenkins, pp 28-32) sono uno strumento comunemente usato per il controllo di casualità in un insieme di dati. Questa casualità è accertato calcolando autocorrelazioni per i valori dei dati in tempo variabile ritardi. Se a caso, tali autocorrelazioni dovrebbe essere vicino allo zero per ogni e tutte le separazioni time-lag. Se non casuale, allora una o più delle autocorrelazioni sarà significativamente diverso da zero. Inoltre, i grafici di autocorrelazione sono utilizzati nella fase di identificazione del modello di Box-Jenkins autoregressiva, spostando modelli di serie temporali media. Autocorrelazione è solo una misura di casualità Si noti che non correlate non significa necessariamente casuale. I dati che ha una significativa autocorrelazione non è casuale. Tuttavia, i dati che non mostrano significative autocorrelazione può ancora esibire non casualità in altri modi. Autocorrelazione è solo una misura di casualità. Nel contesto di validazione del modello (che è il principale tipo di casualità si dicuss nel manuale), controllando autocorrelazione è tipicamente una prova sufficiente di casualità poiché i residui di povera modelli raccordo tendono a mostrare casualità non-sottile. Tuttavia, alcune applicazioni richiedono una più rigorosa determinazione di casualità. In questi casi, una batteria di test, che può includere il controllo di autocorrelazione, vengono applicate poiché i dati possono essere non casuale in molti modi diversi e spesso sottili. Un esempio di cui è necessario un controllo più rigoroso per la casualità sarebbe in fase di test generatori di numeri casuali. Esempio Trama: Autocorrelazioni dovrebbe essere vicino allo zero per casualità. Tale non è il caso in questo esempio e quindi l'assunzione casualità fallisce Questo grafico di esempio autocorrelazione mostra che la serie temporale non è casuale, ma ha un alto grado di autocorrelazione tra osservazioni adiacenti e nel vicino adiacenti. Definizione: R (h) contro H trame autocorrelazione sono formate da asse verticale: coefficiente di autocorrelazione dove C h è la funzione autocovarianza e C 0 è la funzione di varianza nota che R h è compreso tra -1 e 1. Si noti che alcune fonti possono utilizzare il seguente formula per la funzione autocovarianza Anche se questa definizione è meno bias, il (1 N) formulazione ha alcune proprietà statistiche desiderabili ed è la forma più comunemente usata in letteratura statistiche. Vedere le pagine 20 e 49-50 a Chatfield per i dettagli. ad asse orizzontale: Tempo di ritardo h (h 1, 2, 3) La linea di cui sopra contiene anche diverse linee di riferimento orizzontali. La linea mediana è a zero. Le altre quattro linee sono 95 e 99 bande di confidenza. Si noti che ci sono due formule distinte per generare le bande di confidenza. Se la trama autocorrelazione viene utilizzato per testare la casualità (cioè non vi è alcuna dipendenza dal tempo nei dati), si raccomanda la seguente formula: dove N è la dimensione del campione, z è la funzione di distribuzione cumulativa della distribuzione normale standard (alpha ) è il livello di significatività. In questo caso, le bande di confidenza hanno larghezza fissa che dipende dalle dimensioni del campione. Questa è la formula utilizzata per generare le bande di confidenza nella trama precedente. trame di autocorrelazione sono utilizzati anche nella fase di identificazione del modello per il montaggio modelli ARIMA. In questo caso, un modello di media mobile è assunto per i dati e le seguenti bande di confidenza deve essere generato: dove k è il ritardo, N è la dimensione del campione, z è la funzione di distribuzione cumulativa della distribuzione normale standard e (alfa) è il livello di significatività. In questo caso, le bande di confidenza aumentano all'aumentare lag. La trama di autocorrelazione in grado di fornire risposte alle seguenti domande: I dati casuali è un'osservazione relativa a una osservazione adiacente è un'osservazione relativa a una osservazione due volte rimosso (etc.) è il rumore bianco serie storica osservata è la serie storica osservata sinusoidale è la serie autoregressivo tempo osservato cosa è un modello appropriato per la serie storica osservata è il modello valido e sufficiente è la formula s ssqrt Importanza valida: Garantire la validità delle conclusioni ingegneria casualità (insieme con il modello fisso, la variazione fisso, e distribuzione fisso) è uno dei quattro presupposti che sottendono tipicamente tutti i processi di misurazione. L'ipotesi casualità è di fondamentale importanza per le seguenti tre ragioni: La maggior parte dei test statistici standard dipendono dalla casualità. La validità delle conclusioni del test è direttamente collegata alla validità dell'assunzione casualità. Molte formule statistiche comunemente utilizzate dipendono dalla assunzione casualità, la formula più comune è la formula per determinare la deviazione standard della media campionaria: dove s è la deviazione standard dei dati. Anche se molto utilizzato, i risultati di utilizzare questa formula sono di alcun valore a meno che l'assunzione casualità detiene. Per i dati univariati, il modello predefinito è Se i dati non sono casuali, questo modello non è corretto e valido, e le stime per i parametri (come la costante) diventano senza senso e non validi. In breve, se l'analista non controlla per casualità, allora la validità di molte delle conclusioni statistiche diventa sospetto. La trama di autocorrelazione è un modo eccellente di controllo per tale randomness.2.2 parziale di autocorrelazione Function (PACF) Versione stampabile In generale, una correlazione parziale è una correlazione condizionale. E 'la correlazione tra due variabili in base al presupposto che noi conosciamo e prendiamo in considerazione i valori di qualche altro insieme di variabili. Per esempio, prendere in considerazione un contesto di regressione in cui variabile di risposta y e x 1. x 2. e x 3 sono variabili predittive. La correlazione parziale tra Y e X 3 è la correlazione tra le variabili determinato tenendo conto di come sia y ed x 3 sono legati alla x 1 e x 2. Nella regressione, questa correlazione parziale potrebbe essere trovato correlando i residui da due diverse regressioni: (1) Regressione in cui y prevedere da x 1 e x 2. (2) regressione in cui si prevedono x 3 da x 1 e x 2. In sostanza, abbiamo correlare le parti di Y e X 3 che non sono previsto da x 1 e x 2. Più formalmente, possiamo definire la correlazione parziale appena descritta come Si noti che questo è anche il modo vengono interpretati i parametri di un modello di regressione. Pensate alla differenza tra l'interpretazione dei modelli di regressione: y (beta0 beta1x2 testo y beta0beta1xbeta2x2) nel primo modello, 1 può essere interpretato come la dipendenza lineare tra 2 x ed y. Nel secondo modello, 2 verrebbe interpretato come la dipendenza lineare tra x 2 e Y, con la dipendenza tra xey già contabilizzato. Per una serie temporale, l'autocorrelazione parziale tra x t x t-h è definita come la correlazione condizionale tra x t x t-h. subordinata x t-H1. x t-1. l'insieme di osservazioni che vengono tra punti di tempo t e th. L'autocorrelazione parziale 1 ° ordine sarà definito in modo da eguagliare il 1 ° ordine di autocorrelazione. Il 2 ° ordine (lag) autocorrelazione parziale è Questa è la correlazione tra i valori di due periodi di tempo a parte subordinata conoscenza del valore in mezzo. (A proposito, le due variazioni nel denominatore sarà uguale a vicenda in una serie stazionaria.) Il 3 ° ordine (lag) autocorrelazione parziale è E, così via, per qualsiasi ritardo. Tipicamente, manipolazioni matrice hanno a che fare con la matrice di covarianza di una distribuzione multivariata sono utilizzati per determinare le stime delle autocorrelazioni parziali. Alcuni elementi utili in merito PACF e ACF modelli di identificazione di un modello AR è spesso fatto meglio con il PACF. Per un modello di AR, il PACF teorica si spegne oltre la fine del modello. La frase si spegne significa che, in teoria, le autocorrelazioni parziali sono pari a 0 al di là di quel punto. In altre parole, il numero di autocorrelazioni parziali non nulli dà l'ordine del modello AR. Con l'ordine del modello intendiamo la più estrema ritardo di x che è usato come predittore. Esempio . Nella lezione 1.2, abbiamo identificato un (1) Modello AR per una serie temporale di numeri annuali dei terremoti in tutto il mondo con una magnitudo maggiore di 7.0 sismico. In seguito è la PACF campione per questa serie. Si noti che il primo valore di ritardo è statisticamente significativa, mentre autocorrelazioni parziali per tutti gli altri sfasamenti non sono statisticamente significativi. Questo suggerisce un possibile AR (1) modello per questi dati. L'identificazione di un modello MA è spesso fatto meglio con l'ACF piuttosto che il PACF. Per un modello MA, il PACF teorica non si spegne, ma si assottiglia verso 0 in qualche modo. Un modello più chiara per un modello MA è in ACF. L'ACF avrà autocorrelazioni diversi da zero solo in caso di ritardi coinvolti nel modello. Lezione 2.1 incluso il seguente ACF esempio per un MA (1) Serie simulato. Si noti che la prima autocorrelazione lag è statisticamente significativa, mentre tutte le autocorrelazioni successivi non sono. Questo suggerisce un possibile MA (1) modello per i dati. nota Theory. Il modello utilizzato per la simulazione era x t 10 w t 0,7 w t-1. In teoria, il 1 primo ritardo di autocorrelazione (1 1 2) .7 (1,7 2) 0,4698 e autocorrelazioni per tutti gli altri GAL 0. Il modello di base utilizzati per il MA (1) Simulazione nella Lezione 2.1 è stato xt 10 in peso di 0,7 w t -1. Di seguito è riportato il PACF teorica (autocorrelazione parziale) per quel modello. Si noti che il modello si assottiglia gradualmente alla nota 0. R: Il PACF appena mostrato è stato creato in R con questi due comandi: ma1pacf ARMAacf (Ma c (0,7), lag. max 36, pacfTRUE) plot (ma1pacf, typeh, principale teorico PACF di MA (1) con theta 0,7) navigazione

No comments:

Post a Comment