Saturday 4 November 2017

Moving Average Box Jenkins


Das Box-Jenkins ARMA-Modell ist eine Kombination aus den AR - und MA-Modellen (auf der vorherigen Seite beschrieben): start Xt delta phi1 X phi2 X cdots phip X A - theta1 A - theta2 A - cdots - thetaq A. Wobei die Ausdrücke in der Gleichung dieselbe Bedeutung haben wie für das AR - und MA-Modell. Kommentare zu Box-Jenkins Model Ein paar Anmerkungen zu diesem Modell. Das Box-Jenkins-Modell geht davon aus, dass die Zeitreihe stationär ist. Box und Jenkins empfiehlt, nichtstationäre Serien ein oder mehrere Male zu differenzieren, um Stationarität zu erreichen. So entsteht ein ARIMA-Modell, mit dem ich für Integrated stehe. Einige Formulierungen transformieren die Reihe, indem sie den Mittelwert der Reihe von jedem Datenpunkt subtrahieren. Dies ergibt eine Reihe mit einem Mittelwert von null. Ob Sie dies tun müssen oder nicht ist abhängig von der Software, die Sie verwenden, um das Modell zu schätzen. Box-Jenkins Modelle können erweitert werden, um saisonale autoregressive und saisonale gleitende durchschnittliche Bedingungen. Obwohl dies die Notation und die Mathematik des Modells kompliziert, sind die zugrundeliegenden Konzepte für saisonale autoregressive und saisonale gleitende Durchschnittsterme ähnlich zu den nicht-saisonalen autoregressiven und gleitenden Durchschnittstermen. Das allgemeinste Box-Jenkins-Modell umfasst Differenzoperatoren, autoregressive Terme Durchschnittliche Konditionen, saisonale Differenzenoperatoren, saisonale autoregressive Begriffe und saisonale gleitende Durchschnittskonditionen. Wie bei der Modellierung im Allgemeinen sollten jedoch nur notwendige Begriffe in das Modell aufgenommen werden. Wer sich für die mathematischen Details interessiert, kann auf Box, Jenkins und Reisel (1994) eingehen. Chatfield (1996). Oder Brockwell und Davis (2002). Stufen in Box-Jenkins Modellierung Die folgenden Bemerkungen zu den Box-Jenkins-Modellen sind zu beachten. Box-Jenkins-Modelle sind sehr flexibel aufgrund der Einbeziehung der beiden autoregressive und gleitende durchschnittliche Begriffe. Ausgehend von der dort nicht dargestellten Wold-Zerlegung kann ein stationärer Vorgang durch ein ARMA-Modell approximiert werden. In der Praxis findet man, dass die Annäherung nicht einfach sein kann. Chatfield (1996) empfiehlt Zersetzungsmethoden für Serien, in denen der Trend und die saisonalen Komponenten dominant sind. Gebrauch von guten ARIMA-Modellen erfordert in der Regel mehr Erfahrung als häufig verwendete statistische Methoden wie Regression. Ausreichend lange Serie erforderlich Typischerweise erfordert eine effektive Montage von Box-Jenkins-Modellen mindestens eine mäßig lange Serie. Chatfield (1996) empfiehlt mindestens 50 Beobachtungen. Viele andere würden mindestens 100 Beobachtungen empfehlen. Der erste Schritt bei der Entwicklung eines Box-Jenkins-Modells besteht darin, festzustellen, ob die Serie stationär ist und ob es eine signifikante Saisonalität gibt, die modelliert werden muss. Stationarität kann anhand eines Ablaufablaufplots beurteilt werden. Das Ablaufdiagramm sollte eine konstante Position und Skalierung aufweisen. Es kann auch aus einem Autokorrelationsdiagramm nachgewiesen werden. Insbesondere wird die Nichtstationarität oft durch eine Autokorrelationsdiagramm mit sehr langsamem Abfall angezeigt. Differenzierung zur Stationarität Box und Jenkins empfehlen den differenzierenden Ansatz, um Stationarität zu erreichen. Jedoch kann auch das Anpassen einer Kurve und das Subtrahieren der angepassten Werte aus den ursprünglichen Daten auch im Zusammenhang mit Box-Jenkins-Modellen verwendet werden. Bei der Modellidentifizierungsphase ist es unser Ziel, jahreszeitliche Erkennung, falls vorhanden, zu erkennen und den Auftrag für die saisonalen autoregressiven und saisonal gleitenden Durchschnittsbedingungen zu ermitteln. Für viele Serien ist die Periode bekannt und ein einzelner Saisonalitätsausdruck ist ausreichend. Zum Beispiel für monatliche Daten würden wir typischerweise entweder eine saisonale AR 12 Begriff oder eine saisonale MA 12 Begriff. Bei Box-Jenkins-Modellen wird das Modell vor der Montage nicht explizit entfernt. Stattdessen beinhalten wir die Reihenfolge der Saisonbegriffe in der Modellspezifikation zur ARIMA-Schätzsoftware. Es kann jedoch hilfreich sein, einen saisonalen Unterschied zu den Daten anzuwenden und die Autokorrelation und die partiellen Autokorrelationsdiagramme zu regenerieren. Dies kann bei der Modellidentifizierung der nicht-saisonalen Komponente des Modells helfen. In einigen Fällen kann die saisonale Differenzierung die meisten oder alle der Saisonalität Wirkung zu entfernen. Identifizieren Sie p und q Sobald die Stationarität und die Saisonalität adressiert worden sind, besteht der nächste Schritt darin, die Reihenfolge (d. h. (p) und (q)) der autoregressiven und gleitenden Durchschnittsterme zu identifizieren. Autokorrelation und partielle Autokorrelationsdiagramme Die primären Werkzeuge dafür sind das Autokorrelationsdiagramm und das partielle Autokorrelationsdiagramm. Die Stichproben-Autokorrelationsdiagramm und die Stichproben-Autokorrelationsdiagramm werden mit dem theoretischen Verhalten dieser Diagramme verglichen, wenn die Reihenfolge bekannt ist. Reihenfolge des Autoregressiven Prozesses ((p)) Speziell für ein AR (1) - Verfahren sollte die Autokorrelationsfunktion der Probe eine exponentiell abnehmende Erscheinung aufweisen. AR-Prozesse höherer Ordnung sind jedoch oft ein Gemisch aus exponentiell abnehmenden und gedämpften sinusförmigen Komponenten. Für autoregressive Prozesse höherer Ordnung muss die Stichprobenautokorrelation mit einem partiellen Autokorrelationsdiagramm ergänzt werden. Die partielle Autokorrelation eines AR ((p)) - Prozesses wird bei Verzögerung (p & sub1;) und grßer, so dass wir die partielle Autokorrelationsfunktion untersuchen, um festzustellen, ob es einen Beweis für eine Abweichung von Null gibt. Dies wird in der Regel durch das Platzieren eines 95-Konfidenzintervalls auf das partielle Autokorrelationsdiagramm der Probe bestimmt (die meisten Softwareprogramme, die Beispiel-Autokorrelationsdiagramme erzeugen, werden ebenfalls dieses Konfidenzintervall aufzeichnen). Wenn das Softwareprogramm nicht das Vertrauensband erzeugt, ist es ungefähr (pm 2sqrt), wobei (N) die Stichprobengröße bezeichnet. Ordnung des gleitenden Durchschnittsprozesses ((q)) Die Autokorrelationsfunktion eines MA ((q)) Prozesses wird bei der Verzögerung (q & sub1;) und größer größer, so dass wir die Autokorrelationsfunktion der Probe untersuchen, um zu sehen, wo sie im Wesentlichen Null wird. Wir tun dies, indem wir das 95-Konfidenzintervall für die Stichproben-Autokorrelationsfunktion auf das Stichproben-Autokorrelationsdiagramm legen. Die meisten Software, die das Autokorrelationsdiagramm erzeugen kann, kann auch dieses Vertrauensintervall erzeugen. Die partielle Autokorrelationsfunktion ist im Allgemeinen nicht hilfreich, um die Reihenfolge des gleitenden Durchschnittsprozesses zu bestimmen. Form der Autokorrelationsfunktion Die folgende Tabelle fasst zusammen, wie wir die Autokorrelationsfunktion für die Modellidentifikation verwenden. RIMA steht für Autoregressive Integrated Moving Average Modelle. Univariate (Einzelvektor) ARIMA ist eine Prognosemethode, die die zukünftigen Werte einer Serie, die vollständig auf ihrer eigenen Trägheit basiert, projiziert. Seine Hauptanwendung liegt im Bereich der kurzfristigen Prognose mit mindestens 40 historischen Datenpunkten. Es funktioniert am besten, wenn Ihre Daten eine stabile oder konsistente Muster im Laufe der Zeit mit einem Minimum an Ausreißern zeigt. Manchmal nennt man Box-Jenkins (nach den ursprünglichen Autoren), ARIMA ist in der Regel überlegen exponentielle Glättung Techniken, wenn die Daten relativ lange und die Korrelation zwischen vergangenen Beobachtungen ist stabil. Wenn die Daten kurz oder stark flüchtig sind, kann eine gewisse Glättungsmethode besser ablaufen. Wenn Sie nicht über mindestens 38 Datenpunkte verfügen, sollten Sie eine andere Methode als ARIMA betrachten. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist die Überprüfung der Stationarität. Stationarität impliziert, dass die Reihe auf einem ziemlich konstanten Niveau über Zeit bleibt. Wenn ein Trend besteht, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, dann sind Ihre Daten nicht stationär. Die Daten sollten auch eine konstante Varianz in ihren Schwankungen im Laufe der Zeit zeigen. Dies ist leicht zu sehen mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate. In einem solchen Fall werden die Höhen und Tiefen der Saisonalität im Laufe der Zeit dramatischer. Ohne dass diese Stationaritätsbedingungen erfüllt sind, können viele der mit dem Prozess verbundenen Berechnungen nicht berechnet werden. Wenn eine grafische Darstellung der Daten Nichtstationarität anzeigt, dann sollten Sie die Serie unterscheiden. Die Differenzierung ist eine hervorragende Möglichkeit, eine nichtstationäre Serie in eine stationäre zu transformieren. Dies geschieht durch Subtrahieren der Beobachtung in der aktuellen Periode von der vorherigen. Wenn diese Transformation nur einmal zu einer Reihe erfolgt, sagen Sie, dass die Daten zuerst unterschieden wurden. Dieser Prozess im Wesentlichen eliminiert den Trend, wenn Ihre Serie wächst mit einer ziemlich konstanten Rate. Wenn es mit steigender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten erneut differenzieren. Ihre Daten würden dann zweite differenziert werden. Autokorrelationen sind Zahlenwerte, die angeben, wie sich eine Datenreihe mit der Zeit auf sich bezieht. Genauer gesagt misst es, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden auseinander über die Zeit miteinander korreliert werden. Die Anzahl der Perioden wird in der Regel als Verzögerung bezeichnet. Zum Beispiel mißt eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode auseinander in der Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten, die zwei Perioden voneinander getrennt sind, über die gesamte Reihe miteinander korrelieren. Autokorrelationen können im Bereich von 1 bis -1 liegen. Ein Wert nahe 1 gibt eine hohe positive Korrelation an, während ein Wert nahe -1 impliziert eine hohe negative Korrelation. Diese Maßnahmen werden meist durch grafische Darstellungen, sogenannte Korrelagramme, ausgewertet. Ein Korrelationsdiagramm zeigt die Autokorrelationswerte für eine gegebene Reihe bei unterschiedlichen Verzögerungen. Dies wird als Autokorrelationsfunktion bezeichnet und ist bei der ARIMA-Methode sehr wichtig. Die ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion der so genannten autoregressiven und gleitenden Durchschnittsparameter zu beschreiben. Diese werden als AR-Parameter (autoregessiv) und MA-Parameter (gleitende Mittelwerte) bezeichnet. Ein AR-Modell mit nur einem Parameter kann als geschrieben werden. X (t) A (1) X (t-1) E (t) wobei X (t) Zeitreihen A (1) der autoregressive Parameter der Ordnung 1 X (t-1) (T) der Fehlerterm des Modells Dies bedeutet einfach, dass jeder gegebene Wert X (t) durch eine Funktion seines vorherigen Wertes X (t-1) plus einen unerklärlichen Zufallsfehler E (t) erklärt werden kann. Wenn der geschätzte Wert von A (1) 0,30 betrug, dann wäre der aktuelle Wert der Reihe mit 30 seines vorherigen Wertes 1 verknüpft. Natürlich könnte die Serie auf mehr als nur einen vergangenen Wert bezogen werden. Zum Beispiel ist X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dies zeigt an, dass der aktuelle Wert der Reihe eine Kombination der beiden unmittelbar vorhergehenden Werte ist, X (t-1) und X (t-2) zuzüglich eines Zufallsfehlers E (t). Unser Modell ist nun ein autoregressives Modell der Ordnung 2. Moving Average Models: Eine zweite Art von Box-Jenkins-Modell wird als gleitendes Durchschnittsmodell bezeichnet. Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept dahinter ganz anders. Bewegliche Durchschnittsparameter beziehen sich auf das, was in der Periode t stattfindet, nur auf die zufälligen Fehler, die in vergangenen Zeitperioden aufgetreten sind, dh E (t-1), E (t-2) usw. anstatt auf X (t-1), X T-2), (Xt-3) wie in den autoregressiven Ansätzen. Ein gleitendes Durchschnittsmodell mit einem MA-Begriff kann wie folgt geschrieben werden. X (t) - B (1) E (t-1) E (t) Der Begriff B (1) wird als MA der Ordnung 1 bezeichnet. Das negative Vorzeichen vor dem Parameter wird nur für Konventionen verwendet und in der Regel ausgedruckt Automatisch von den meisten Computerprogrammen. Das obige Modell sagt einfach, dass jeder gegebene Wert von X (t) direkt nur mit dem Zufallsfehler in der vorherigen Periode E (t-1) und mit dem aktuellen Fehlerterm E (t) zusammenhängt. Wie im Fall von autoregressiven Modellen können die gleitenden Durchschnittsmodelle auf übergeordnete Strukturen mit unterschiedlichen Kombinationen und gleitenden mittleren Längen erweitert werden. Die ARIMA-Methodik erlaubt es auch, Modelle zu erstellen, die sowohl autoregressive als auch gleitende Durchschnittsparameter zusammenführen. Diese Modelle werden oft als gemischte Modelle bezeichnet. Obwohl dies für eine kompliziertere Prognose-Tool macht, kann die Struktur tatsächlich simulieren die Serie besser und produzieren eine genauere Prognose. Pure Modelle implizieren, dass die Struktur nur aus AR oder MA-Parameter besteht - nicht beides. Die Modelle, die von diesem Ansatz entwickelt werden, werden in der Regel als ARIMA-Modelle bezeichnet, da sie eine Kombination aus autoregressiver (AR), Integration (I) verwenden, die sich auf den umgekehrten Prozess der Differenzierung bezieht, um die Prognose zu erzeugen. Ein ARIMA-Modell wird üblicherweise als ARIMA (p, d, q) angegeben. Dies ist die Reihenfolge der autoregressiven Komponenten (p), der Anzahl der differenzierenden Operatoren (d) und der höchsten Ordnung des gleitenden Mittelwerts. Beispielsweise bedeutet ARIMA (2,1,1), dass Sie ein autoregressives Modell zweiter Ordnung mit einer gleitenden mittleren Komponente erster Ordnung haben, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Auswahl der richtigen Spezifikation: Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation zu verwenden - i. e. Wie viele AR - und / oder MA-Parameter einzuschließen sind. Dies ist, was viel von Box-Jenkings 1976 dem Identifikationsprozeß gewidmet wurde. Es hing von der graphischen und numerischen Auswertung der Stichprobenautokorrelation und der partiellen Autokorrelationsfunktionen ab. Nun, für Ihre grundlegenden Modelle, ist die Aufgabe nicht allzu schwierig. Jeder hat Autokorrelationsfunktionen, die eine bestimmte Weise aussehen. Allerdings, wenn Sie gehen in der Komplexität, die Muster sind nicht so leicht zu erkennen. Um es schwieriger zu machen, stellen Ihre Daten nur eine Probe des zugrundeliegenden Prozesses dar. Das bedeutet, dass Stichprobenfehler (Ausreißer, Messfehler etc.) den theoretischen Identifikationsprozess verzerren können. Deshalb ist die traditionelle ARIMA-Modellierung eher eine Kunst als eine Wissenschaft.

No comments:

Post a Comment