6.2 Gleitende Mittelwerte ma 40 elecales, order 5 41 In der zweiten Spalte dieser Tabelle wird ein gleitender Durchschnitt der Ordnung 5 dargestellt, der eine Schätzung des Trendzyklus liefert. Der erste Wert in dieser Spalte ist der Durchschnitt der ersten fünf Beobachtungen (1989-1993) der zweite Wert in der 5-MA-Spalte ist der Durchschnitt der Werte 1990-1994 und so weiter. Jeder Wert in der Spalte 5-MA ist der Mittelwert der Beobachtungen in den fünf Jahren, die auf das entsprechende Jahr zentriert sind. Es gibt keine Werte für die ersten zwei Jahre oder die letzten zwei Jahre, weil wir nicht zwei Beobachtungen auf beiden Seiten haben. In der obigen Formel enthält Spalte 5-MA die Werte von Hut mit k2. Um zu sehen, wie die Trend-Schätzung aussieht, stellen wir sie zusammen mit den Originaldaten in Abbildung 6.7 dar. Grundstück 40 elecsales, HauptsacheResidential Elektrizität salesquot, ylab quotGWhquot. Xlab quotYearquot 41 Zeilen 40 ma 40 elecales, 5 41. col quotredquot 41 Beachten Sie, wie der Trend (in rot) glatter als die ursprünglichen Daten ist und erfasst die Hauptbewegung der Zeitreihe ohne alle geringfügigen Schwankungen. Die gleitende Mittelmethode erlaubt keine Abschätzungen von T, wobei t nahe den Enden der Reihe ist, so daß sich die rote Linie nicht zu den Kanten des Graphen beiderseits erstreckt. Später werden wir anspruchsvollere Methoden der Trend-Zyklus-Schätzung verwenden, die Schätzungen nahe den Endpunkten erlauben. Die Reihenfolge des gleitenden Mittelwerts bestimmt die Glätte der Tendenzschätzung. Im Allgemeinen bedeutet eine größere Ordnung eine glattere Kurve. Die folgende Grafik zeigt die Auswirkung der Veränderung der Reihenfolge des gleitenden Durchschnitts für die privaten Stromverkaufsdaten. Einfache gleitende Mittelwerte wie diese sind meist ungerade (z. B. 3, 5, 7 usw.). Das ist also symmetrisch: In einem gleitenden Durchschnitt der Ordnung m2k1 gibt es k frühere Beobachtungen, k spätere Beobachtungen und die mittlere Beobachtung Die gemittelt werden. Aber wenn m gerade war, wäre es nicht mehr symmetrisch. Gleitende Mittelwerte der gleitenden Mittelwerte Es ist möglich, einen gleitenden Durchschnitt auf einen gleitenden Durchschnitt anzuwenden. Ein Grund hierfür besteht darin, einen gleitenden Durchschnitt gleichmäßig symmetrisch zu machen. Zum Beispiel könnten wir einen gleitenden Durchschnitt der Ordnung 4 nehmen und dann einen anderen gleitenden Durchschnitt der Ordnung 2 auf die Ergebnisse anwenden. In Tabelle 6.2 wurde dies für die ersten Jahre der australischen vierteljährlichen Bierproduktionsdaten durchgeführt. Beer2 lt - fenster 40 ausbeer, start 1992 41 ma4 lt - ma 40 beer2, bestellen 4. center FALSE 41 ma2x4 lt - ma 40 beer2, bestellen 4. center TRUE 41 Die Notation 2times4-MA in der letzten Spalte bedeutet ein 4-MA Gefolgt von einem 2-MA. Die Werte in der letzten Spalte werden durch einen gleitenden Durchschnitt der Ordnung 2 der Werte in der vorhergehenden Spalte erhalten. Beispielsweise sind die ersten beiden Werte in der 4-MA-Säule 451,2 (443410420532) 4 und 448,8 (410420532433) 4. Der erste Wert in der 2 × 4-MA-Säule ist der Durchschnitt dieser beiden: 450,0 (451,2448,8) 2. Wenn ein 2-MA einem gleitenden Durchschnitt gleicher Ordnung folgt (wie z. B. 4), wird er als zentrierter gleitender Durchschnitt der Ordnung 4 bezeichnet. Dies liegt daran, daß die Ergebnisse nun symmetrisch sind. Um zu sehen, dass dies der Fall ist, können wir die 2times4-MA wie folgt schreiben: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big amp frac y frac14y frac14y frac14y frac18y. Ende Es ist jetzt ein gewichteter Durchschnitt der Beobachtungen, aber er ist symmetrisch. Andere Kombinationen von gleitenden Durchschnitten sind ebenfalls möglich. Beispielsweise wird häufig ein 3times3-MA verwendet und besteht aus einem gleitenden Durchschnitt der Ordnung 3, gefolgt von einem anderen gleitenden Durchschnitt der Ordnung 3. Im allgemeinen sollte bei einer geraden Ordnung MA eine gerade Ordnung MA folgen, um sie symmetrisch zu machen. Ähnlich sollte eine ungerade Ordnung MA eine ungerade Ordnung MA folgen. Schätzung des Trendzyklus mit saisonalen Daten Die häufigste Verwendung von zentrierten Bewegungsdurchschnitten ist die Schätzung des Trendzyklus aus saisonalen Daten. Betrachten Sie die 2times4-MA: hat frac y frac14y frac14y frac14y frac18y. Bei der Anwendung auf vierteljährliche Daten wird jedes Quartal des Jahres gleiches Gewicht gegeben, wie die ersten und letzten Bedingungen für das gleiche Quartal in aufeinander folgenden Jahren gelten. Infolgedessen wird die saisonale Veränderung ausgemittelt und die resultierenden Werte von Hut t haben wenig oder keine saisonale Veränderung übrig. Ein ähnlicher Effekt würde mit einem 2 × 8-MA oder einem 2 × 12-MA erhalten werden. Im Allgemeinen ist ein 2-mal m-MA äquivalent zu einem gewichteten gleitenden Durchschnitt der Ordnung m1, wobei alle Beobachtungen 1 m mit Ausnahme des ersten und letzten Terms, die die Gewichte 1 (2m) nehmen, nehmen. Also, wenn die saisonale Zeit ist gleichmäßig und der Ordnung m, verwenden Sie eine 2times m-MA, um den Trend-Zyklus zu schätzen. Wenn die saisonale Periode ungerade und der Ordnung m ist, verwenden Sie eine m-MA, um den Trendzyklus abzuschätzen. Insbesondere kann ein 2 × 12-MA verwendet werden, um den Trendzyklus der monatlichen Daten abzuschätzen, und ein 7-MA kann verwendet werden, um den Trendzyklus der Tagesdaten abzuschätzen. Andere Entscheidungen für die Reihenfolge der MA werden in der Regel in Trend-Zyklus Schätzungen durch die Saisonalität in den Daten kontaminiert werden. Beispiel 6.2 Herstellung elektrischer Geräte Abbildung 6.9 zeigt ein 2times12-MA, das auf den Index der elektrischen Ausrüstung angewendet wird. Beachten Sie, dass die glatte Linie keine Saisonalität zeigt, ist sie nahezu identisch mit dem in Abbildung 6.2 gezeigten Trendzyklus, der mit einer viel anspruchsvolleren Methode geschätzt wurde als die gleitenden Durchschnittswerte. Jede andere Wahl für die Reihenfolge des gleitenden Durchschnitts (mit Ausnahme von 24, 36 usw.) hätte zu einer glatten Linie geführt, die einige saisonale Schwankungen zeigt. Plot 40 elecequip, ylab quotNew Aufträge indexquot. (Euroregion) 41 Zeilen 40 ma 40 elecequip, bestellen 12 41. col quotredquot 41 Gewichtete gleitende Mittelwerte Kombinationen gleitender Mittelwerte ergeben gewichtete gleitende Mittelwerte. Zum Beispiel ist das oben diskutierte 2x4-MA äquivalent zu einem gewichteten 5-MA mit Gewichten, die durch frac, frac, frac, frac, frac gegeben werden. Im allgemeinen kann ein gewichtetes m-MA als Hut t sum k aj y geschrieben werden, wobei k (m-1) 2 und die Gewichte durch a, dots, ak gegeben sind. Es ist wichtig, daß die Gewichte alle auf eins addieren und daß sie symmetrisch sind, so daß aj a. Der einfache m-MA ist ein Spezialfall, bei dem alle Gewichte gleich 1 m sind. Ein großer Vorteil von gewichteten gleitenden Durchschnitten ist, dass sie eine glattere Schätzung des Trendzyklus ergeben. Anstelle von Beobachtungen, die die Berechnung bei Vollgewicht verlassen und verlassen, werden ihre Gewichte langsam erhöht und dann langsam verringert, was zu einer glatteren Kurve führt. Einige spezifische Sätze von Gewichten sind weit verbreitet. Einige von ihnen sind in Tabelle 6.3 angegeben. Was sind Relation und Differenz zwischen Zeitreihen und Regression für Modelle und Annahmen. Ist es richtig, dass die Regressionsmodelle Unabhängigkeit zwischen den Ausgangsvariablen für verschiedene Werte der Eingangsgröße annehmen, während das Zeitreihenmodell nicht Was sind einige andere Unterschiede Es gibt eine Reihe von Ansätzen zur Zeitreihenanalyse, aber die beiden bekanntesten sind die Regression Methode und die Box-Jenkins (1976) oder ARIMA (AutoRegressive Integrated Moving Average) Methode. Dieses Dokument führt die Regressionsmethode ein. Ich halte die Regressionsmethode weit überlegen für ARIMA für drei wichtige Gründe, die ich nicht ganz verstehen, was die Regressionsmethode für Zeitreihen auf der Website ist, und wie es sich von der Box-Jenkins oder ARIMA-Methode unterscheidet. Ich schätze, wenn jemand einige Einblicke auf diesen Fragen geben kann. Danke und Grüße Ich glaube wirklich, das ist eine gute Frage und verdient eine Antwort. Der Link zur Verfügung gestellt wird von einem Psychologen, der behauptet, dass einige home-brauen Methode ist eine bessere Art und Weise der Zeitreihe-Analyse als Box-Jenkins ist geschrieben. Ich hoffe, dass mein Versuch, eine Antwort zu ermutigen, andere, die mehr wissen über Zeitreihen sind, dazu beitragen. Aus seiner Einleitung sieht es so aus, als würde Darlington den Ansatz der Anpassung eines AR-Modells durch kleinste Quadrate meistern. Das heißt, wenn Sie das Modell zt alpha1 z cdots alphak z varepsilont an die Zeitreihe zt anpassen wollen, können Sie einfach die Serie zt auf der Serie mit Verzögerung 1, Verzögerung 2 und so weiter bis zu Verzögerung k berechnen Gewöhnlichen multiplen Regression. Dies ist sicherlich erlaubt in R, seine sogar eine Option in der Ar-Funktion. Ich testete es, und es neigt dazu, ähnliche Antworten auf die Standard-Methode für die Anpassung eines AR-Modells in R. Er befürwortet auch regressing zt auf Dinge wie t oder Befugnisse von t, um Trends zu finden. Auch dies ist absolut in Ordnung. Viele Zeitreihen besprechen dies, zum Beispiel Shumway-Stoffer und Cowpertwait-Metcalfe. Typischerweise kann eine Zeitreihenanalyse entlang der folgenden Zeilen verlaufen: Sie finden einen Trend, entfernen Sie ihn und passen Sie dann ein Modell an die Residuen an. Aber es scheint, wie er auch befürwortet über-Anpassung und dann mit der Verringerung der Mittel-quadratischen Fehler zwischen der eingebauten Serie und die Daten als Beweis dafür, dass seine Methode besser ist. Zum Beispiel: Ich fühle mich korrektrams sind jetzt veraltet. Ihr primärer Zweck war, den Arbeitnehmern zu ermöglichen, zu erraten, welche Modelle am besten zu den Daten passen, aber die Geschwindigkeit der modernen Computer (zumindest in der Regression, wenn nicht in der Zeitreihenmodell-Anpassung) ermöglicht es einem Arbeiter, einfach mehrere Modelle zu passen und genau zu sehen, wie Jeder passt, wie durch mittleren quadratischen Fehler gemessen. Die Frage der Kapitalisierung nach Zufall ist für diese Wahl nicht relevant, da beide Methoden für dieses Problem gleichermaßen anfällig sind. Dies ist keine gute Idee, weil der Test eines Modells soll, wie gut es prognostizieren kann, nicht, wie gut es passt die vorhandenen Daten. In seinen drei Beispielen verwendet er einen angepassten Mittelwertquadratfehler als Kriterium für die Qualität der Passform. Natürlich wird die Übermodellierung eines Modells eine In-Sample-Schätzung des Fehlers kleiner machen, so dass seine Behauptung, dass seine Modelle besser sind, weil sie weniger RMSE haben, falsch ist. Kurzum, da er das falsche Kriterium für die Beurteilung, wie gut ein Modell ist, verwendet, erreicht er die falschen Schlüsse über die Regression gegen ARIMA. Id wetten, dass, wenn er die prädiktive Fähigkeit der Modelle statt getestet hätte, wäre ARIMA auf die Spitze kommen. Vielleicht kann jemand es versuchen, wenn sie Zugang zu den Büchern haben, die er hier erwähnt. Ergänzend: Für mehr über die Regression Idee, möchten Sie vielleicht auschecken ältere Zeitreihen Bücher, die geschrieben wurden, bevor ARIMA wurde die beliebteste. Zum Beispiel, Kendall, Time-Series. 1973, Kapitel 11 hat ein ganzes Kapitel über diese Methode und Vergleiche mit ARIMA. Soweit ich sagen kann, hat der Autor in einer Peer-Review-Publikation seine Home-Brew-Methode nie beschrieben und Verweise auf und aus der statistischen Literatur erscheinen minimal und seine Hauptpublikationen zu methodischen Themen reichen bis in die 70er Jahre zurück. Streng genommen, nichts davon beweist alles, aber ohne genügend Zeit oder Sachkenntnis, um die Ansprüche selbst zu beurteilen, würde ich extrem widerwillig sein, irgendwelche von ihr zu verwenden. Ndash Gala Jul 18 13 bei 11:31
No comments:
Post a Comment