Monday 20 November 2017

Analiza Autoregresywno Ruchome Średnie Modele Estymacja I Predykcja


Wprowadzenie do modeli nierównomiernych ARIMA. RAZDA ARIMA Procesy prognozowania Modele ARIMA są, teoretycznie, najbardziej ogólną klasą modeli prognozowania szeregów czasowych, które mogą być nieruchome, w razie potrzeby różnicując, być może w połączeniu z transformacjami nieliniowymi takie jak rejestrowanie lub deflacja w razie potrzeby Zmienna losowa, która jest szeregiem czasowym, jest stacjonarna, jeśli jej właściwości statystyczne są stałe w czasie A stacjonarne serie nie mają tendencji, jej wahania wokół jego średniej mają stałą amplitudę i poruszają się w spójny sposób tzn. krótkoterminowe wzorce czasu losowego zawsze wyglądają identycznie w sensie statystycznym. Ten ostatni warunek oznacza, że ​​jego korelacje autokorelacji z własnymi wcześniejszymi odchyleniami od średniej pozostają niezmienne w czasie lub równoważnie, że jego widmo mocy pozostaje stałe w czasie A losowo zmienna tego formularza może być postrzegana jako zwykła kombinacja sygnału i hałasu, a sygnał, jeśli jest widoczny, może być patt ern szybkiego lub powolnego przecięcia średniego lub oscylacji sinusoidalnej lub szybkiej zmiany na znaku, a także może mieć składnik sezonowy. Model ARIMA może być postrzegany jako filtr, który próbuje oddzielić sygnał od hałasu, a następnie sygnał ekstrapolowane w przyszłość w celu uzyskania prognoz. Równanie ARIMA dla serii czasów stacjonarnych jest liniowym równaniem regresji typu, w którym predykatory składają się z opóźnień zmiennej zależnej i opóźnień prognozowanych stała lub ważona suma jednej lub kilku ostatnich wartości Y i lub ważonej sumy jednej lub więcej wartości błędów. Jeśli predykatory składają się tylko z opóźnionych wartości Y, jest to czysty, autoregresywny samoregulowany model, która jest tylko specjalnym przypadkiem modelu regresji i może być wyposażona w standardowe oprogramowanie regresyjne Na przykład, autoregresywny model AR1 dla pierwszego rzędu jest prostym modelem regresji, w którym zmienna niezależna i s tylko Y z opóźnieniem o jeden okres LAG Y, 1 w Statgraphics lub YLAG1 w RegressIt Jeśli niektóre predykatory są błędami, model ARIMA nie jest modelem regresji liniowej, ponieważ nie ma sposobu na określenie błędu ostatniego okresu jako niezależna zmienna błędy muszą być obliczane okresowo, gdy model jest dopasowany do danych Z technicznego punktu widzenia, problem z wykorzystaniem opóźnionych błędów jako predykcyjnych jest taki, że przewidywania modelu nie są funkcjami liniowymi współczynniki, nawet jeśli są to liniowe funkcje poprzednich danych Więc współczynniki w modelach ARIMA, które zawierają opóźnione błędy, należy oszacować przez nieliniowe metody optymalizacyjne, a nie po prostu rozwiązać system równań. Akronim ARIMA oznacza automatyczną regresywną integrację Przenoszenie średnich opóźnień szeregów stacjonarnych w równaniu prognozowania nazywa się terminami autoregresywnymi, opóźnienia w błędach prognozują nazywane są średnie ruchome i serie czasowe, które muszą być rozróżniana stacjonarnie mówi się, że jest zintegrowaną wersją stacjonarnych modeli losowych i przypadkowych modeli, modeli autoregresji i wykładniczych modeli wygładzania są szczególnymi przypadkami modeli ARIMA. Niedemysłowy model ARIMA jest klasyfikowany jako ARIMA p, d, q model, gdzie. p jest liczbą terminów autoregresji. d jest liczbą nierównomiernych różnic potrzebnych do stacjonarności, a. q jest liczbą opóźnionych błędów prognozy w równaniu predykcyjnym. Równanie prognozowania jest skonstruowane w następujący sposób Po pierwsze, niech y oznacza dt różnicę Y, która oznacza. Zwróć uwagę, że druga różnica Y przypadku d2 nie różni się od 2 okresów temu Raczej, jest pierwszą różniczką pierwszej różnicy dyskretny analog drugiej pochodnej, tzn. lokalne przyspieszenie szeregu, a nie jego lokalny trend. Jeśli chodzi o y, to ogólne równanie prognozowania jest tutaj. Tutaj poruszają się średnie parametry s tak, że ich znaki są ujemne w eq po konwencji wprowadzonej przez Box i Jenkins Niektórzy autorzy i oprogramowanie, w tym język programowania R, definiują je tak, że mają znaki plus Gdy faktyczne liczby są podłączone do równania, nie ma niejasności, ale ważne jest, aby wiedzieć, która konwencja używanie oprogramowania podczas odczytywania danych wyjściowych Często parametry są oznaczone przez AR 1, AR 2, i MA 1, MA 2 itd. Aby zidentyfikować odpowiedni model ARIMA dla Y, rozpoczyna się od określenia kolejności różnicowania wymagających stacjonować serie i usunąć cechy brutto sezonowości, być może w połączeniu z transformacją stabilizującą wahania, taką jak rejestrowanie lub deflacja Jeśli zatrzymasz się w tym punkcie i przewidujesz, że zróżnicowane serie są stałe, masz tylko dopasowany losowy chód lub losowo model tendencji Jednak stacjonarne serie mogą wciąż mieć błędy autokorelacyjne, co sugeruje, że potrzebna jest pewna liczba terminów AR1 i / lub niektórych numerów macierzystych q1 w równaniu prognozowania. Proces wyznaczania wartości p, d i q najlepszych dla danej serii czasowej zostanie omówiony w dalszych sekcjach notatek, których łącza są u góry tej strony, ale podgląd niektórych typów niejednorodnych modeli ARIMA, które są powszechnie spotykane, jest podane poniżej. Model autouzstelacji o pierwszoplanowym poziomie 1,0,0 pierwszego rzędu, jeśli seria jest stacjonarna i autokorelowana, być może można ją przewidzieć jako wielokrotność swojej poprzedniej wartości, plus stała Równanie prognozowania w tym przypadku jest to, co jest regresowane przez siebie na pewien czas opóźnione przez jeden okres Jest to stały model ARIMA 1,0,0 Jeśli średnia Y jest równa zeru, wówczas nie będzie uwzględnione określenie stałe. Jeśli nachylenie współczynnik 1 jest dodatni i mniejszy niż 1 na wielkość musi być mniejszy niż 1 w skali, jeśli Y jest nieruchoma, model opisuje zachowanie średniego zwrotu, w którym wartość następnego okresu powinna być przewidziana 1 razy daleko od średniej ta wartość okresu Jeśli 1 jest ujemna, to przewiduje zachowanie średnie z odwróceniami oznaczeń, tzn. przewiduje również, że Y będzie poniżej średniego następnego okresu, jeśli jest powyżej średniej tego okresu. W modelu autoregresji drugiego rzędu ARIMA 2,0,0 będzie Y t-2 po prawej, a tak dalej W zależności od oznakowania i wielkości współczynników, model ARIMA 2,0,0 może opisywać system, którego średnie odwrócenie zachodzi w sinusoidalnie oscylujący sposób, podobnie jak ruch masy na sprężynie poddawanej przypadkowemu wstrząsowi. ARIMA 0,1,0 przypadkowy spacer Jeśli seria Y nie jest stacjonarna, najprostszym modelem jest model przypadkowego spaceru, który może być uważany za ograniczający przypadek model AR1, w którym współczynnik autoregresji jest równy 1, tj. seria z nieskończenie powolnym średnim odwróceniem Współczynnik predykcji dla tego modelu może być zapisany jako. gdzie stały termin to średnia zmiana między okresem, tj. długoterminowa dryft w Y Ten model może być zamontowany jako niekontrolowany model graniczny, w którym pierwsza różnica Y jest zmienną zależną Ponieważ uwzględnia ona jedynie różnicę pozaserwową i okres stały, jest on klasyfikowany jako model ARIMA 0,1,0 ze stałą Model przypadkowego chodu bez modelu model ARIMA 0,1,0 bez stałej. ARIMA 1,1,0 zróżnicowany model autoregresji pierwszego rzędu Jeśli błędy modelu losowego spaceru są autokorelowane, być może problem może zostać rozwiązany przez dodanie jednego opóźnienia zmiennej zależnej do równanie predykcji - tzn. przez regresję pierwszej różnicy Y na sobie opóźnionej przez jeden okres Spowodowałoby to poniższe równanie predykcji, które można przestawić na. Jest to model autoregresji pierwszego rzędu z jednym porządkiem nierównomiernego różnicowania i stałym określeniem - model ARIMA 1,1,0.ARIMA 0,1,1 bez stałego prostego wygładzania wykładniczego Inna strategia korygowania błędów autokorelacji w modelu losowego spaceru sugeruje prosty wykładniczy model wygładzania Przypomnijmy, że dla niektórych nieustannych szeregów czasowych np. tych, które wykazują hałaśliwą fluktuacje wokół średniej różniących się powoli, model losowego chodu nie wykonuje się, a także średnia ruchoma poprzednich wartości Innymi słowy, a nie biorąc pod uwagę najnowsze obserwacje jako prognozę następnej obserwacji , lepiej jest użyć średniej z ostatnich kilku obserwacji w celu odfiltrowania szumu i dokładniej oszacować lokalną średnią Prosty model wygładzania wykładniczego wykorzystuje wykładnikowaną ważoną średnią ruchową poprzednich wartości, aby osiągnąć ten efekt. Równanie predykcji dla prosty model wyrównywania wykładów można zapisać w formie matematycznie równoważnych, z których jedna jest tak zwana korekcją błędów, w której poprzednia prognoza jest dostosowywana w kierunku popełnionego błędu. Ponieważ e t-1 Y t - 1 - t-1 z definicji, może być przepisana jako., Co oznacza równanie ARIMA 0,1,1 - bez zachowania stałej prognozy równe 1 1 - Oznacza to, że można zmieścić prostą wykładniczą smoo rzecz biorąc, określając ją jako model ARIMA 0,1,1 bez stałej, a szacowany współczynnik MA1 odpowiada 1-minus-alfa w formule SES Przypomnijmy, że w modelu SES średni wiek danych w 1- prognozy na okres poprzedni 1 oznaczają, że będą one wykazywały tendencję do opóźnienia w trendach lub punktach zwrotnych o około 1 okresy. Wynika z tego, że średni wiek danych w prognozie 1-wyprzedzającej ARIMA 0,1,1 - stałym modelem jest 1 1 - 1 Na przykład, jeśli 1 0 8, średni wiek wynosi 5 Kiedy 1 zbliża się do 1, ARIMA 0,1,1 - bez modelu stałego staje się bardzo długoterminową średnią ruchoma, a jako że 1 podejście 0 staje się modelem losowo-chodnik bez drift. Jest to najlepszy sposób poprawienia autokorelacji dodawania terminów AR lub dodania terminów macierzystych W poprzednich dwóch omawianych modelach problem autokorelacji błędów w modelu przypadkowego spaceru został ustalony na dwa różne sposoby, dodając lagged wartości zróżnicowanych serii do równania lub dodając opóźnioną wartość foreca st error Jakie podejście jest najlepszym Zasadą w tej sytuacji, która zostanie omówiona bardziej szczegółowo później, jest pozytywna autokorelacja najlepiej jest traktowana przez dodanie terminu AR do modelu, a negatywna autokorelacja zwykle jest najlepiej traktowana przez dodając termin MA W serii czasów gospodarczych i gospodarczych, ujemna autokorelacja często pojawia się jako artefakt różnicowania Ogólnie rzecz biorąc, rozróżnienie zmniejsza dodatnią autokorelację, a nawet może powodować przejście z pozytywnej na ujemną autokorelację Więc model ARIMA 0,1,1 w które różni się terminem magisterskim, jest częściej stosowane niż model ARIMA 1,1,0.ARIMA 0,1,1 ze stałym prostym wyrównaniem wykładowym ze wzrostem Dzięki wdrożeniu modelu SES jako modelu ARIMA, rzeczywiście zyskujesz elastyczność Przede wszystkim szacowany współczynnik MA 1 może być ujemny, co odpowiada współczynnikowi wygładzania większym niż 1 w modelu SES, co zwykle nie jest dozwolone w procedurze dopasowania modelu SES Sec Jeśli masz ochotę, możesz oszacować przeciętny trend niezerowy Model ARIMA 0,1,1 ze stałą ma równanie predykcji. Jednorazowe przedłużenie prognozy z tego modelu są jakościowo podobne do modelu SES, z wyjątkiem tego, że trajektoria prognoz długoterminowych jest zazwyczaj linią ukośną, której nachylenie jest równe mu, a nie w linii poziomej. ARIMA 0,2,1 lub 0, 2,2 bez stałego liniowego wygładzania wykładniczego Liniowe modele wygładzania wykładniczego są modelami ARIMA, które wykorzystują dwie nierównomierne różnice w połączeniu z pojęciami drugorzędnymi Druga różnica serii Y to nie tylko różnica między Y i sobą opóźniona przez dwa okresy, ale raczej jest pierwsza różnica pierwszej różnicy - ie zmiana w Y w okresie t Tak więc druga różnica Y w okresie t jest równa Y t - Y t-1 - Y t-1 - Y t-2 Y t-2Y t-1 Y t-2 Drugą różnicą funkcji dyskretnych jest analogou s do drugiej pochodnej funkcji ciągłej mierzy przyspieszenie lub krzywiznę w funkcji w danym punkcie czasowym. Model ARIMA 0,2,2 bez stałej przewiduje, że druga różnica serii jest równa liniowej funkcji ostatniego dwa błędy prognozy, które mogą być przekształcone jako. w 1 i 2 są współczynnikami MA 1 i MA 2 Jest to ogólny linearny wykładniczy wykładnik wykładniczy model wygładzania zasadniczo taki sam jak model Holt, a model Brown's jest szczególnym przypadkiem Używa wykładniczej wagi średnie kroczące w celu oszacowania zarówno poziomu lokalnego, jak i lokalnego trendu Szereg długoterminowych prognoz tego modelu zbliża się do prostej, której nachylenie zależy od średniej tendencji obserwowanej pod koniec serii. ARIMA 1,1,2 bez ciągły trend tłumienia liniowego tłumienia wykładów. Ten model jest zilustrowany na załączonych slajdach w modelach ARIMA. Rozciąga tendencję lokalną na końcu serii, ale spłaszcza ją w dłuższych horyzontach prognoz, aby wprowadzić ote konserwatyzmu, praktyce, która ma empiryczne wsparcie Zobacz artykuł o tym, dlaczego Damped Trend działa przez Gardner i McKenzie oraz artykuł z Golden Rule autorstwa Armstronga i innych o szczegóły. Zazwyczaj zaleca się przyklejenie się do modeli, w których co najmniej jeden z p i q nie jest większa niż 1, tzn. nie próbuj dopasować modelu, takiego jak ARIMA 2,1,2, ponieważ prawdopodobnie doprowadzi to do nadmiernych i ogólnych problemów, które są omówione bardziej szczegółowo w uwagach dotyczących matematyki struktura modeli ARIMA. Implementacja arkuszy ARIMA, takie jak te opisane powyżej, są łatwe do wdrożenia w arkuszu kalkulacyjnym. Równanie predykcji jest po prostu równaniem liniowym, które odnosi się do poprzednich wartości oryginalnych serii czasowych i wartości przeszłych błędów. W ten sposób można skonfigurować arkusz kalkulacyjny ARIMA przez przechowywanie danych w kolumnie A, formuła prognozowania w kolumnie B oraz dane o błędach pomniejszone o prognozy w kolumnie C formuła prognozowania w typowej komórce w kolumnie B będzie po prostu linearnym wyrażeniem n odnosząc się do wartości w poprzednich wierszach kolumn A i C, pomnożonych przez odpowiednie współczynniki AR lub MA przechowywane w komórkach gdzie indziej w arkuszach kalkulacyjnych o oszacowaniu i przewidywaniu autentrycznych i przenoszących średnich sekwencji nongauskich. Ostateczne ceny brutto mogą się różnić w zależności od lokalnych podatków VAT. Średniowieczne modele średnie i średnie zostały zbadane przez długi okres czasu, szczególnie w przypadku Gaussa, w odniesieniu do problemów przewidywania i oszacowania współczynników modeli dopiero w ostatnich latach zwrócono szczególną uwagę na przypadki modeli niemagańskich, w których stwierdzono, że odpowiadające im problemy mogą mieć bardziej złożoną, ale bogatą strukturę. Autonomiczny model średniej ruchomości dyskretnej jest rozwiązaniem xt układu równań. gdzie sekwencja t jest sekwencją niezależnych, identycznie rozmieszczonych zmiennych losowych z E t 0, E t 2 2 0 2 Współczynniki ajbk są rzeczywiste i zwykle ustawiamy 0 b 0 1 Istnieje nieruchome rozwiązanie systemu, jeśli i tylko wtedy, gdy wielomian. has zero zera o wartości absolutnej jeden i ten roztwór jest jednoznacznie określony Problem estymacji jest oszacowanie współczynników ajbk biorąc pod uwagę sekwencja obserwacji x 1, xn Rozwiązanie stacjonarne xt jest przyczynowym, jeśli wielomian az ma wszystkie zera o wartości bezwzględnej większej niż jeden, w tym sensie, że istnieje jednostronna reprezentacja xt w kategoriach teraźniejszości i przeszłości sekwencji. z współczynnikami j malejącymi do zera wykładniczo szybkimi jak j. Te badania były częściowo wspierane przez Office of Naval Research Grant N00014-90-J1372.8 3 Modele autoregresji. W modelu regresji wielokrotnej prognozujemy zmienną procent przy użyciu liniowej kombinacji predyktorów W modelu autoregresji prognozujemy zmienną zainteresowania przy użyciu kombinacji liniowej przeszłych wartości zmiennej Termin "regresja automatyczna" wskazuje, że jest to regresja zmiennej przeciwko sobie. Tak autoregresywny model porządku p może być zapisany w as. where c jest stałą i et jest białym szumem To jest jak regresja wielokrotna, ale z opóźnionymi wartościami yt jako predykatami Odnoszę się do tego jako model AR p. Model bezpodstawowy s są niezwykle elastyczne w obsłudze szerokiego zakresu różnych wzorców szeregów czasowych Obie serie na rysunku 8 5 przedstawiają serie z modelu AR 1 i modelu AR 2 Zmiana parametrów phi1, kropek, wyników fip w różnych szeregach czasowych Zmienność błąd błędów et zmieni tylko skalę szeregu, a nie wzór. Rysunek 8 5 Dwa przykłady danych z modeli autoregresji o różnych parametrach Lewy AR 1 z yt 18 -0 8y i prawy AR 2 z yt 8 ​​1 3y -0 7y et W obu przypadkach, et jest normalnie rozproszonym białym hałasem ze średnią zerową i wariancją. Dla modelu AR1. Gdy phi1 0, yt odpowiada białemu szumowi. Gdy phi1 1 i c0, yt jest równoważne losowemu spacerowi . Gdy phi1 1 i c ne0, yt jest równoznaczne z losowym chodem z dryftem. Kiedy phi1 0, yt tenduje do oscylacji między wartościami dodatnimi i ujemnymi. Zazwyczaj ograniczamy modele autoregresji do stacjonarnych danych, a następnie pewne ograniczenia wartości wymagane są parametry. Dla modelu AR1 -1 phi1 1.F lub model AR2 -1 phi2 1, phi1 phi2 1, phi2-phi1 1. Kiedy p-3 ograniczenia są znacznie bardziej skomplikowane, R bierze pod uwagę te ograniczenia podczas szacowania modelu.

No comments:

Post a Comment