Tuesday 7 November 2017

Model o autoregresywno ruchomej średniej armie


Autoregresywna średnia ruchoma - ARIMA. Definicja autoregresji zintegrowanej średniej ruchomej - ARIMA. A model statystyczny, który wykorzystuje dane szeregowe do przewidywania przyszłych trendów Jest to forma analizy regresji, która ma na celu przewidywanie przyszłych ruchów wzdłuż pozornie losowego chodu prowadzonego przez zapasy a rynek finansowy, analizując różnice między wartościami w szeregu zamiast używać rzeczywistych wartości Znaczenie różnicowanych serii jest określane jako autoregresywne i opóźnienia w przewidywanych danych są określane jako średnia ruchoma. BREAKING DOWN Autoregresywna średnia ruchoma - ARIMA . Ten typ modelu zazwyczaj nazywany jest ARIMA p, d, q, z liczbami całkowitymi odnoszącymi się do autoregresywnych zintegrowanych i przeciętnych części danych zestawu danych, odpowiednio modelowanie ARIMA może uwzględniać trendy, cykle sezonowości, błędy i niestacjonarne aspekty zbioru danych podczas tworzenia prognoz. Wprowadzenie do modeli nieuzasadnionych ARIMA. ARIMA p, d, q forec modelowanie ARIMA jest, teoretycznie, najbardziej ogólną klasą modeli przewidywania szeregów czasowych, które mogą być stacjonarne poprzez różnicowanie w razie potrzeby, być może w połączeniu z transformacjami nieliniowymi, takimi jak rejestrowanie lub deflacja w razie potrzeby zmienna losowa szereg czasowy jest stacjonarny, jeśli jego właściwości statystyczne są stałe w czasie A stacjonarne serie nie mają tendencji, jej odchylenia wokół jego średniej mają stałą amplitudę, i wibruje w spójny sposób tj. jego krótkotrwałe losowe wzorce czasu zawsze wyglądają tak samo w sensie statystycznym Warunek ten oznacza, że ​​jego korelacje autokorelacji z własnymi wcześniejszymi odchyleniami od średniej pozostają niezmienne w czasie lub równoważnie, że jego widmo mocy pozostaje stały w czasie. Zmienna losowa tego formu może być postrzegana jak zwykle jako kombinacja sygnału i hałasu, a sygnał, jeśli jest pozorny może być wzorem szybkiego lub powolnego przecięcia średniego lub sinusoidalnego oscylatora jonowa lub szybka zmiana w znaku i może mieć również składnik sezonowy Model ARIMA może być postrzegany jako filtr, który próbuje oddzielić sygnał od hałasu, a następnie sygnał jest ekstrapolowany w przyszłości, aby uzyskać prognozy. ARIMA równanie prognostyczne dla szeregów czasowych stacjonarnych jest liniowym równaniem regresji typu, w którym predykatory składają się z opóźnień zmiennej zależnej i / lub opóźnień prognozowanych błędów. Prawidłowa wartość Y jest stałą lub ważoną sumą jednego lub ostatnie wartości Y i lub ważona suma jednej lub kilku ostatnich wartości błędów. Jeśli predykatory składają się tylko z opóźnionych wartości Y, jest to czysty, autoregresywny samoregulowany model, który jest tylko szczególnym przypadkiem modelu regresji Na przykład, autoregresywny model AR1 dla pierwszego rzędu jest prostym modelem regresji, w którym zmienna niezależna jest po prostu Y oparta o jeden okres LAG Y, 1 w Statgraphics lub Y LAG1 w RegressIt Jeśli niektóre predykatory są opóźnieniami w błędach, model ARIMA nie jest modelem regresji liniowej, ponieważ nie ma sposobu, aby określić błąd ostatniego okresu jako niezależną zmienną, błędy muszą być obliczane w okresie - okresy, gdy model jest dopasowany do danych Z technicznego punktu widzenia problem z wykorzystaniem opóźnionych błędów jako predykcyjnych jest taki, że przewidywania modelu nie są funkcjami liniowymi współczynników, nawet jeśli są to liniowe funkcje poprzednich danych. Więc współczynniki w modelach ARIMA, w których występują opóźnienia w błędach, należy oszacować przez nieliniowe metody optymalizacji - wspinaczka górska, a nie tylko przez rozwiązanie układu równań. Akronim ARIMA oznacza autoregeneracyjne regresywne ruchome średnie opóźnienia serii stacjonarnych w równaniach prognozowania nazywane są autoregresją terminy, opóźnienia w błędach prognozy nazywane są średnią ruchoma, a seria czasowa, która powinna być różna, aby była stacjonarna, to inte tkana wersja serii stacjonarnej Modele losowego i losowego trendu, modele autoregresyjne oraz modele wygładzania wykładniczego są szczególnymi przypadkami modeli ARIMA. Niespotykany model ARIMA jest klasyfikowany jako model ARIMA p, d, q, where. p jest liczba terminów autoregresyjnych. d jest liczbą nierównomiernych różnic koniecznych dla stacjonarności, a. q jest liczbą opóźnionych błędów prognozowanych w równaniu predykcyjnym. Równanie prognozowania jest skonstruowane w następujący sposób: Po pierwsze, niech y oznacza dtową różnicę Y Oznacza to, że druga różnica Y przypadku d2 nie różni się od 2 okresów temu Raczej jest to pierwsza różniczka pierwszej różnicy, która jest dyskretnym analogiem drugiej pochodnej, tzn. lokalnej przyspieszenie szeregu, a nie jego tendencja lokalna. Pod względem y ogólny wzór prognozowania jest. Tutaj poruszają się średnie parametry s tak, że ich znaki są ujemne w równaniu, po konwencji wprowadzonej przez Boxa i Jen kins Niektórzy autorzy i oprogramowanie, w tym język programowania R definiują je tak, że posiadają znaki plus Gdy faktyczne liczby są podłączone do równania, nie ma dwuznaczności, ale ważne jest, aby wiedzieć, która konwencja używa Twojego oprogramowania podczas odczytywania danych wyjściowych Często parametry są tam oznaczone przez AR 1, AR 2, i MA 1, MA 2 itd. Aby zidentyfikować odpowiedni model ARIMA dla Y, zaczynasz od określenia kolejności różnicowania d wymagających stacjonowania serii i usunięcia cech brutto sezonowości, być może w połączeniu z transformacją stabilizującą wariancję, taką jak rejestrowanie lub deflacja Jeśli zatrzymasz się w tym punkcie i przewidujesz, że zróżnicowane serie są stałe, masz tylko dopasowany losowy chód lub losowy model tendencji Jednak stacjonarne serie mogą wciąż mają błędy autokorelacyjne, co sugeruje, że w równaniu prognozowym potrzebna jest pewna liczba terminów AR1 i / lub pewnych numerów q1 q. Proces wyznaczania e wartości p, d i q, które są najlepsze dla danej serii czasowej zostaną omówione w dalszych sekcjach notatek, których łącza są u góry tej strony, ale podgląd niektórych typów nieuzasadnionych modeli ARIMA powszechnie spotykane jest poniżej. ARIMA 1,0,0 pierwszego rzędu autoregresji modelu, jeśli seria jest stacjonarna i autocorrelated, być może może być przewidywana jako wielokrotność swojej własnej poprzedniej wartości, a także stała Równanie prognozowania w tym przypadku jest. która jest z regresji regresji Y z opóźnieniem o jeden okres Jest to model stały ARIMA 1,0,0 Jeśli średnia Y jest równa zeru, wówczas nie będzie uwzględnione określenie stałe. Jeśli współczynnik nachylenia 1 jest dodatni i mniejszy niż 1 wielkość musi wynosić mniej niż 1 w przypadku, gdy Y jest nieruchoma, model opisuje zachowanie średniego zwrotu, w którym przewiduje się, że wartość następnego okresu 1-krotnego jest większa niż średnia ze względu na wartość tego okresu Jeśli 1 jest ujemna, przewiduje zachowanie średniego zwrotu z naprzemiennym znakiem s, tzn. przewiduje również, że Y będzie poniżej średniej następnego okresu, jeśli jest powyżej średniej tego okresu. W modelu autoregresji drugiego rzędu ARIMA 2,0,0, po prawej stronie znajdowałby się termin Y t-2 jak również itd. W zależności od oznakowania i wielkości współczynników, model ARIMA 2,0,0 może opisywać system, którego średnie odwrócenie zachodzi w sinusoidalnie oscylujący sposób, jak ruch masy na sprężynie, która jest poddane losowym wstrząsom. ARIMA 0,1,0 przypadkowy spacer Jeśli seria Y nie jest stacjonarna, najprostszym modelem jest model przypadkowego spaceru, który może być uważany za ograniczającą przypadek modelu AR1, w którym autoregresywny współczynnik jest równy 1, tj. seria z nieskończenie powolnym średnim odwróceniem Współczynnik predykcji dla tego modelu może być zapisany jako. gdzie stały termin jest średnią zmianą okresu między okresami, tj. długoterminowym dryftem w Y Ten model może być zamontowany jako model regresji bez przechwytywania, w którym pierwszą różnicą Y jest d zmienna ependentowa Ze względu na to, że zawiera tylko nieuzasadnioną różnicę i stały termin, jest on klasyfikowany jako model ARIMA 0,1,0 ze stałą Model bez luzu bez przeszkód byłby modelem ARIMA 0,1,0 bez stałej. ARIMA 1,1,0 zróżnicowany model autoregresji pierwszego rzędu Jeśli błędy modelu losowego spaceru są autokorelowane, być może problem można rozwiązać przez dodanie jednego opóźnienia zmiennej zależnej do równania predykcji - tzn. Przez regresję pierwszej różnicy Y na sobie opóźnione przez jeden okres To przyniosłoby następujące równanie predykcyjne, które można przestawić na. Jest to model autoregresyjny pierwszego rzędu z jednym porządkiem nierównomiernego różnicowania i stałym terminem - tj. Modelu ARIMA 1,1,0.ARIMA 0,1,1 bez stałego prostego wygładzania wykładniczego Inna strategia korygowania błędów autokorelacji w modelu losowego spaceru jest sugerowana przez prosty model wygładzania wykładnicza Przypomnijmy, że w przypadku pewnych niestałych serii czasowych np. Tych, które wykazują hałaśliwą fluencję tuziny wokół zmiennej wielkości powoli, model losowego chodu nie wykonuje się, a także średnia ruchoma poprzednich wartości Innymi słowy, a nie biorąc pod uwagę najnowsze obserwacje jako prognozę następnej obserwacji, lepiej jest użyć średniej z ostatnich kilku obserwacji w celu odfiltrowania szumu i dokładniejsze oszacowanie lokalnej średniej Prosty model wygładzania wykładniczego wykorzystuje wykładniczą ważoną średnią ruchową poprzednich wartości, aby osiągnąć ten efekt. Równanie predykcyjne dla prostego modelu wykładnicza może być zapisane liczbę równoważnych form matematycznych, z których jedna jest tak zwana korekcją błędów, w której poprzednia prognoza jest dostosowywana w kierunku popełnionego błędu. Ponieważ e t-1 Y t-1 - t-1 z definicji, to może być przepisane jako., co oznacza równanie ARIMA 0,1,1 bez stałych prognoz z 1 1 - Oznacza to, że można dopasować proste wyrównanie wykładnicze, określając go jako model ARIMA 0,1,1 bez koni stant i szacunkowy współczynnik MA 1 odpowiada 1-minus-alfa w formule SES Przypomnijmy, że w modelu SES średni wiek danych w prognozach na 1 rok jest 1, co oznacza, że ​​będą one miały tendencję do opóźnienia trendy i punkty zwrotne o około 1 okresy Wynika z tego, że średni wiek danych w prognozie 1-przedziału czasowego modelu ARIMA 0,1,1 - bez modelu stałego wynosi 1 1 - 1 Więc na przykład jeśli 1 0 8, średni wiek wynosi 5 W miarę zbliżania się 1, ARIMA 0,1,1 - bez modelu stałego staje się bardzo długoterminową średnią ruchoma, a gdy 1 zbliża się 0, staje się przypadkowym chodem bez drift model. What jest najlepszym sposobem na poprawienie autokorelacji dodawanie terminów AR lub dodawanie terminów typu MA W poprzednich dwóch omawianych modelach, problem błędów autokorelacji w modelu losowego chodu został ustalony na dwa różne sposoby, dodając lagged wartości różnic serie do równania lub dodanie opóźnionej wartości błędu prognozy Jakie podejście jest najlepszym Zasadą dla tego s ituation, która zostanie omówiona bardziej szczegółowo później, jest pozytywna autokorelacja najlepiej jest traktowana przez dodanie terminu AR do modelu, a negatywna autokorelacja najlepiej jest najlepiej traktować przez dodanie określenia MA W serii biznesowych i ekonomicznych często występuje negatywna autokorelacja powstaje jako artefakt różniczkujący Ogólnie rzecz biorąc, rozbieżność zmniejsza dodatnią autokorelację, a nawet może powodować przejście z dodatniej na ujemną autokorelację Więc model ARIMA 0,1,1, w którym wyróżnia się terminem magisterskim, jest częściej używany niż model ARIMA 1,1,0.ARIMA 0,1,1 ze stałym prostym wyrównywaniem wykładniczym ze wzrostem Dzięki wdrożeniu modelu SES jako modelu ARIMA uzyskujesz pewną elastyczność Przede wszystkim szacuje się współczynnik MA 1 negatywny odpowiada współczynnikowi wygładzania większym niż 1 w modelu SES, co zwykle nie jest dozwolone w procedurze dopasowania modelu SES Po drugie, masz możliwość włączenia stałego terminu t model ARIMA, jeśli chcesz, w celu oszacowania średniej niezerowej tendencji Model ARIMA 0,1,1 ze stałą ma równanie predykcyjne. Prognozy wyprzedzające o jeden krok przed tym modelem są jakościowo podobne do modelu SES , z wyjątkiem tego, że trajektoria prognoz długoterminowych jest zazwyczaj linią ukośną, której nachylenie jest równe mu, a nie w linii poziomej. ARIMA 0,2,1 lub 0,2,2 bez stałych linearnych wygładzeń wykładniczych Liniowe modele wygładzania wykładniczego są modele ARIMA, które wykorzystują dwie nierównomierne różnice w powiązaniu z warunkami MA Drugą różnicą serii Y jest nie tylko różnica między Y i sobą opóźniona przez dwa okresy, ale jest to pierwsza różnica pierwszej różnicy - ie zmiana w drugiej t = Y t-1 Y t-2 Y t-2Y t-1 Y t -2 Druga różnica funkcji dyskretnej jest analogiczna do drugiej pochodnej funkcji ciągłej mierzonej res przyspieszenie lub krzywiznę w funkcji w danym momencie. Model ARIMA 0,2,2 bez stałej przewiduje, że druga różnica serii jest równa liniowej funkcji ostatnich dwóch błędów prognozy, które można przekształcić jako. gdzie 1 i 2 to współczynniki MA 1 i MA 2 Jest to ogólny liniowy model wygładzania wykładniczego, zasadniczo taki sam jak model Holt, a model Brown's jest szczególnym przypadkiem. Wykorzystuje obliczone ważone średnie ruchome, aby oszacować zarówno poziom lokalny, jak i lokalny trend w serii Długoterminowe prognozy z tego modelu zbliżają się do prostej, której nachylenie zależy od średniej tendencji obserwowanej pod koniec serii. ARIMA 1,1,2 bez stałego tłumienia liniowego tłumienia liniowego. Model ten jest zilustrowany na załączonych slajdach w modelach ARIMA Wykracza poza tendencję lokalną na końcu serii, ale spłaszczając ją w dłuższych horyzontach prognoz, aby wprowadzić notatkę konserwatyzmu, praktykę, która ma empiryczne wsparcie Zobacz artykuł o tym, dlaczego "Damped Trend" działa przez Gardnera i McKenziego oraz artykuł Golden Rule firmy Armstrong i inni o szczegóły. Zazwyczaj zaleca się trzymanie się modeli, w których co najmniej jedna z p i q nie jest większa niż 1, tzn. nie próbuj dopasować modelu, takiego jak ARIMA 2,1,2, ponieważ prawdopodobnie doprowadzi to do nadmiernych i ogólnych problemów, które są bardziej szczegółowo omówione w uwagach dotyczących struktury matematycznej modeli ARIMA. Implementacja arkusza ARIMA jak opisano powyżej są łatwe do wdrożenia w arkuszu kalkulacyjnym Równanie predykcji jest po prostu równaniem liniowym, które odnosi się do poprzednich wartości oryginalnych serii czasowych i wartości przeszłych błędów W ten sposób można utworzyć arkusz kalkulacyjny ARIMA, przechowując dane w kolumnie A, formuła prognozowania w kolumnie B oraz dane o błędach pomniejszone o prognozy w kolumnie C Formuła prognozowania w typowej komórce w kolumnie B będzie po prostu wyrażeniem liniowym odnoszącym się do wartości poprzednich wierszy kolumn A i C , pomnożone przez odpowiednie współczynniki AR lub MA przechowywane w komórkach gdzie indziej w arkuszu kalkulacyjnym. Średnia ruch średnia ARMA p, q Modele do analizy serii czasowej - część 3. Jest to trzeci i ostatni post w mini serii na autostradzie średniej ruchowej ARiMR modele do analizy serii czasowej Wprowadziliśmy modele autoregresji i modele Moving Average w dwóch poprzednich artykułach Teraz nadszedł czas, aby połączyć je w celu stworzenia bardziej wyrafinowanego modelu. W końcu doprowadzi nas do modeli ARIMA i GARCH, które pozwolą nam przewidzieć rentowności aktywów i zmienność prognozy Te modele będą stanowić podstawę dla sygnałów handlowych i technik zarządzania ryzykiem. Jeśli już przeczytałeś część 1 i 2, zobaczysz, że mamy tendencję do podążania za wzorcem do analizy modelu serii czasowej, którą powtórzę krótko tutaj. Uzasadnienie - dlaczego jesteśmy zainteresowani tym konkretnym modelem. Definicja - definicja matematyczna w celu zredukowania dwuznaczności. Correlogram - Plotowanie próbki koreklografu wizualnego ise a model behaviour. Simulation and Fitting - dopasowanie modelu do symulacji, aby prawidłowo zrozumieć model. Real Financial Data - zastosuj model do rzeczywistych historycznych cen aktywów. Prediction - prognozuj kolejne wartości do budowy sygnałów handlowych lub filtrów Aby śledzić ten artykuł, warto zapoznać się z wcześniejszymi artykułami analizy szeregów czasowych. Wszystkie te dane można znaleźć tutaj. Kryterium informacji w języku Bayesian. W części 1 tej serii artykułów omówiliśmy Akaike Information Criterion AIC jako sposoby pomagania nam wybrać między osobnymi modelami najlepszych serii czasowych. Ścisłym narzędziem jest kryterium informacji bajeskiej Bayesian Information Critical BIC Zasadniczo ma podobne zachowanie do AIC, ponieważ penalizuje modele mające zbyt wiele parametrów Może to prowadzić do nadmiernego przecięcia Różnica między BIC i AIC jest to, że BIC jest bardziej rygorystyczny z jego karania dodatkowych parametrów. Bayesian Information Criterion. Jeżeli bierzemy funkcję prawdopodobieństwa dla model statystyczny, który ma k parametry, a L zmaksymalizuje prawdopodobieństwo, podając Kryterium Informacyjne Bayesiego. Gdzie n oznacza liczbę punktów danych w serii czasowej. Będziemy używać AIC i BIC poniżej przy wyborze odpowiedniej ARMA p, q models. Ljung-Box Test. W części 1 tej serii artykułów Rajan wspomniał w komentarzu Disqus, że test Ljung-Box był bardziej odpowiedni niż użycie kryterium informacji Akaike z Bayesian Information Criterion w celu ustalenia, czy model ARMA był dobry dopasowanie do serii czasowej. Test Ljung-Box jest klasycznym testem hipotezowym, który ma na celu zbadanie, czy zestaw autokorelacji modelu modelu szeregowego różni się istotnie od zera Test nie sprawdza każdego indywidualnego opóźnienia losowego, ale raczej testów losowość nad grupĘ ... lags. Ljung-Box Test. Zdefiniujmy hipotezę zerowĘ ..., ponieważ dane dotyczĘ ... ce serii czasowej w każdym okresie zwłoki to iid, to znaczy korelacje mię dzy wartoś ciami serii populacji sĘ ... zerem. e alternatywna hipoteza, ponieważ dane z serii czasowej nie są iid i posiadają korelację szeregową. Obliczamy następującą statystykę testową Q. Where n to długość próbki serii czasowej, kapelusz k jest autokorelacją przykładową w punkcie lag k, a h jest liczbą opóźnienia w testowaniu. Reguła decyzyjna co do tego, czy odrzucić hipotezę zerową jest sprawdzenie, czy Q chi 2, dla rozkładu chi-kwadratowego z h stopniami swobody w 100-alfa-procentowym percentylu. Podczas gdy szczegóły testu może wydawać się nieco skomplikowane, w rzeczywistości możemy użyć R, aby obliczyć test dla nas, upraszczając procedurę nieco. Średnia przemieszczająca się średnia ARMA modeli porządku p, q. Teraz, gdy omówiliśmy test BIC i Ljung-Box, ponownie gotowe do omówienia naszego pierwszego mieszanego modelu, mianowicie średniej ruchowej autoregresji rzędu p, q lub ARMA p, q. do dnia braliśmy pod uwagę procesy autoregresyjne i przeciętne procesy. Poprzedni model uwzględnia własne zachowania w przeszłości jako dane wejściowe dla modelu i jako takie próby w celu przechwytywania efektów uczestnictwa w rynku, takich jak momentum i średnie odwrócenie obrotu giełdowego. Ten ostatni model jest używany do scharakteryzowania informacji szokowych w szeregu, takich jak ogłoszenie o zarabianiu niespodzianek lub niespodziewane zdarzenie, takie jak wyciek ropy naftowej BP Deepwater Horizon. model ARMA próbuje uchwycić oba te aspekty podczas modelowania szeregów czasowych finansowych. Zwróć uwagę, że model ARMA nie uwzględnia klastrowania zmienności, kluczowego zjawiska empirycznego wielu finansowych serii czasowych. Nie jest to model warunkujący heteroseksualność. czekać na modele ARCH i GARCH. Model ARMA p, q jest liniową kombinacją dwóch modeli liniowych, a więc jest ciągle liniowy. Średni ruch średniorientowy modelu p, modelu qA czasowego, jest autoregresywnym modelem średniej ruchomej rzędu p, q ARMA p, q, if. rozpocznij xt alpha1 x alpha2 x ldots beta1 w beta2 w ldots betaq w end. Where jest biały hałas z E wt 0 i wariancja sigma 2.Jeśli rozważymy Operatora Przesuwania Wstecznego zobaczyć poprzedni artykuł, możemy następnie przepisać powyższe funkcje jako funkcję teta i phi. Możemy prosto zauważyć, że poprzez ustawienie p neq 0 i q 0 odzyskamy model AR p Podobnie, jeśli ustawimy p 0 i q neq 0 odzyskamy model MA q. Niektóre z kluczowych cech modelu ARMA jest to, że jest oszczędny i zbędny w swoich parametrach Oznacza to, że model ARMA często wymaga mniej parametrów niż model AR lub MA q sam Poza tym, jeśli przepisamy równanie w odniesieniu do BSO, to wielomiany teta i phi czasami mają wspólny czynnik, co prowadzi do prostszego modelu. Simulacji i korelogramów. Podobnie jak w modelach autoregresywnych i średnich ruchów, będziemy symulować różne serie ARMA, a następnie próbować dopasować modele ARMA do tych realizacji. Wykonujemy to, ponieważ chcemy upewnij się, że rozumiemy procedura dopasowania, w tym sposób obliczania przedziałów ufności dla modeli, a także zapewnić, że procedura rzeczywiście odzyskuje uzasadnione szacunki dla oryginalnych parametrów ARMA. W części 1 i 2 ręcznie skonstruowaliśmy serię AR i MA, narysując N próbek z normalnej dystrybucji, a następnie opracowanie konkretnego modelu serii czasowej przy użyciu opóźnień w tych próbkach. Istnieje jednak bardziej prosty sposób symulacji danych AR, MA, ARMA i nawet ARIMA, po prostu przy użyciu metody w punkcie R. Let s najprostszym możliwym nietrywialnym modelem ARiMR, mianowicie modelem ARMA 1,1 To znaczy autoregresywny model kolejności połączony z ruchomym średnim modelem zamówienia jeden taki model ma tylko dwie współczynniki, alfa i beta, które reprezentują pierwszy opóźnienia w serii szeregu czasowego i szokowe szumy hałasu Ten model jest podawany przez. Musimy określić współczynniki przed symulacją Weźmy alfa 0 5 i beta -0 5. Wyjście jest w następujący sposób. Realisation o f a model ARMA 1,1 z alfa 0 5 i beta 0 5.Podstawiamy również koreklogogram. Correlogram modelu ARi 1,1, z alfa 0 5 i beta 0 5. Widzimy, że nie ma znaczących autokorelacji, którą należy spodziewać się z modelu ARMA 1,1. Na koniec spróbuj określić współczynniki i ich standardowe błędy za pomocą funkcji arima. Możemy obliczyć przedziały ufności dla każdego parametru za pomocą standardowych błędów. Zakresy ufności zawierają prawdziwe wartości parametrów dla obu przypadków, ale warto zauważyć, że 95 przedziałów ufności jest bardzo szerokie w wyniku rozsądnie dużych błędów standardowych. Teraz próbujemy modelu ARMA 2,2 Oznacza to model AR 2 połączony z model MA 2 Musimy podać cztery parametry dla tego modelu: alpha1, alpha2, beta1 i beta2 Weźmy alpha1 0 5, alpha2 -0 25 beta1 0 5 i beta2 -0 3.Pracą naszego modelu ARMA 2,2 jest w następujący sposób. Realizacja modelu ARMA 2,2 z alfa1,05, alfa2-0,25, beta1,05 i beta2- 0 3.And odpowiednia autokorelacja. Correlogram modelu ARMA 2,2 z alfa1,05, alfa2 -025, beta1,05 i beta2 -0 3. Możemy teraz spróbować dopasować model ARMA 2,2 do danych Możemy również obliczyć przedziały ufności dla każdego parametru. Notek, że przedziały ufności dla współczynników dla ruchomych składników średniej beta1 i beta2 w rzeczywistości nie zawierają oryginalnej wartości parametru To wskazuje na niebezpieczeństwo próby dopasowania modeli do danych, nawet jeśli wiemy prawdziwe wartości parametrów. Jednak w celach handlowych potrzebujemy tylko siły predykcyjnej, która przekracza szansę i wytworzy wystarczająco dużo zysków powyżej kosztów transakcji, aby były rentowne w długim okresie. Teraz widziałem kilka przykładów symulacji Modele ARMA potrzebujemy mechanizmu wyboru wartości p i q przy dopasowywaniu modeli do rzeczywistych danych finansowych. Wybór najlepszego modelu ARMA p, q. W celu określenia, która kolejność p, q modelu ARMA jest odpowiednia dla serii , musimy użyć AIC lub BIC w podzbiorze wartości dla p, q, a następnie zastosuj test Ljung-Box, aby ustalić, czy zostało osiągnięte dobre dopasowanie, dla konkretnych wartości p, q. Aby pokazać tę metodę, najpierw będziemy symulować szczególny proces ARMA p, q Następnie przechodzimy do pętli wszystkich parowych wartości p in i q i obliczymy AIC Wybieramy model z najniższym AIC, a następnie wykonamy test Ljung-Box na resztkach, aby ustalić, czy osiągnęliśmy dobre dopasowanie. Zacznijmy od symulacji serii ARMA 3,2. Teraz utworzymy obiekt końcowy, aby zapisać najlepsze dopasowanie modelu i najniższą wartość AIC Pętlę nad różnymi kombinacjami p, q i używamy bieżącego obiektu do przechowywania dopasowanie modelu ARMA i i j dla zmiennych pętli i i j. Jeżeli obecna wartość AIC jest mniejsza niż jakakolwiek wcześniej wyliczona wartość AIC, ustawiamy końcowy AIC na tę bieżącą wartość i wybieramy tę kolejność Po zakończeniu pętli mamy kolejność modelu ARMA i ARIMA p, d, q dopasowują się do zestawu Integrated d składnika 0 przechowywanej jako. Nastawiamy współczynniki AIC, kolejności i ARIMA. Możemy zobaczyć, że pierwotny porządek symulowanego modelu ARMA został odzyskany, a mianowicie z p 3 i q 2 Możemy wykreślić korygogram pozostałości modelu, aby zobaczyć jeśli wyglądają jak realizacja dyskretnego białego szumu DWN. Correlogram pozostałości najlepszych modeli ARMA p, q Model, p 3 i q 2. Corelogram rzeczywiście wygląda jak realizacja DWN Wreszcie wykonujemy Ljung-Box sprawdzić, czy wartość 20 pauzy jest taka, aby potwierdzić to. Należy zauważyć, że wartość p jest większa niż 0, co oznacza, że ​​reszty są niezależne na poziomie 95, a zatem model ARMA 3,2 zapewnia dobre dopasowanie modelu. skoro od samego początku symulujemy dane. Jednak właśnie ta procedura będzie używana, gdy przyjdzie dopasować modeli ARMA p, q do indeksu S P500 w następującej sekcji. Finansowe dane. Teraz przedstawiliśmy procedurę wyboru optymalny model serii czasowej dla symulowanych serii, jest raczej strai aby zastosować je do danych finansowych W tym przykładzie po raz kolejny wybieramy S P500 US Equity Index. Let s pobierz dzienne ceny zamknięcia przy użyciu quantmod, a następnie utwórz strumień powrotów. symulowana seria ARMA 3,2 powyżej w serii powrót serii S P500 przy użyciu modelu AIC. Najlepszym modelem dopasowania jest zamówienie ARMA 3.3.Let s wylicza resztki dopasowanego modelu do dziennego strumienia danych dziennika S P500. Correlogram pozostałości najlepszych modeli ARMA p, q Model, p 3 i q 3, dziennik S P500 dziennie zwraca strumień. Wszystko, że istnieją znaczące piki, zwłaszcza przy wyższych opóźnieniach Oznacza to słabą kondycję Let s wykonaj test Ljung-Box, aby sprawdzić, czy mamy statystyczne dowody na to. Jak podejrzewaliśmy, wartość p jest mniejsza niż 0 05 i jako taka nie możemy powiedzieć, że resztki są realizacją dyskretnego białego szumu. Stąd dodatkowa autokorelacja w resztach, których nie wyjaśniono przez model ARMA 3,3. Jak omawialiśmy cały czas w tym artykule, dowiedzieliśmy się o warunkowej heterogeniczności heterogeniczności w seriach S P500, zwłaszcza w okresach 2007-2008. Kiedy w artykule użyto modelu GARCH serie dowiemy się, jak wyeliminować te autokorelacje. W praktyce modele ARMA nigdy nie są właściwie dopasowane do zwrotów akcji z indeksu Musimy wziąć pod uwagę warunkową heteroskompresję i używać kombinacji ARIMA i GARCH Następny artykuł będzie rozpatrywać ARIMA i pokazać, składnik zintegrowany różni się od modelu ARiMR, który rozważaliśmy w tym artykule. Wystarczy zacząć z obrotem ilościowym.

No comments:

Post a Comment