Wiki Wiki

Estymacja trendu

Zagadnienia estymacji trendu #

Szacowanie trendu #

Model szeregu czasowego można podzielić na 2 składniki: funkcję trendu oraz składnik losowy. Do oszacowania takiego modelu potrzeba jedynie algorytmu pozwalającego na wyzaczenie wzoru funkcji trendu takiej, że "układa się jak najbliżej punktów obserwacji". Jest to minimalizacja sumy kwadratów odległości punktów obserwowanych od krzywej zanadanej fikcyjnie. W praktyce do tego zadania stosowana jest metoda najmniejszych kwadratów (MNK). Metoda MNK jest najczęściej wykorzystywana do wyznaczania trednu liniowego, to jednak może być zastosowana do wyznaczania wszystkich innych trendów z wyjątkiem trendu wykładniczego oraz potęgowego z poziomami. Dla tych rodzajów trendów można wykorzystać algorytm Levenberga-Marquardta, którego złożoność obliczeniowa przewyższa znacznie złożoność tradycyjnego MNK.

Niejednokrotnie można spotkać się z koniecznością wyboru bardziej skomplikowanego modelu dla szeregu czasowego w którym będzie znajdował się dodatkowy komponent - składnik sezonowy. Oznacza to, że w szeregu czasowym występuje nie tylko długoterminowy trend, a także przejawia cykliczne zachowania. 

Należy sobie zdać sprawę, że metody wyznaczania trendów, jak i algorytmy wyboru najlepszego typu trendu nie mogą być stosowane bezwarunkowo. Szczególną uwagę należy zwracać przy szeregach wykazujących się sezonowością. Przykładowo, w modelu klasycznej dekompozycji obecność sezonowości może zakłócić estymację trendu. Nie posiadając eksperckiej wiedzy bardzo łatwo przeoczyć to i uznać otrzymany trend za poprawny.

Usuwanie sezonowości z danych może być wykonane przy użyciu różnego rodzaju wygładzania danych. Niezależnie od wybranego podejścia, próba usunięcia sezonowości i (lub) wahań sezonowych może być potraktowana jako wstępna, techniczna estymacja składnika sezonowego, niekoniecznie zaś jako ostateczna jego postać.


Kryteria oceny jakości dopasowania trendu do danych #

Wszystkie wymienione niżej kryteria interpretuje się w sposób następujący: spośrób kilku modeli, za lepszy uznaje się ten z mniejszą wartością kryterium.

  1. Odchylenie standardowe reszt z modelu
  2. Kryterium Akaike
  3. MAPE
  4. Współczynnik
  5. MSE

Ad 1.

Mając model m dla szeregu Y można rozpatrywać ciąg reszt Y-m. Wychodząc z założenia, że dla dobrego modelu reszty te będą mniej zróżnicowane niż dla złego modelu, jako kryterium oceny modelu zastosować można wartość odchylenia standardowego liczb Y-m. Średnia z tych liczb powinna być bliska 0, a ich rozkład powinien być normalny. Na uwadze należy mieć fakt, że mniejsze odchylenie reszt, w sytuacji ogólnej, nie oznacza lepszego modelu, w szczególności gdy model staje się obciążony.

Kolejnym aspektem wymagającym dokładniejszej analizy jest dopasowanie modelu trendu do danych heteroscedastycznych i (lub) o niegaussowskim rozkładzie składnika losowego. W tej sytuacji odchylenie reszt może zachowywać się w sposób nieoczekiwany i być bardzo mylące. Mankamentem tego kryterium jest brak uwzględniania liczby parametrów w modelu. Modele skomplikowane są w stanie lepiej odtwarzać dane, jednocześnie są bardziej narażone na ryzyko przeuczenia się. 

Ad 2.

Sposobem na uniknięcie tego problemu  jest stosowanie systemu kar, który w pewnym stopniu dostosowuje oczekiwania wobec modelu do stopnia jego skomplikowania. Przykładem takiego podejścia jest kryterium Akaike, które uwzględnia zarówno informację o resztach modelu jak i liczbie paramterów wykorzystanych do jego skonstruowania.

Ad 3.

Akronim MAPE pochodzi od angielskiego określenia mean absolute percentage error, czyli średniego względego błędu predykcji, kryterium jest defniniowane ze wzroru:

,

gdzie:

 - jest obecną obserwacją (actual value),

 - jest prognozą obserwacji (forecast value),

n - jest liczbą obserwacji.

Metoda ta niesie ze sobą 2 istone niedogodności w praktycznym zastosowaniu:

  1. W przypadku zerowych wartości (co się może zdarzyć np. w szeregu dotyczącym popytu) dojdzie do dzielenia przez zero.
  2. Wartość MAPE waha się w przedziale , a idealne dopasowanie jest wtedy gdy MAPE=0. 

Ad 4.

Po wyznaczeniu krzywej z metody MNK, można sprawdzić dopasowanie do danych stosując kryterium współczynnika . Przyjmuje on wartości z przedziału [0,1], im większa wartość tym lepsze dopasowanie). Kryterium to posiada również pewną  modyfikację, która uwzględnia liczbę parametrów modelu, tzn. dostosowany współczynnik . Wartość dopasowanego współczynnika nie jest wyższa niż wartość zwykłego .

Kryterium to umożliwia nie tylko wybranie najlepszego modelu, ale także ocenę jego jakości. Zawdzięcza się to standaryzacji, której nie uświadczymy w kryterium Akaike i odchyleń reszt modelu. 

Ad 5.

MSE (z ang. mean squared error), czyli średni błąd kwadratowy, to w statystyce jedna z możliwości oceny różnic wartości oszacowanych przez estymator, a wartościami prawdziwymi. MSE jest funkcją ryzyka, odpowiadającą wartości oczekiwanej kwadratowemu błędowi straty. MSE mierzy średnią z kwadratów błędów. Przez błąd rozumie się ilość, o jaką różni się wartość szacowana od rzeczywistej. Różnice powstają w sposób typowo losowy, bądź też przez to, że estymator nie uwzględnia informacji, które mogą spowodować bardziej dokładne szacunki. 

0 Załączniki
736 Wyświetleń