Asymptotyczne kryteria selekcji. Asymptotyczne właściwości symetrii i kryteria zgodności na podstawie charakteryzacji

We współczesnych warunkach stale i intensywnie rośnie zainteresowanie analizą danych w zupełnie innych dziedzinach, takich jak biologia, językoznawstwo, ekonomia i oczywiście informatyka. Podstawą tej analizy są metody statystyczne i każdy szanujący się specjalista data mining powinien je rozumieć.

Niestety, naprawdę dobra literatura, taka, która może dostarczyć zarówno rygorystycznych matematycznie dowodów, jak i jasnych, intuicyjnych wyjaśnień, nie jest zbyt powszechna. I te wykłady, moim zdaniem, są niezwykle dobre dla matematyków, którzy właśnie z tego powodu rozumieją teorię prawdopodobieństwa. Studiuje się je dla mistrzów na niemieckim Uniwersytecie Christiana-Albrechta w ramach programów matematyki i matematyki finansowej. A dla zainteresowanych tym, jak naucza się tego przedmiotu za granicą, przetłumaczyłem te wykłady. Tłumaczenie zajęło mi kilka miesięcy, wykłady rozcieńczałem ilustracjami, ćwiczeniami i przypisami do niektórych twierdzeń. Zaznaczam, że nie jestem zawodowym tłumaczem, a po prostu altruistą i amatorem w tej dziedzinie, dlatego przyjmę każdą krytykę, jeśli będzie ona konstruktywna.

W skrócie o czym są te wykłady:


Warunkowe oczekiwanie matematyczne

Rozdział ten nie dotyczy bezpośrednio statystyki, jednak idealnie nadaje się na rozpoczęcie jej studiowania. Oczekiwanie warunkowe to najlepszy wybór do przewidywania losowego wyniku na podstawie już dostępnych informacji. To także jest zmienna losowa. Rozważamy tutaj jego różne właściwości, takie jak liniowość, monotoniczność, zbieżność monotoniczna i inne.

Podstawy szacowania punktów

Jak oszacować parametr rozkładu? Jakie kryterium wybrać w tym przypadku? Jakich metod powinienem używać? Ten rozdział pomoże odpowiedzieć na wszystkie te pytania. Tutaj wprowadzamy pojęcia nieobciążonego estymatora i równomiernie nieobciążonego estymatora minimalnej wariancji. Wyjaśnia, skąd wzięły się rozkłady chi-kwadrat i t- oraz dlaczego są one ważne w szacowaniu parametrów rozkładu normalnego. Wyjaśnia, na czym polega nierówność Rao-Kramera i informacja Fishera. Wprowadzono także koncepcję rodziny wykładniczej, co znacznie ułatwia uzyskanie dobrego oszacowania.

Estymacja parametrów bayesowskich i minimax

Opisano tu inne filozoficzne podejście do ewaluacji. W tym przypadku parametr uważa się za nieznany, ponieważ jest realizacją pewnej zmiennej losowej o znanym (apriorycznym) rozkładzie. Obserwując wynik eksperymentu, obliczamy tzw. rozkład tylny parametru. Na tej podstawie możemy otrzymać estymator Bayesa, gdzie kryterium jest minimalna strata średnia, lub estymator minimax, który minimalizuje maksymalną możliwą stratę.

Wystarczalność i kompletność

Rozdział ten ma poważne znaczenie praktyczne. Statystyka wystarczająca to taka funkcja próbki, że w celu oszacowania parametru wystarczy zapisać tylko wynik tej funkcji. Takich funkcji jest wiele, a wśród nich znajdują się tzw. statystyki minimalne wystarczające. Przykładowo, aby oszacować medianę rozkładu normalnego, wystarczy zapisać tylko jedną liczbę – średnią arytmetyczną z całej próby. Czy działa to również w przypadku innych rozkładów, takich jak rozkład Cauchy'ego? W jaki sposób wystarczające statystyki pomagają w wyborze szacunków? Tutaj znajdziesz odpowiedzi na te pytania.

Asymptotyczne własności szacunków

Być może najważniejszą i niezbędną właściwością oceny jest jej spójność, to znaczy tendencja do prawdziwego parametru w miarę zwiększania się wielkości próby. W tym rozdziale opisano, jakie właściwości mają znane nam szacunki, uzyskane metodami statystycznymi opisanymi w poprzednich rozdziałach. Wprowadzono pojęcia asymptotycznej bezstronności, sprawności asymptotycznej i odległości Kullbacka-Leiblera.

Podstawy testowania

Oprócz pytania jak oszacować nieznany nam parametr, musimy w jakiś sposób sprawdzić, czy spełnia on wymagane właściwości. Na przykład przeprowadzany jest eksperyment mający na celu przetestowanie nowego leku. Skąd wiesz, czy prawdopodobieństwo wyzdrowienia jest przy nim większe niż przy stosowaniu starych leków? W tym rozdziale wyjaśniono, jak skonstruowane są takie testy. Dowiesz się, czym jest test o największej mocy, test Neymana-Pearsona, poziom istotności, przedział ufności oraz skąd pochodzą dobrze znane testy Gaussa i test t.

Asymptotyczne właściwości kryteriów

Podobnie jak oceny, kryteria muszą spełniać pewne właściwości asymptotyczne. Czasami mogą zaistnieć sytuacje, gdy nie da się skonstruować wymaganego kryterium, jednak korzystając ze znanego centralnego twierdzenia granicznego, konstruujemy kryterium asymptotycznie dążące do niezbędnego. Tutaj dowiesz się, czym jest asymptotyczny poziom istotności, metoda ilorazu wiarygodności oraz jak skonstruowany jest test Bartletta i test niezależności chi-kwadrat.

Model liniowy

Rozdział ten można potraktować jako uzupełnienie, a mianowicie zastosowanie statystyki w przypadku regresji liniowej. Zrozumiesz, jakie oceny są dobre i na jakich warunkach. Dowiesz się skąd wzięła się metoda najmniejszych kwadratów, jak konstruować testy i dlaczego potrzebny jest rozkład F.

Słowniczek

Do sekcji 7

Autokowariancja - dla szeregu stacjonarnego Xt, kowariancja zmiennych losowych Xt9 Xt+T9 y(t) Cov(Xn Xt+T).

Złącze autokorelacji -ACF - dla szeregu stacjonarnego Xt - kolejność jego autokorelacji p(t) = Corr(Xt9 Xt+ r), r = 0,1, 2,...

Autokorelacja, współczynnik autokorelacji - dla szeregu stacjonarnego Xt, współczynnik korelacji zmiennych losowych Xn Xt+T, p(t) = Corr(Xt, Xt+T).

Szum biały, proces białego szumu – stacjonarny proces losowy Xt o zerowej średniej i niezerowej wariancji,

dla czego Corr(Xt, Xs) = 0 w t Ф s.

Modele „bardziej oszczędne” należą do pewnego zestawu alternatywnych modeli szeregów czasowych, modeli z najmniejszą liczbą współczynników do oszacowania.

Szereg czasowy – ciąg wartości jakiejś zmiennej mierzonych w kolejnych punktach czasu. Przez szereg czasowy rozumie się także proces losowy o dyskretnym czasie (sekwencja losowa), którego realizacją jest obserwowany ciąg wartości.

Przykładowa funkcja autokorelacji (SACF - próbka ACF) - ciąg przykładowych autokorelacji r (k), & = 0, 1,2, zbudowany z istniejącej implementacji szeregu czasowego. Analiza tej sekwencji pomaga zidentyfikować proces średniej ruchomej i jego kolejność.

Przykładowa funkcja autokorelacji częściowej (SPACF-próbka PACF) - ciąg przykładowych autokorelacji częściowych rpart(k), k = 0, 1, 2, skonstruowany z istniejącej implementacji szeregu czasowego. Analiza tej sekwencji pomaga zidentyfikować proces średniej ruchomej i jego kolejność.

Przykładowe autokorelacje są estymatorami autokorelacji p(k) procesu losowego, skonstruowanymi na podstawie istniejącej implementacji szeregu czasowego. Jedna z możliwości estymacji autokorelacji p(k) ma postać:

T-kf?x " И)У t+k И) у (к) 1 t

gdzie p = x = - ^xt - oszacowanie dla p = E(Xt), ] tk

y(k) = y](xt p)(xt+k p) - estymacja autokowariancji y(k).

Przykładowe autokorelacje częściowe są estymatorami częściowych autokorelacji prap(t) procesu losowego, skonstruowanymi na podstawie istniejącej implementacji szeregu czasowego.

Gaussowski proces białego szumu to proces białego szumu, którego jednowymiarowe rozkłady są rozkładami normalnymi z zerowymi oczekiwaniami matematycznymi.

Proces losowy Gaussa – proces losowy, dla którego dla dowolnej liczby całkowitej m > O i dowolnego zbioru razy tx< t2 < ... < tm совместные распределения случайных величин Xti, Xtm являются m-мерными нормальными распределениями.

Innowacja to bieżąca wartość błędu losowego po prawej stronie zależności wyznaczającej proces autoregresji Xr Innowacja nie jest

skorelowane z wartościami opóźnionymi Xt_k9 k= 1, 2, ... Kolejne wartości innowacji (sekwencja innowacji) tworzą proces białego szumu.

Kryterium informacyjne Akaike (AIC) jest jednym z kryteriów wyboru „najlepszego” modelu spośród kilku alternatywnych modeli. Spośród alternatywnych wartości rzędu modelu autoregresyjnego wybierana jest wartość, która minimalizuje wartość

o 2 tys. A1C(£) = 1n0£2+y,

Oszacowanie rozproszenia innowacji єг w modelu AR jest prawidłowe.

Kryterium Akaike asymptotycznie przeszacowuje (przeszacowuje) prawdziwą wartość k0 z niezerowym prawdopodobieństwem.

Kryterium informacyjne Hannana-Quinna (HQC) jest jednym z kryteriów wyboru „najlepszego” modelu spośród kilku alternatywnych modeli. Spośród alternatywnych wartości rzędu modelu autoregresyjnego wybierana jest wartość, która minimalizuje wartość

UQ(k) = In a2k + k - ,

gdzie T jest liczbą obserwacji;

(t£ - oszacowanie rozproszenia innowacji st w modelu AR rzędu A>tego.

Kryterium charakteryzuje się dość szybką zbieżnością do prawdziwej wartości k0 w T -» oo. Jednak dla małych wartości T kryterium to zaniża rząd autoregresji.

Kryterium informacyjne Schwarza (SIC) jest jednym z kryteriów wyboru „najlepszego” modelu spośród kilku alternatywnych modeli. Spośród alternatywnych wartości rzędu modelu autoregresyjnego wybierana jest wartość, która minimalizuje wartość

SIC(£) = lno>2+Ar-,

gdzie T jest liczbą obserwacji;

A? - ocena rozproszenia innowacji st. w modelu AR rzędu A:.

Korelogram - dla szeregu stacjonarnego: wykres zależności wartości autokorelacji p(t) szeregu stacjonarnego na t. Korelogram nazywany jest także parą wykresów podawanych w protokołach analizy danych w różnych pakietach analiz statystycznych: wykres przykładowej funkcji autokorelacji i wykres przykładowej częściowej funkcji autokorelacji. Obecność tych dwóch wykresów pomaga w identyfikacji modelu ARMA generującego dostępny zbiór obserwacji.

Rzucanie wsteczne to technika pozwalająca uzyskać dokładniejsze przybliżenie funkcji wiarygodności warunkowej podczas szacowania modelu średniej ruchomej MA(q):

Xt = et + bxst_x + b2st_2 + ... + bqet_q9 bq Ф0,

według obserwacji xl9..., xt. Wynik maksymalizacji (no bx, bl9 ..., bq) warunkowej funkcji wiarygodności odpowiadającej obserwowanym wartościom xХ9х29 ...9хт dla ustalonych wartości є09 є_Х9 є_д+Х9 zależy od wybranych wartości b*0, е_є_д+1. Jeżeli proces MA(q) jest odwracalny, to możemy przyjąć 6*0 = є_х = ... = s_q+x = 0. Aby jednak poprawić jakość estymacji, możemy zastosować metodę prognozy odwrotnej do „oszacowania” wartości є09 e_Х9 є_д+х i użyj oszacowanych wartości w funkcji wiarygodności warunkowej. Operator opóźnienia (L)9 operator przesunięcia wstecznego - operator określony zależnością: LXt = Xt_x. Wygodny do kompaktowego rejestrowania modeli szeregów czasowych i formułowania warunków zapewniających określone właściwości szeregu. Przykładowo za pomocą tego operatora można utworzyć równanie definiujące model ARMA(p, q).

Xt = Z ajxt-j + Z bj£t-j ><*Р*ъ>ch* Och,

można zapisać jako: a(L) Xt = b(b)єп gdzie

a(L) = 1 (axL + a2L2 + ... + apLp

b(L)=l+blL + b2L2 + ... + bqLq.

Problemem wspólnych czynników jest obecność wspólnych czynników w wielomianach a(L) i b(L)9 odpowiadających składowym AR i MA modelu ARMA:

Obecność wspólnych czynników w specyfikacji modelu ARMA utrudnia praktyczną identyfikację modelu na podstawie szeregu obserwacji.

Proces autoregresyjny pierwszego rzędu (AR(1)) jest procesem losowym, którego wartość bieżąca jest sumą funkcji liniowej wartości procesu opóźnionej o jeden krok oraz błędu losowego, który nie jest skorelowany z wartościami procesu przeszłymi. W tym przypadku sekwencja losowych błędów tworzy proces białego szumu.

Proces autoregresyjny rzędu p (proces autoregresyjny p-tego rzędu - AR(p)) jest procesem losowym, którego bieżąca wartość jest sumą funkcji liniowej wartości procesu opóźnionych o p kroków lub mniej oraz błędu losowego nieskorelowane z przeszłymi wartościami procesu. W tym przypadku sekwencja losowych błędów tworzy proces białego szumu.

Proces średniej ruchomej rzędu q (proces średniej ruchomej rzędu q-tego - MA(g)) jest procesem losowym, którego bieżąca wartość jest liniową funkcją bieżącej wartości jakiegoś procesu białego szumu i wartości tego proces białego szumu opóźniony o p kroków lub mniej.

Rozkład Wolda jest reprezentacją zasadniczo stacjonarnego procesu z zerowymi oczekiwaniami matematycznymi, jako suma procesu średniej ruchomej o nieskończonym porządku i procesu liniowo deterministycznego.

Autoregresja sezonowa pierwszego rzędu (SAR(l) - autoregresja sezonowa pierwszego rzędu) jest procesem losowym, którego bieżąca wartość jest liniową funkcją wartości tego procesu opóźnioną o S kroków i błędem losowym nieskorelowanym z przeszłe wartości procesu. W tym przypadku sekwencja losowych błędów tworzy proces białego szumu. Tutaj S = 4 dla danych kwartalnych, S = 12 dla danych miesięcznych.

Sezonowa średnia krocząca pierwszego rzędu (SMA(l) - sezonowa średnia krocząca pierwszego rzędu) jest procesem losowym, którego bieżąca wartość jest równa sumie funkcji liniowej aktualnej wartości jakiegoś procesu białego szumu i wartości tego procesu białego szumu opóźnionego o S kroków. W tym przypadku sekwencja losowych błędów tworzy proces białego szumu. Tutaj 5 = 4 dla danych kwartalnych, 5 = 12 dla danych miesięcznych.

Układ równań Yule'a - Walkera jest układem równań łączącym autokorelacje stacjonarnego procesu autoregresyjnego rzędu p z jego współczynnikami. System pozwala na spójne znajdowanie wartości autokorelacji i umożliwia za pomocą pierwszych równań p wyrażenie współczynników procesu autoregresji stacjonarnej poprzez wartości pierwszych autokorelacji p, które można bezpośrednio wykorzystać, gdy dobór modelu autoregresji do rzeczywistych danych statystycznych.

Proces losowy o czasie dyskretnym (proces stochastyczny w czasie dyskretnym, proces losowy w czasie dyskretnym) to ciąg zmiennych losowych odpowiadający obserwacjom poczynionym w kolejnych momentach czasu, posiadający pewną strukturę probabilistyczną.

Proces mieszany autoregresyjnej średniej kroczącej, proces autoregresyjny z resztami w postaci średniej kroczącej (autoregresywna średnia krocząca, mieszana autoregresywna średnia krocząca – ARMA(p, q)) jest procesem losowym, którego bieżąca wartość jest sumą funkcja liniowa kroków opóźnionych o p lub mniej wartości procesu oraz funkcja liniowa z bieżącej wartości jakiegoś procesu białego szumu i wartości tego procesu białego szumu opóźnionego o q lub mniej kroków.

Statystyka Q Boxa-Pierce’a – jedna z opcji statystyki g:

Є = r£g2(*),

Statystyka Q Ljunga-Boxa jest jedną z opcji statystyki g, preferowaną w stosunku do statystyki Boxa-Pierce'a:

gdzie T jest liczbą obserwacji; r (k) - przykładowe autokorelacje.

Służy do testowania hipotezy, że obserwowane dane są realizacją procesu białego szumu.

Szerokosensowny stacjonarny, słabosensowny stacjonarny, słabo stacjonarny, stacjonarny drugiego rzędu, kowariancja-stacjonarny proces stochastyczny - proces losowy ze stałym oczekiwaniem matematycznym, stałą wariancją i niezmienniczymi zmiennymi losowymi Xt,Xt+T:

Cov(Xt,Xt+T) = r(r).

Ściśle stacjonarny, stacjonarny w wąskim znaczeniu (ściśle stacjonarny, ściśle stacjonarny) proces losowy (proces stochastyczny) - proces losowy o wspólnych rozkładach zmiennych losowych Xh + T, ..., + T niezmienny w r.

Warunek odwracalności procesów MA(q) i ARMA(p, q) (warunek odwracalności) - dla procesów Xt postaci MA(g): Xt = b(L)st lub ARMA(p, q): a(L )(Xt ju ) = = b(L)st - warunek na pierwiastkach równania b(z) = O, zapewniający istnienie równoważnej reprezentacji procesu Xt w postaci procesu autoregresyjnego nieskończonego rzędu AR( oo):

Warunek odwracalności: wszystkie pierwiastki równania b(z) = O leżą poza okręgiem jednostkowym |z|< 1.

Warunek stacjonarności dla procesów AR(p) i ARMA(p, q) - dla procesów Xt postaci AR(p): a(L)(Xt ju) = et lub ARMA(p, q) a(L)( Xt ju) = = b(L)st - warunek na pierwiastkach równania a(z) = 0, zapewniający stacjonarność procesu Xg Warunek stacjonarności: wszystkie pierwiastki równania b(z) = O leżą poza okręgiem jednostkowym |z|< 1. Если многочлены a(z) и b(L) не имеют общих корней, то это условие является необходимым и достаточным условием стационарности процесса Хг

Funkcja częściowej autokorelacji (PACF - częściowa funkcja autokorelacji) - dla szeregu stacjonarnego ciąg częściowych autokorelacji prap(r), m = 0, 1,2,...

Częściowa autokorelacja (PAC - częściowa autokorelacja) - dla szeregu stacjonarnego wartość ppart(r) współczynnika korelacji pomiędzy zmiennymi losowymi Xt nXt+k, oczyszczona z wpływu pośrednich zmiennych losowych Xt+l9...9Xt+k_Y.

Etap sprawdzania diagnostyki modelu – diagnostyka estymowanego modelu ARiMR, wybrana na podstawie dostępnych serii obserwacji.

Etap identyfikacji modelu – wybór modelu generacji szeregowej na podstawie dostępnych serii obserwacji, określenie rzędów p i q modelu ARiMR.

Etap oceny modelu (etap estymacji) – estymacja współczynników modelu ARiMR wybranych na podstawie dostępnych serii obserwacji.

(Q-statistics) – statystyka testowa służąca do testowania hipotezy, że obserwowane dane są realizacją procesu białego szumu.

Do sekcji 8

Autoregresja wektorowa rzędu p (autoregresja wektorowa rzędu ph - VAR(p)) to model generowania grupy szeregów czasowych, w którym wartość bieżąca każdego szeregu składa się ze składowej stałej, kombinacji liniowych opóźnionych (do rzędu p) wartości tego szeregu i innych szeregów oraz błąd losowy. Błędy losowe w każdym równaniu nie są skorelowane z wartościami opóźnionymi wszystkich rozważanych szeregów. Wektory losowe utworzone przez błędy w różnych szeregach jednocześnie są niezależnymi wektorami losowymi o jednakowym rozkładzie i ze średnimi zerowymi.

Zależność długookresowa to określona w czasie zależność pomiędzy zmiennymi, względem której zachodzą dość szybkie oscylacje.

Mnożniki długookresowe (mnożniki długookresowe, mnożniki równowagi) - w modelu dynamicznym z opóźnieniami autoregresyjnymi - współczynniki сх,cs długoterminowej zależności zmiennej od zmiennych egzogenicznych xi, xst. Współczynnik Cj odzwierciedla zmianę wartości yt, gdy bieżąca i wszystkie poprzednie wartości zmiennej xjt zmienią się o jeden.

Mnożniki impulsów (mnożnik udarowy, mnożnik krótkookresowy) – w modelu dynamicznym z opóźnieniami autoregresywnie rozłożonymi – wartości obrazujące wpływ jednorazowych (impulsowych) zmian wartości zmiennych egzogenicznych chi, xst na prąd i kolejne wartości zmiennej jr

Kowariancje krzyżowe to współczynniki korelacji między wartościami różnych składników szeregu wektorów w zbieżnych lub rozbieżnych punktach w czasie.

Funkcja kowariancji krzyżowej to sekwencja korelacji krzyżowych dwóch składników stacjonarnego szeregu wektorów.

Modele z autoregresyjnymi modelami rozproszonego opóźnienia (ADL) to modele, w których bieżąca wartość zmiennej objaśnianej jest sumą funkcji liniowej kilku opóźnionych wartości tej zmiennej, kombinacji liniowych prądu i kilku opóźnionych wartości zmiennych objaśniających i przypadkowy błąd.

Funkcja transferu jest funkcją macierzową, która ustala wpływ jednostkowych zmian zmiennych egzogenicznych na zmienne endogeniczne.

Proces generowania danych (DGP) to model probabilistyczny, który generuje obserwowalne dane statystyczne. Proces generowania danych jest zwykle nieznany badaczowi analizującemu dane. Wyjątkiem są sytuacje, gdy badacz sam wybiera proces generowania danych i pozyskuje sztuczne dane statystyczne poprzez symulację wybranego procesu generowania danych.

Model statystyczny (SM) to model wybrany do oceny, którego strukturę przyjmuje się jako odpowiadającą procesowi generowania danych. Wyboru modelu statystycznego dokonuje się na podstawie istniejącej teorii ekonomii, analizy dostępnych danych statystycznych oraz analizy wyników wcześniejszych badań.

Szereg wektorów stacjonarnych (wymiarowych AG) (K-wymiarowy stacjonarny szereg czasowy) - ciąg losowych wektorów wymiaru K, mających te same wektory oczekiwań matematycznych i te same macierze kowariancji, dla których występują korelacje krzyżowe (korelacje krzyżowe) pomiędzy wartość k-tej składowej szeregu w chwili t oraz wartość pierwszej składowej szeregu w chwili (t + s) zależą tylko od s.

Do sekcji 9

Hipoteza pierwiastka jednostkowego (UR - hipoteza pierwiastka jednostkowego) - hipoteza sformułowana w ramach modelu ARMA(^, q): a(L)Xt = b(L)cr Hipoteza, że ​​wielomian autoregresyjny a(L) modelu ARMA ma co najmniej jeden pierwiastek równy 1. W tym przypadku zwykle przyjmuje się, że wielomian a(L) nie ma pierwiastków, których moduł jest mniejszy niż 1.

Różnicowanie - przejście od szeregu poziomów Xt do szeregu różnic Xt Xt_v Konsekwentne różnicowanie szeregu pozwala wyeliminować trend stochastyczny występujący w szeregu wyjściowym.

Całka rzędu k - szereg Xn, który nie jest stacjonarny ani stacjonarny względem trendu deterministycznego (czyli nie jest szeregiem TS) i dla którego szereg otrzymany w wyniku ^-krotnego różniczkowania szeregu Xn jest stacjonarny , ale szereg otrzymany w wyniku (k 1)-krotnego różniczkowania szeregu Xr nie jest szeregiem HY.

Zależność kointegracji to długookresowa zależność pomiędzy kilkoma szeregami zintegrowanymi, charakteryzująca stan równowagi układu tych szeregów.

Model z korekcją błędów jest kombinacją krótkoterminowych i długoterminowych modeli regresji dynamicznej w obecności związku kointegracji pomiędzy szeregami zintegrowanymi.

Operator różniczkowania - operator A, przekształcający szereg poziomów Xt w szereg różnic:

Przeróżnicowane szeregi czasowe - szeregi powstałe w wyniku różniczkowania szeregu G5. Konsekwentne różnicowanie szeregu GO pomaga wyeliminować deterministyczny trend wielomianu. Różnicowanie szeregu T ma jednak pewne niepożądane konsekwencje przy wyborze modelu z danych statystycznych i wykorzystaniu wybranego modelu do przewidywania przyszłych wartości szeregu.

Różnica stacjonarna, szereg LU (DS - różnica stacjonarna szereg czasowy) - szereg zintegrowany różnych rzędów k = 1,2, ... Sprowadzają się do szeregu stacjonarnego przez różniczkowanie pojedyncze lub wielokrotne, ale nie można ich sprowadzić do szeregu stacjonarnego poprzez odjęcie trendu deterministycznego.

Szereg typu ARIMA(p, A, q) (ARIMA – autoregresywna zintegrowana średnia ruchoma) to szereg czasowy, który w wyniku ^-krotnego różniczkowania redukuje się do szeregu stacjonarnego ARMA(p, q).

Seria stacjonarna względem trendu deterministycznego, seria G5

(TS - szeregi czasowe trend-stacjonarne) - szeregi, które stają się stacjonarne po odjęciu od nich trendu deterministycznego. Do klasy takich szeregów zalicza się także szeregi stacjonarne bez trendu deterministycznego.

Random walk, random walk Process - proces losowy, którego przyrosty tworzą proces białego szumu: AXt st, więc Xt = Xt_ x + єг

Spacer losowy z dryfem, błądzenie losowe z dryfem (przechodzenie losowe z dryfem) to proces losowy, którego przyrosty są sumą procesu stałego i białego szumu: AXt = Xt Xt_ x = a + st, więc Xt = Xt_x + a + ег Stała a charakteryzuje dryf trajektorii błądzenia losowego, który występuje stale podczas przejścia do kolejnego momentu w czasie, na który nakłada się składowa losowa.

Trend stochastyczny - szereg czasowy Zt dla którego

Z, = єх + є2 + ... + et. Wartość błądzenia losowego w chwili t wynosi t

Xt = Х0 + ^ є8, więc Xt Х0 = єх + є2 + ... + єг Inaczej mówiąc, model

trend stochastyczny - proces błądzenia losowego, „wychodzenia z początku współrzędnych” (dla niego X0 = 0).

Innowacja szokowa to jednorazowa (impulsowa) zmiana innowacji.

Efekt Słuckiego to efekt powstawania fałszywej okresowości przy różnicowaniu szeregu stacjonarnego względem trendu deterministycznego. Na przykład, jeśli szereg pierwotny jest sumą deterministycznego trendu liniowego i białego szumu, to szereg zróżnicowany nie ma trendu deterministycznego, ale okazuje się być autokorelacją.

^-hipoteza (hipoteza TS) - hipoteza, że ​​rozpatrywany szereg czasowy jest stacjonarny lub szereg stacjonarny względem trendu deterministycznego.

Do sekcji 10

Wariancja długookresowa – dla serii o zerowym oczekiwaniu matematycznym definiuje się ją jako granicę

Var(ux +... + it)

G-yus T T-+OD

Testy Dickeya-Fullera to grupa kryteriów statystycznych służących do testowania hipotezy pierwiastka jednostkowego w ramach modeli zakładających zerowe lub niezerowe oczekiwanie matematyczne szeregu czasowego oraz możliwą obecność w szeregu trendu deterministycznego.

Stosując kryteria Dickeya-Fullera, najczęściej ocenia się modele statystyczne

pAxt = a + (3t + cpxt_x + +є*> t = P + h---,T,

Axt =a + cpxt_x + ^0jAxt_j +£*, t = /7 + 1,..., Г,

Axt = cpxt_x + ]T 6j Axt_j +єп t = p +1,..., T.

/-statystyki / wartości uzyskane podczas oceny tych modeli statystycznych do testowania hipotezy H0: cp = O są porównywane z wartościami krytycznymi /crit, w zależności od wyboru modelu statystycznego. Hipotezę pierwiastka jednostkowego odrzuca się, jeśli f< /крит.

Test Kwiatkowskiego-Phillipsa-Schmidta-Shina (test KPSS) jest kryterium pozwalającym na odróżnienie szeregu DS od szeregu Г5, w którym hipotezę ha przyjmuje się jako zerową.

Test Leybourne’a jest kryterium testowania hipotezy pierwiastka jednostkowego, którego statystyka jest równa maksimum dwóch wartości statystyki Dickeya-Fullera uzyskanych z szeregu pierwotnego i szeregu odwróconego w czasie.

Test Perrona – kryterium testowania hipotezy zerowej, że szereg należy do klasy DS, uogólniające procedurę Dickey’a-Fullera na sytuacje, gdy w okresie obserwacji w pewnym momencie Tb zachodzą w modelu zmiany strukturalne w postaci albo przesunięcie poziomu (model „załamania”) lub zmiana nachylenia trendu (model „zmiany wzrostu”) lub kombinacja tych dwóch zmian. Zakłada się, że moment Tb jest wyznaczany egzogenicznie – w tym sensie, że nie jest on wybierany na podstawie wizualnego badania wykresu szeregu, lecz jest powiązany z momentem znanej zmiany sytuacji gospodarczej na dużą skalę, która znacząco wpływa na zachowanie omawianej serii.

Hipotezę pierwiastka jednostkowego odrzuca się, jeśli zaobserwowana wartość statystyki testu ta jest niższa od poziomu krytycznego, tj. Jeśli

Rozkłady asymptotyczne i wartości krytyczne statystyki ta9 pierwotnie podane przez Perrona obowiązują dla modeli z wartościami odstającymi w zakresie innowacji.

Test Phillipsa-Perrona – kryterium sprowadzające testowanie hipotezy, że szereg xt należy do klasy szeregu DS do testowania hipotezy R0: av = O w ramach modelu statystycznego

SM: kxt=a + f3t + (pxt_x+un t = 2,...,T,

gdzie, podobnie jak w kryterium Dickeya-Fullera, parametry a p można przyjąć jako równe zeru.

Jednakże w przeciwieństwie do kryterium Dickeya-Fullera dopuszczona jest szersza klasa szeregów czasowych.

Kryterium opiera się na statystyce G w celu sprawdzenia hipotezy H0:<р = О, но использует вариант этой статистики Zn скорректированный на возможную автокоррелированность и гетероскедастичность ряда иг

Test Schmidta-Phillipsa – kryterium testowania hipotezy pierwiastka jednostkowego w modelu

gdzie wt = jSwt_x + st; t - 2,G;

y/ - parametr reprezentujący poziom; £ to parametr reprezentujący trend.

Kryterium DF-GLS (test DF-GLS) jest kryterium, które jest asymptotycznie silniejsze niż kryterium Dickeya-Fullera.

Kurtoza jest współczynnikiem szczytu dystrybucji.

Addytywny model wartości odstających to model, w którym po przekroczeniu daty przełamania Tb szereg yt natychmiast zaczyna oscylować wokół nowego poziomu (lub nowej linii trendu).

Model wartości odstających innowacji to model, w którym po przekroczeniu daty przełamania Tv proces dopiero stopniowo osiąga nowy poziom (lub nową linię trendu), wokół którego trajektoria szeregu zaczyna się oscylować.

Wielowymiarowa procedura testowania hipotezy pierwiastka jednostkowego (Dolado, Jenkinson, Sosvilla-Rivero) - sformalizowana procedura stosowania kryteriów Dickeya-Fullera z sekwencyjnym sprawdzaniem możliwości redukcji pierwotnego modelu statystycznego, za który model ten jest uważany

PAxt = a + fit + (pxt_x + ^0jAxt-j +£7> t = P + h---9T.

Warunkiem stosowania sformalizowanej procedury wielowymiarowej jest niska moc testów pierwiastka jednostkowego. Dlatego procedura wielowymiarowa obejmuje wielokrotne testowanie hipotezy pierwiastka jednostkowego w prostszych modelach z mniejszą liczbą parametrów do oszacowania. Zwiększa to prawdopodobieństwo prawidłowego odrzucenia hipotezy pierwiastka jednostkowego, ale wiąże się z utratą kontroli nad poziomem istotności procedury.

Uogólniony test Perrona – bezwarunkowe kryterium zaproponowane przez Zivota i Andrewsa (dotyczące emisji innowacyjnych), w którym datowanie punktu zmiany reżimu przeprowadza się w „trybie automatycznym”, przeszukując wszystkie możliwe opcje datowania i obliczając dla każdego datowania opcja / -statistics ta do testowania hipotezy pierwiastka jednostkowego; Za szacunkową datę przyjmuje się tę, dla której wartość ta jest minimalna.

Procedura Cochrane’a, test współczynnika wariancji – procedura pozwalająca na rozróżnienie serii TS i/)5 na podstawie ich specyficznego zachowania

szereg relacji VRk = -, gdzie Vk = -D(Xt -Xt_k).

Standardowy ruch Browna jest procesem losowym W(r) o czasie ciągłym, będącym ciągłym odpowiednikiem dyskretnego spaceru losowego. Jest to proces, podczas którego:

przyrosty (W(r2) W(r()),(W(rk) W(rk_x)) są łącznie niezależne, jeśli 0< rx < г2 < ... < гк и W(s) W(r) ~ N(0, s г) при s >G;

Realizacje procesu W(r) są ciągłe z prawdopodobieństwem 1.

Rozmiar okna to liczba przykładowych autokowariancji szeregu wykorzystanych w estymatorze Neweya-Westa dla długoterminowej wariancji szeregu. Niewystarczająca szerokość okna prowadzi do odchyleń od nominalnej wielkości kryterium (poziom istotności). Jednocześnie zwiększenie szerokości okna w celu uniknięcia odchyleń od nominalnej wielkości kryterium prowadzi do zmniejszenia mocy kryterium.

Dwuwymiarowy biały szum Gaussa to sekwencja niezależnych wektorów losowych o identycznym rozkładzie, mających dwuwymiarowy rozkład normalny z zerowym oczekiwaniem matematycznym.

Kointegracja deterministyczna (kointegracja stochastyczna) to istnienie grupy zintegrowanych szeregów ich liniowej kombinacji, znoszącej trendy stochastyczne i deterministyczne. Szereg reprezentowany przez tę kombinację liniową jest stacjonarny.

Identyfikacja wektorów kointegrujących polega na wyborze podstawy przestrzeni kointegrującej, składającej się z wektorów kointegrujących, które mają rozsądną interpretację ekonomiczną.

Przestrzeń kointegrująca to zbiór wszystkich możliwych wektorów kointegrujących dla kointegrującego układu szeregów.

Kointegrowane szeregi czasowe, kointegrowane szeregi czasowe w wąskim znaczeniu, to grupa szeregów czasowych, dla których istnieje nietrywialna liniowa kombinacja tych szeregów, czyli szereg stacjonarny.

Wektor kointegrujący jest wektorem współczynników nietrywialnej kombinacji liniowej kilku szeregów, czyli szeregiem stacjonarnym.

Test maksymalnej wartości własnej jest kryterium, które w procedurze Johansena służącej do szacowania stopnia kointegracji g układu szeregów zintegrowanych (rzędu 1) służy do sprawdzenia hipotezy H0: r = r* względem hipotezy alternatywnej HA: r = r* + 1.

Test śladowy to kryterium, które w procedurze Johansena służącej do szacowania stopnia kointegracji g układu szeregów zintegrowanych (rzędu 1) służy do sprawdzenia hipotezy H0: r = r* względem hipotezy alternatywnej HA: r > g* .

Typowe trendy to grupa szeregów kontrolujących stochastyczną niestacjonarność układu skointegrowanych szeregów.

Przyczynowość Grangera to fakt poprawy jakości prognozy wartości yt zmiennej Y w chwili t na podstawie sumy wszystkich przeszłych wartości tej zmiennej, biorąc pod uwagę przeszłe wartości jakiejś innej zmiennej.

Pięć sytuacji w procedurze Johansena - pięć sytuacji, od których zależą wartości krytyczne statystyki kryteriów ilorazu wiarygodności stosowanej w procedurze Johansena do szacowania stopnia kointegracji układu szeregów scalonych (rzędu 1):

H2(d): w danych nie ma deterministycznych trendów, w SE nie uwzględniono ani stałej, ani trendu;

H*(g): w danych nie ma deterministycznych trendów,

CE zawiera stałą, ale nie zawiera trendu;

Hx (g): dane mają deterministyczny trend liniowy, CE zawiera stałą, ale nie zawiera trendu;

Н*(r) w danych występuje deterministyczny trend liniowy, w SE uwzględnia się trend stały i liniowy;

N(g): dane mają deterministyczny trend kwadratowy, CE obejmuje trend stały i liniowy.

(Tutaj CE jest równaniem kointegracji.)

Dla ustalonej rangi r wymienionych 5 sytuacji tworzy łańcuch zagnieżdżonych hipotez:

H2(g) z H*(g) z I, (g) z Ng) z H(g).

Dzięki temu można, wykorzystując kryterium ilorazu wiarygodności, sprawdzić spełnienie hipotezy znajdującej się po lewej stronie tego łańcucha w ramach hipotezy znajdującej się bezpośrednio po prawej stronie.

Ranga kointegrująca to maksymalna liczba liniowo niezależnych wektorów kointegrujących dla danej grupy szeregów, ranga przestrzeni kointegrującej.

Kointegracja stochastyczna to istnienie grupy zintegrowanych szeregów kombinacji liniowej, która znosi trend stochastyczny. Szereg reprezentowany przez tę kombinację liniową nie zawiera trendu stochastycznego, ale może mieć trend deterministyczny.

Układ trójkątny Phillipsa jest reprezentacją układu TV szeregów kointegrowanych o randze kointegracji r w postaci układu równań, z których pierwsze r opisuje zależność r wybranych zmiennych od pozostałych (N r) zmiennych (tendencje ogólne) , a pozostałe równania opisują modele generowania ogólnych trendów.

TV-wymiarowy biały szum Gaussa (N-wymiarowy biały szum Gaussa) to sekwencja niezależnych, losowych wektorów o identycznym rozkładzie, mających TV-wymiarowy rozkład normalny z zerowymi oczekiwaniami matematycznymi.

asymptotycznie optymalne

  • - koncepcja mówiąca, że ​​oszacowanie jest bezstronne w granicach. Niech będzie ciągiem zmiennych losowych w przestrzeni prawdopodobieństwa, gdzie R jest jedną z miar rodziny...

    Encyklopedia matematyczna

  • - koncepcja stwierdzająca bezstronność kryterium w granicy...

    Encyklopedia matematyczna

  • - rozwiązanie układu różniczkowego, które jest stabilne Lapunowa i przyciąga wszystkie inne rozwiązania o wystarczająco bliskich wartościach początkowych...

    Encyklopedia matematyczna

  • - koncepcja rozszerzająca ideę efektywnej estymacji na przypadek dużych próbek. Jednoznaczna definicja A. e. O. nie ma. Na przykład w klasyce opcja, o której mówimy, jest asymptotyczna...

    Encyklopedia matematyczna

  • - pożądane, celowe...

    Odwołaj się do słownika komercyjnego

  • - 1. najlepszy, najkorzystniejszy, najbardziej odpowiedni do określonych warunków i zadań 2...

    Duży słownik ekonomiczny

  • - najkorzystniej, najlepiej jak to możliwe...

    Wielka encyklopedia radziecka

  • - najlepszy, najbardziej odpowiedni do określonych warunków i zadań...

    Nowoczesna encyklopedia

  • - najlepszy, najbardziej odpowiedni do określonych warunków i zadań...

    Duży słownik encyklopedyczny

  • - ...
  • - ...

    Słownik ortografii – podręcznik

  • - ...

    Słownik ortografii – podręcznik

  • - ...

    Słownik ortografii – podręcznik

  • - ...

    Słownik ortografii – podręcznik

  • - ...

    Słownik ortografii – podręcznik

  • - ...

    Słownik ortografii – podręcznik

„asymptotycznie optymalne” w książkach

Optymalny kontrast wizualny (OVC)

Z książki Kolor i kontrast. Technologia i kreatywny wybór autor Żeleznyakow Walentin Nikołajewicz

Optymalny kontrast wizualny (OVC) Wyobraź sobie czarny garnitur oświetlony słońcem i białą koszulę oświetloną księżycem. Jeśli zmierzymy przyrządem ich jasność, okaże się, że w tych warunkach czarny garnitur jest wielokrotnie jaśniejszy od białej koszuli, a przecież wiemy, że

Jaka jest optymalna skala?

Z książki Twitonomika. Wszystko, co musisz wiedzieć o ekonomii, krótko i na temat przez Comptona Nicka

Jaka jest optymalna skala? Autorem koncepcji skali optymalnej jest niemiecko-brytyjski filozof Fritz Schumacher, autor książki „Mniej znaczy lepiej: ekonomia jako istota ludzka”. Stwierdził, że kapitalistyczna tendencja do „gigantyzmu” to nie tylko

8.4.2. Optymalna ścieżka wzrostu

Z książki Teoria ekonomii: podręcznik autor Makhovikova Galina Afanasjewna

8.4.2. Optymalna ścieżka wzrostu Załóżmy, że ceny surowców pozostają niezmienione, a budżet przedsiębiorstwa stale rośnie. Łącząc punkty styczne izokwantów z izokosztami, otrzymujemy linię 0G - „ścieżkę rozwoju” (ścieżkę wzrostu). Linia ta pokazuje tempo wzrostu wskaźnika

Najlepsza opcja

Z książki ZSRR: od ruiny do potęgi światowej. Przełom sowiecki autorstwa Boffy Giuseppe

Opcja optymalna W ogniu bitew 1928 roku narodził się pierwszy plan pięcioletni. Od 1926 roku dwie instytucje, Gosplan i WSNKh, przygotowywały jeden po drugim różne projekty planów. Ich rozwojowi towarzyszyły ciągłe dyskusje. Jako jeden schemat

OPTYMALNA OPCJA

Z książki Rosyjski rock. Mała encyklopedia autor Bushueva Swietłana

Optymalny

Z książki Wielka radziecka encyklopedia (OP) autora TSB

Optymalny porządek

Z książki CSS3 dla projektantów stron internetowych przez Siderholma Dana

Optymalna kolejność Korzystając z przedrostków przeglądarki, należy pamiętać o kolejności, w jakiej wyświetlane są właściwości. Możesz zauważyć, że w poprzednim przykładzie najpierw zapisano właściwości przedrostkowe, a po nich właściwość bez prefiksu.

Optymalna osoba

Z książki Computerra Magazine nr 40 z 31 października 2006 r autor Magazyn Computerra

Osoba optymalna Autor: Władimir Guriew Niektóre tematy, które były popularne jakieś czterdzieści lat temu, wydają się dziś tak marginalne, że prawie nie mówi się o nich poważnie. Jednocześnie – sądząc po tonie artykułów w popularnych magazynach – wydawały się one istotne i równe

Najlepsza opcja

Z książki Pierwsze uderzenie Stalina 1941 [Kolekcja] autor Kremlow Siergiej

Opcja optymalna Analiza możliwych scenariuszy rozwoju wydarzeń nieuchronnie skłania do zastanowienia się nad wyborem opcji optymalnej. Nie można powiedzieć, aby różne opcje „letnie”, czyli alternatywy związane z majem-czerwcem - lipcem 1941 r., napawały optymizmem. Nie, oni

Najlepsza opcja

Z książki Wielka Alternatywa Patriotyczna autor Isajew Aleksiej Waleriewicz

Opcja optymalna Analiza możliwych scenariuszy rozwoju wydarzeń nieuchronnie skłania do zastanowienia się nad wyborem opcji optymalnej. Nie można powiedzieć, aby różne opcje „letnie”, czyli alternatywy związane z majem – czerwcem – lipcem 1941 r., napawały optymizmem. Nie, oni

Optymalna kontrola

Z książki Poczucie własnej wartości u dzieci i młodzieży. Książka dla rodziców przez Eyestada Gyru

Optymalna kontrola Co oznacza trzymanie umiarkowanie mocno? Musisz to ustalić sama, bazując na wiedzy o własnym dziecku i warunkach środowiska, w którym żyjesz. W większości przypadków rodzice nastolatków starają się chronić swoje dzieci przed paleniem, piciem alkoholu,

Optymalny sposób

Z książki Paradoks perfekcjonisty przez Ben-Shahara Tala

Optymalna ścieżka Jesteśmy nieustannie bombardowani doskonałością. Adonis na okładce Men’s Health, Elena Piękna na okładce Vogue’a; kobiety i mężczyźni na ogromnym ekranie w ciągu godziny lub dwóch rozwiązują swoje konflikty, odgrywają idealną fabułę, oddają się idealnej miłości. Wszyscy słyszeliśmy

Optymalne podejście

Z książki Ekspert nr 07 (2013) autorski magazyn Expert

Podejście optymalne Siergiej Kostyajew, kandydat nauk politycznych, starszy pracownik naukowy w INION RAS Departament Obrony USA wydał miliard dolarów na niedziałający program komputerowy Foto: EPA Od 1 marca wydatki Pentagonu prawdopodobnie zostaną zmniejszone o 43 miliardy

Najlepsza opcja

Z książki Dwie pory roku autor Arsenyev L

Opcja optymalna - Powiedz mi, czy mądrze jest grać na kilku frontach jednocześnie? - dziennikarze zapytali Bazilewicza i Łobanowskiego na samym początku sezonu 75. „To oczywiście nierozsądne” – odpowiedzieli. - Ale to konieczne. Uważamy, że konieczne jest rozróżnienie znaczenia

Optymalna kontrola

Z książki Zarządzanie finansami osobistymi (rodzinnymi). Podejście systemowe autor Steinbock Michaił

Kontrola optymalna >> Przy kontroli optymalnej dzielimy wszystkie wydatki na dwie duże grupy: – „zwykłe” – wydatki regularne, – wydatki jednorazowe lub niestandardowe. Z kontroli optymalnej można skorzystać dopiero po kilku miesiącach szczegółowej kontroli.

Asymptotyczne zachowanie (lub asymptotyka) funkcji w pobliżu pewnego punktu a (skończonego lub nieskończonego) jest rozumiane jako charakter zmiany funkcji w miarę zbliżania się jej argumentu x do tego punktu. Zwykle starają się przedstawić to zachowanie za pomocą innej, prostszej i zbadanej funkcji, która w pobliżu punktu a z wystarczającą dokładnością opisuje zmianę interesującej nas funkcji lub ocenia jej zachowanie z jednej lub drugiej strony. W związku z tym pojawia się problem porównania charakteru zmiany dwóch funkcji w pobliżu punktu a, związanego z uwzględnieniem ich ilorazu. Szczególnie interesujące są przypadki, gdy dla x a obie funkcje są albo nieskończenie małe (nieskończenie małe), albo nieskończenie duże (nieskończenie duże). 10.1. Porównanie funkcji nieskończenie małych Głównym celem porównywania b.m. funkcje polegają na porównaniu charakteru ich zbliżania się do zera przy x a, czyli szybkości ich zbliżania się do zera. Niech b.m. dla x a funkcje a(i) i P(x) są niezerowe w pewnym przebitym sąsiedztwie (a) punktu a, a w punkcie a są równe zeru lub nie są określone. Definicja 10.1. Funkcje a(x) i 0(x) nazywane są b.m. tego samego rzędu dla a i zapisz og(a:) = w O (/?(«)) (symbol O czyta się jako „O duży”), jeśli przy x a istnieje niezerowa skończona granica stosunku a (x)//?(i), czyli oczywiście zgodnie z (7.24) obowiązuje Βi € R\(0), a obowiązuje zapis X^a0[a(x)). Symbol O ma własność przechodniości, tj. jeśli - faktycznie biorąc pod uwagę Definicję 10.1 i właściwość iloczynu funkcji (patrz (7.23)) mających skończone (w tym przypadku niezerowe) granice, otrzymamy ASYMPTOTYCZNE ZACHOWANIE FUNKCJI. funkcje Definicja 10.2 Funkcja a(x) wywołuje bm wyższego rzędu małości w porównaniu do (3(x) (lub względem /3(x)) dla x a i zapisuje) (symbol o jest odczytywany jako io mały jeśli granica stosunku a istnieje i jest równa zero.W tym przypadku również mówi się, że funkcja jest niższego rzędu małości w porównaniu z a(x) dla x a i zwykle pomija się słowo małość (jak w przypadku wyższego rzędu w Definicji 10.2. Oznacza to, że jeśli lim (wtedy funkcja /)(x) jest, zgodnie z Definicją 10.2, b.m. wyższego rzędu w porównaniu do a(x) dla x a i a(i) to b.m. niższy rząd w porównaniu do /3(x) dla x a, ponieważ w tym przypadku lijTi (fi(x)/ot(x)) . Możemy więc napisać Zgodnie z Twierdzeniem 7.3 o związku pomiędzy funkcją, jej granicą i b.m. funkcje z (10.3) wynika, że ​​ot) jest funkcją, b.m. Na. Stąd a(x), tj. wartości |a(z)| dla x bliskiego a wartości \0(x)\ są znacznie mniejsze. Innymi słowy, funkcja a(x) dąży do zera szybciej niż funkcja /?(x). Twierdzenie 10.1. Produkt każdego b.m. dla x a funkcje a(x) i P(x)) są różne od zera w pewnym przebitym sąsiedztwie punktu a, dla x-¥a b.m. funkcją wyższego rzędu w porównaniu do każdego z czynników. Rzeczywiście, zgodnie z definicją 10,2 b.m. wyższego rzędu (uwzględniając funkcje z definicji 7.10 b.m.), równości oznaczają ważność twierdzenia. Równania zawierające symbole O i o są czasami nazywane szacunkami asymptotycznymi. Definicja 10.3. Funkcje ot(x) i /3(x) nazywane są nieporównywalnymi b.m. dla x -¥ a, jeśli nie ma ani skończonej, ani nieskończonej granicy ich stosunku, tj. if $ lim a(x)/0(x) (p £ oraz $ lim 0(x)/a(x)). Przykład 10.1. A. Funkcje a(x) = x i /?(x) = sin2ar z definicji 10.1 - b.m. tego samego rzędu przy x 0, ponieważ biorąc pod uwagę (b. Funkcja a(x) = 1 -coss, z definicji 10.2, jest b.m. wyższego rzędu w porównaniu do 0(x) = x przy x 0, ponieważ przy biorąc pod uwagę c. Funkcja a(zz) = \/x jest niższego rzędu w porównaniu z fl(x) = x dla x 0, ponieważ g. Funkcje a(s) = = x zgodnie z Definicją 10.3 są nieporównywalne b.m. w x 0, ponieważ granica ASYMPTOTYCZNE ZACHOWANIE FUNKCJI Nie istnieje porównanie funkcji nieskończenie małych (ani skończonych, ani nieskończonych - patrz przykład 7.5). Funkcja potęgi x11 z wykładnikiem n 6 N, n > 1, jest w x i b.m. wyższy rząd w porównaniu do xn~1), tj. yapa = ao(a:n"*1), ponieważ lim (xL/xn"1) = Jeśli konieczny jest dokładniejszy opis porównawczy zachowania b.m. funkcje dla x - i jedna z nich jest wybierana jako swego rodzaju standard i nazywana główną. Oczywiście wybór głównego b.m. w pewnym stopniu dowolne (próbują wybrać prostsze: x dla x -*0; x-1 dla x -41; 1/x dla x ->oo itd.). Od stopni 0k(x) główny b.m. funkcje /)(x) z różnymi wykładnikami k > 0 (dla k ^ 0 0k(x) nie jest b.m.) tworzą powiązanie porównawcze do szacowania bardziej złożonego b.m. funkcje a(z). Definicja 10.4. Funkcja a(z) nazywana jest b.m. k-ty rząd małości względem (3(x) dla x a, a liczba k jest rzędu małości, jeśli funkcje a(z) i /Zk(x) są tego samego rzędu dla x a), tj. jeśli w tym przypadku zwykle pomija się słowo „małość”. Uwaga: 1) rząd k jednej funkcji b.m. względem drugiej może być dowolną liczbą dodatnią, 2) jeśli rząd funkcji a(x) względem /3( x) jest równe k, to rząd funkcji P(x) względem a(x) jest równy 1/k, 3) nie zawsze dla funkcji bm a(x), nawet porównywalnej ze wszystkimi potęgami /? *(x), możesz podać konkretną kolejność k. Przykład 10.2. A. Funkcja cosx zgodnie z definicją 10.4, - b.m. rząd k = 2 względem 0(x) = x dla x 0, ponieważ biorąc pod uwagę b. Spójrzmy na funkcje. Pokażmy, że dla dowolnego Rzeczywiście, zgodnie z (7.32). Zatem b.m. dla x -»+0 funkcja a1/1 jest porównywalna z xk dla dowolnego k > 0, ale dla tej funkcji nie jest możliwe wskazanie rzędu małości względem x. # Określ kolejność jednego b.m. funkcji względem innych nie zawsze jest łatwe. Możemy polecić następującą procedurę: 1) zapisz relację a(x)/0k(x) pod znakiem ograniczającym, 2) przeanalizuj zapisaną relację i spróbuj ją uprościć; 3) na podstawie znanych wyników przyjąć założenie o możliwej wartości k), przy której będzie istniała niezerowa, skończona granica; 4) sprawdzić założenie obliczając granicę. Przykład 10.3. Ustalmy rząd b.m. funkcje tgx - sin x względem x dla x -» 0, tj. Znajdźmy liczbę k > O taką, że mamy ASYMPTOTYCZNE ZACHOWANIE FUNKCJI. Porównanie funkcji nieskończenie małych. Na tym etapie wiedząc, że dla x 0, zgodnie z (7.35) i (7.36), (sinx)/x 1 i cosx -> 1 oraz biorąc pod uwagę (7.23) i (7.33) możemy wyznaczyć ten warunek ( 10.7) zostanie spełniony przy k = 3. Rzeczywiście, bezpośrednie obliczenie granicy przy k = 3 daje wartość A = 1/2: Należy zauważyć, że dla k > 3 otrzymujemy granicę nieskończoną, a na granicy będzie ona równa do zera.

Praca dyplomowa

Dlatego jedną z dróg rozwoju testowania hipotez statystycznych była droga „empirycznej” konstrukcji kryteriów, gdy budowane statystyki kryterium opierają się na pewnej zasadzie, genialnym pomyśle lub zdrowym rozsądku, ale jego optymalność nie jest gwarantowane. Aby uzasadnić wykorzystanie takich statystyk przy testowaniu hipotez względem określonej klasy alternatyw, najczęściej metodą...

  • 1. Informacje pomocnicze
    • 1. 1. Informacje z teorii statystyki C/- i V
    • 1. 2. Definicja i obliczenie wydajności Bahadura
    • 1. 3. O dużych odchyleniach statystyki II i V
  • 2. Kryteria symetrii Baringhouse-Hentze
    • 2. 1. Wstęp
    • 2. 2. Statystyka
    • 2. 3. Statystyka
  • 3. Kryteria wykładnicze
    • 3. 1. Wstęp
    • 3. 2. Statystyka I
    • 3. 3. Statystyka nr
  • 4. Kryteria normalności
    • 4. 1. Wstęp
    • 4. 2. Statystyka B^
    • 4. 3. Statystyka V^n
    • 4. 4. Statystyka V|)P
  • 5. Kryteria zgodności z prawem Cauchy'ego
    • 5. 1. Wstęp
    • 5. 2. Statystyka
    • 5. 3. Statystyka

Asymptotyczne właściwości symetrii i kryteria zgodności na podstawie charakteryzacji (esej, zajęcia, dyplom, test)

Niniejsza rozprawa konstruuje i bada kryteria dobroci dopasowania i symetrii w oparciu o właściwości charakteryzujące rozkłady, a także oblicza ich asymptotyczną względną efektywność dla szeregu alternatyw.

Konstrukcja kryteriów statystycznych i badanie ich właściwości asymptotycznych jest jednym z najważniejszych problemów statystyki matematycznej. Testując prostą hipotezę względem prostej alternatywy, problem rozwiązuje się za pomocą lematu Neymana-Pearsona, który, jak wiadomo, daje optymalne (najpotężniejsze) kryterium w klasie wszystkich kryteriów danego poziomu. Jest to test współczynnika wiarygodności.

Jednakże w przypadku trudniejszych i praktycznych problemów z testowaniem hipotez, obejmujących testowanie złożonych hipotez lub rozważanie złożonych alternatyw, rzadko istnieją jednakowo najsilniejsze testy, a rola testu ilorazu wiarygodności zmienia się znacząco. Statystyki ilorazu wiarygodności zwykle nie da się obliczyć wprost, traci ona swoją właściwość optymalności, a jej rozkład jest niestabilny pod wpływem zmian w modelu statystycznym. Co więcej, statystyk często nie jest w stanie w ogóle określić rodzaju alternatywy, bez czego konstruowanie kryteriów parametrycznych traci sens.

Dlatego jedną z dróg rozwoju testowania hipotez statystycznych była droga „empirycznej” konstrukcji kryteriów, gdy budowane statystyki kryterium opierają się na pewnej zasadzie, genialnym pomyśle lub zdrowym rozsądku, ale jego optymalność nie jest gwarantowane.

Typowymi przykładami takich statystyk są statystyka znakowa, statystyka x2 Pearsona (1900), statystyka Kołmogorowa (1933), która mierzy jednolitą odległość między empiryczną a prawdziwą funkcją rozkładu, współczynnik korelacji rang Kendalla (1938) lub współczynnik Bickela- Statystyka Rosenblatta (1973), oparta na ryzyku kwadratowym oceny gęstości jądrowej. Obecnie statystyka matematyczna posiada kilkadziesiąt statystyk „empirycznych” służących do testowania hipotez zgodności, symetrii, jednorodności, losowości i niezależności, a w literaturze pojawia się coraz więcej statystyk tego typu. Ogromna literatura poświęcona jest badaniu ich rozkładów dokładnych i granicznych, szacunkom szybkości zbieżności, dużych odchyleń, rozwinięć asymptotycznych itp.

Aby uzasadnić wykorzystanie takich statystyk przy testowaniu hipotez względem określonej klasy alternatyw, ich siłę najczęściej oblicza się za pomocą modelowania statystycznego. Jednakże w przypadku każdego spójnego kryterium moc dąży do jedności wraz ze wzrostem wielkości próby, a zatem nie zawsze ma charakter informacyjny. Głębszą analizę właściwości porównawczych statystyki można przeprowadzić w oparciu o koncepcję asymptotycznej efektywności względnej (ARE). Różne podejścia do obliczania AOE zaproponowali w połowie XX w. E. Pitman, J. Hodges i E. Lehman, R. Bahadur, G. Chernov i W. Kallenberg, wyniki rozwoju teorii AOE do połowy XX w. W monografii podsumowano lata 90. Istnieje powszechnie przyjęta opinia, że ​​syntezie nowych kryteriów powinna towarzyszyć nie tylko analiza ich właściwości, ale także obliczenie AOE w celu oceny ich jakości i przedstawienia świadomych zaleceń dotyczących ich stosowania w praktyce.

W artykule wykorzystano koncepcję konstruowania kryteriów w oparciu o charakteryzację rozkładów za pomocą własności równomiernej dystrybucji. Teoria charakterystyki wywodzi się z pracy D. Polyi opublikowanej w 1923 r. Następnie została rozwinięta w pracach I. Martsinkevicha, S. N. Bernsteina, E. Lukacha, Yu. V. Linnika, A.A. Singer, J. Darmois, V.P. Skitovich, S.R. Pao, A.M. Kagan, J. Galambos, S. Kotz, L. B. Klebanov i wielu innych matematyków. Literatura na ten temat jest obszerna, a obecnie istnieje kilka monografii poświęconych charakterystykom, np. , , , , , .

Pomysł konstruowania kryteriów statystycznych w oparciu o charakterystyki za pomocą właściwości równomiernej dystrybucji należy do Yu.V. Linnika. Na zakończenie swego obszernego dzieła napisał: „. można postawić kwestię skonstruowania kryteriów zgodności próby ze złożoną hipotezą, w oparciu o identyczny rozkład dwóch odpowiednich statystyk gi (xi> .xr) i g2(x, ¦¦¦xr) i w ten sposób zmniejszenie kwestionować kryterium jednorodności.”

Wróćmy do klasycznego twierdzenia Polyi, aby wyjaśnić na konkretnym przykładzie, jak to podejście może działać. W najprostszej formie twierdzenie to jest sformułowane w następujący sposób.

Twierdzenie Polyi. Niech X i Y będą dwoma niezależnymi i jednakowo rozłożonymi wyśrodkowanymi s. V. Następnie s. V. (X + Y)//2 i X mają identyczny rozkład wtedy i tylko wtedy, gdy prawo dystrybucji X jest normalne.

Załóżmy, że mamy próbkę wyśrodkowanych niezależnych obserwacji Xi, ., Xn i chcemy przetestować (złożoną) hipotezę zerową, że rozkład tej próbki jest normalny ze średnią 0 i pewną wariancją. Korzystając z naszej próbki, skonstruujmy zwykłą dystrybuantę empiryczną (d.f.) n

Fn(t) = n-^VD

Gn(t) = n~2? VD + Xj< iv^}, t <= R1. i, j=l

Na mocy twierdzenia Glivenki-Cantellego, które obowiązuje również dla V-statystycznego empirycznego d.f. , dla dużego n funkcja Fn(t) równomiernie zbliża się do d.f. F (t) = P (X< t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Jednak ten projekt, oparty na pomyśle Yu.V. Linnika, nie doczekał się prawie żadnego rozwoju, być może ze względu na trudności techniczne w konstruowaniu i analizie uzyskanych kryteriów. Innym powodem jest prawdopodobnie to, że charakterystyki rozkładów za pomocą właściwości równomiernej dystrybucji są nieliczne.

Znamy tylko kilka prac poświęconych w takim czy innym stopniu rozwojowi idei Yu.V. Linnika. Są to prace Baringhouse’a i Henze’go oraz Muliere’a i Nikitina, które zostaną omówione poniżej. Istnieją również prace, w których kryteria dobroci dopasowania dla określonych rozkładów są również konstruowane w oparciu o charakterystyki, ale nie w oparciu o równomierną dystrybucję, np. , , , , , , .

Najbardziej powszechnym zastosowaniem w literaturze jest scharakteryzowanie rozkładu wykładniczego za pomocą różnych wariantów właściwości braku pamięci , , , , , , .

Należy zauważyć, że w prawie wszystkich tych pracach (z wyjątkiem być może) AOE rozpatrywanych kryteriów nie jest obliczana ani omawiana. W tej pracy nie tylko badamy asymptotyczne właściwości znanych i proponowanych przez nas kryteriów opartych na charakterystyce, ale także obliczamy ich lokalne dokładne (lub przybliżone) AOE według Bahadura.

Zdefiniujmy teraz pojęcie AOE. Niech (Tn) i (1^) będą dwoma ciągami statystyk zbudowanymi z próby X,., Xn o rozkładzie Pd, gdzie w 0 C R1 i hipoteza zerowa Ho jest testowana: 9 € w C względem alternatywy A: w € &kopia-x = &kopia-6o. Niech Mm (a, P,0) będzie minimalną liczebnością próby X[,., Xn, dla której ciąg (Tn) przy danym poziomie istotności a > 0 osiąga potęgę /3< 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Ponieważ względnej wydajności jako funkcji trzech argumentów nie można wprost obliczyć nawet dla najprostszych statystyk, zwyczajowo bierze się pod uwagę granice:

Ptet, y (a,/?, 0), Ntet, y (a,/3,0).

W pierwszym przypadku otrzymuje się AOE według Bahadura, drugie ograniczenie wyznacza AOE według Hodgesa-Lehmana, zaś trzecie prowadzi do wyznaczenia AOE według Pitmana. Ponieważ w zastosowaniach praktycznych najciekawsze są przypadki o niskich poziomach istotności, dużych potęgach i bliskich alternatywach, wszystkie trzy definicje wydają się rozsądne i naturalne.

W tej pracy do porównania kryteriów będziemy używać AOE według Bahadura. Jest tego kilka powodów. Po pierwsze, sprawność Pitmana nadaje się głównie dla statystyk asymptotycznie normalnych i pod tym warunkiem pokrywa się z lokalną wydajnością Bacha-Dura , . Rozważamy nie tylko statystyki asymptotycznie normalne, ale także statystyki typu kwadratowego, dla których rozkład graniczny przy hipotezie zerowej różni się znacznie od normalnego, w związku z czym efektywność Pitmana nie ma zastosowania. Po drugie, AOE Hodgesa-Lehmana nie nadaje się do badania kryteriów dwustronnych, ponieważ wszystkie okazują się asymptotycznie optymalne, a dla kryteriów jednostronnych to AOE zwykle lokalnie pokrywa się z AOE Bahadura. Po trzecie, w ostatnim czasie poczyniono znaczny postęp w obszarze dużych odchyleń dla statystyk testowych, co jest kluczowe przy obliczaniu AOE Bahadura. Mamy tu na myśli duże odchylenia statystyk U i V opisane w ostatnich pracach i.

Przejdźmy teraz do przeglądu treści rozprawy. Rozdział pierwszy ma charakter pomocniczy. Zawiera niezbędne informacje teoretyczne i techniczne z teorii statystyki 11, teorii dużych odchyleń i teorii wydajności asymptotycznej według Bahadura.

Rozdział 2 poświęcony jest konstrukcji i badaniu kryteriów testowania hipotezy symetrii. Baringhouse i Henze zaproponowali ideę konstruowania kryteriów symetrii w oparciu o następującą elementarną charakterystykę.

Niech X i Y będą n.o.s.v.s mającymi ciągłą d.f. Następnie |X| i |max (X, Y)| identycznie rozłożone wtedy i tylko wtedy, gdy X i Y są symetrycznie rozmieszczone wokół zera.

Używamy tej charakterystyki do konstruowania nowych kryteriów symetrii. Przypomnijmy, że kilka klasycznych kryteriów symetrii (patrz rozdział 4) opiera się na charakteryzowaniu symetrii za pomocą jeszcze prostszej właściwości równomiernego rozkładu X i -X.

Wróćmy do charakterystyki Baringhouse’a-Hentze’a. Niech X, ., Xn obserwacje posiadające ciągłą d.f.<7. Рассмотрим проверку гипотезы симметрии:

H0: OD = 1 —<3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в >Alternatywa 0-skośna, tj. d(x-b) = 2f(x)F ($x), c > 0-alternatywa Lemana, tj. G(x-, 6) = F1+ e (x), 6 > 0 oraz alternatywa zanieczyszczenia , tj. G(x-6) = (1 - 6) F(x) + 6Fr+1(x), in > 0, r > 0, gdzie F (x) i f (x) są d.f. i gęstość pewnego rozkładu symetrycznego.

Zgodnie z powyższą charakterystyką, empiryczna df jest konstruowana w oparciu o |Xj|,., Xn, n

Hn (t) = n~2 J2 Tmax (X^Xk)<г}. На основе этих функций составляются статистики: лоо ):

Niech X uY będzie nieujemną i niezdegenerowaną n.o.s.v.s mającą df różniczkowalną przy zera. F i niech 0< а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Oprócz skonstruowania samego kryterium zgodności i zbadania jego właściwości asymptotycznych, interesujące jest obliczenie AOE nowego kryterium i zbadanie jego zależności od parametru a.

Drugie uogólnienie tej charakterystyki należy do Des. Formułujemy go na podstawie nowszych prac:

Niech Xi, ., Xm, m ^ 2 będzie nieujemne i niezdegenerowane i.s. r.v.s posiadające df różniczkowalne przy zera. F. Wtedy statystyki X i m minpfi, ., Xm) mają rozkład identyczny wtedy i tylko wtedy, gdy F jest a.f. prawo wykładnicze.

Niech Xx,., Xn będą niezależnymi obserwacjami mającymi d.f. Na podstawie sformułowanych powyżej charakterystyk możemy przetestować hipotezę wykładniczą Ho, która polega na tym, że (7 jest d.f. prawa wykładniczego. P, względem alternatywnej H, która polega na tym, że C f? pod słabymi dodatkowymi warunki.

Zgodnie z tymi charakterystykami konstruowana jest empiryczna wartość df. p = pVD< О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Proponujemy oprzeć kryteria sprawdzania wykładnictwa na statystyce: pkp = - c&bdquo-(*)] aop(1).

Jako alternatywy wybieramy standardowe alternatywy stosowane w literaturze dotyczącej testowania wykładniczego: alternatywę Weibulla z d(x) = (β + 1)xx(-x1+β), x ^ 0- alternatywę Makehamy z d(x) = ( 1 + 0(1 - exp (-x))) exp (-x - 0(exp (-x) - 1 + x)), x ^ 0 - alternatywa dla liniowości funkcji współczynnika awaryjności z d (x) = (1 + bx) exp[—x—^bx2], x^O.

Dla dwóch zaproponowanych powyżej statystyk zapisuje się rozkłady graniczne w ramach hipotezy zerowej:

Twierdzenie 3.2.1 Dla statystyki Uε dla n -* oo zachodzi zależność: gdzie Dz(a) jest zdefiniowane w (3.2.2). Twierdzenie 3.3.1 Dla statystyki n jako n -> oo zależność zachodzi

U0,(t + 1)2A1(t)), gdzie D4 (t) jest zdefiniowane w (3.3.6).

Ponieważ obie statystyki zależą od parametrów a i m, ustalamy, przy jakich wartościach parametrów AOE według Bahadura osiąga maksimum i znajdujemy te wartości. Dodatkowo konstruujemy alternatywę, w której maksimum osiągane jest w punkcie i φ ½.

Rozdział czwarty poświęcony jest testowaniu hipotezy normalności. Istnieje wiele charakterystyk prawa normalnego jako jednego z głównych praw teorii prawdopodobieństwa i statystyki matematycznej oraz dwie monografie poświęcone wyłącznie temu zagadnieniu. Rozważymy nieco uproszczoną wersję dobrze znanej charakterystyki i:

Niech Xr, X2, ., Xm będą wyśrodkowane n.o.s.v.s posiadające d.f. o stałe a, a-2,., am są takie, że 0< а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Niech X, ., Xn będzie próbką z d.f. G. Na podstawie tej charakterystyki możemy przetestować hipotezę główną R0, która głosi, że G jest d.f. prawo normalne Fa (x) = Ф (x/a), w porównaniu z alternatywą Hi, czyli G φ Fa. Konstruuje się zwykły empiryczny df. Gn i V-statystyczne d.f. n^

Bm, n (t) = n~t (E 1 + - +< *}),

1.¿-t=1 s

W dalszej części symbol a oznacza sumowanie wszystkich permutacji indeksów. Kryteria badania normalności można oprzeć na następujących statystykach:

B, n = Г dGn (t), J -00 oo

BmAt)-Gn(t)]dGn(t), oo

Kosz = G)