Asymptotické výberové kritériá. Asymptotické vlastnosti symetrie a kritériá zhody založené na charakterizácii

V moderných podmienkach neustále a intenzívne rastie záujem o analýzu dát v úplne iných oblastiach, akými sú biológia, lingvistika, ekonómia a samozrejme IT. Základom tejto analýzy sú štatistické metódy a každý sebarešpektujúci špecialista na dolovanie údajov im musí rozumieť.

Bohužiaľ, skutočne dobrá literatúra, ktorá môže poskytnúť matematicky presné dôkazy a jasné intuitívne vysvetlenia, nie je veľmi bežná. A tieto prednášky sú podľa mňa nezvyčajne dobré pre matematikov, ktorí rozumejú teórii pravdepodobnosti práve z tohto dôvodu. Vyučujú ich magistri na nemeckej univerzite Christian-Albrecht v programoch Matematika a Finančná matematika. A pre tých, ktorých zaujíma, ako sa tento predmet vyučuje v zahraničí, som preložil tieto prednášky. Preklad mi trval niekoľko mesiacov, prednášky som preriedil ilustráciami, cvičeniami a poznámkami pod čiarou k niektorým vetám. Podotýkam, že nie som profesionálny prekladateľ, ale jednoducho altruista a amatér v tejto oblasti, preto akceptujem akúkoľvek kritiku, ak bude konštruktívna.

O tomto sú v skratke prednášky:


Podmienené matematické očakávanie

Táto kapitola sa netýka priamo štatistiky, je však ideálna na začatie jej štúdia. Podmienené očakávanie je najlepšou voľbou na predpovedanie náhodného výsledku na základe už dostupných informácií. A to je tiež náhodná premenná. Tu uvažujeme o jeho rôznych vlastnostiach, ako je linearita, monotónnosť, monotónna konvergencia a iné.

Základy odhadu bodov

Ako odhadnúť distribučný parameter? Aké kritérium si mám na to zvoliť? Aké metódy by som mal použiť? Táto kapitola pomáha zodpovedať všetky tieto otázky. Tu uvádzame koncepty nestranného odhadu a rovnomerne nezaujatého odhadu minimálnej odchýlky. Vysvetľuje, odkiaľ pochádzajú chí-kvadrát a t-rozdelenia a prečo sú dôležité pri odhadovaní parametrov normálneho rozdelenia. Vysvetľuje, čo sú Rao-Kramerova nerovnosť a Fisherove informácie. Zavedený je aj koncept exponenciálnej rodiny, ktorý značne uľahčuje získanie dobrého odhadu.

Bayesovský a minimaxový odhad parametrov

Tu je popísaný odlišný filozofický prístup k hodnoteniu. V tomto prípade sa parameter považuje za neznámy, pretože ide o realizáciu určitej náhodnej premennej so známym (a priori) rozdelením. Pozorovaním výsledku experimentu vypočítame takzvané zadné rozdelenie parametra. Na základe toho môžeme získať Bayesovský odhad, kde je kritériom minimálna priemerná strata, alebo minimaxový odhad, ktorý minimalizuje maximálnu možnú stratu.

Dostatočnosť a úplnosť

Táto kapitola má vážny praktický význam. Dostatočná štatistika je taká funkcia vzorky, že na odhad parametra stačí uložiť len výsledok tejto funkcie. Takýchto funkcií je veľa a patrí medzi ne aj takzvaná minimálna dostatočná štatistika. Napríklad na odhad mediánu normálneho rozdelenia stačí uložiť len jedno číslo - aritmetický priemer za celú vzorku. Funguje to aj pre iné distribúcie, ako je distribúcia Cauchy? Ako pomôže dostatok štatistík pri výbere odhadov? Tu nájdete odpovede na tieto otázky.

Asymptotické vlastnosti odhadov

Snáď najdôležitejšou a nevyhnutnou vlastnosťou hodnotenia je jeho konzistentnosť, to znamená tendencia k skutočnému parametru s rastúcou veľkosťou vzorky. Táto kapitola popisuje, aké vlastnosti majú odhady, ktoré poznáme, získané štatistickými metódami popísanými v predchádzajúcich kapitolách. Zavádzajú sa pojmy asymptotická nezaujatosť, asymptotická účinnosť a Kullback-Leiblerova vzdialenosť.

Základy testovania

Okrem otázky, ako odhadnúť nám neznámy parameter, musíme nejako skontrolovať, či spĺňa požadované vlastnosti. Prebieha napríklad experiment na testovanie nového lieku. Ako viete, či je pri ňom vyššia pravdepodobnosť uzdravenia ako pri užívaní starých liekov? Táto kapitola vysvetľuje, ako sa takéto testy vytvárajú. Dozviete sa, čo je jednotne najsilnejší test, Neymanov-Pearsonov test, hladinu významnosti, interval spoľahlivosti a odkiaľ pochádza známy Gaussov test a t-test.

Asymptotické vlastnosti kritérií

Podobne ako hodnotenia, aj kritériá musia spĺňať určité asymptotické vlastnosti. Niekedy môžu nastať situácie, keď nie je možné skonštruovať požadované kritérium, avšak pomocou známej centrálnej limitnej vety zostrojíme kritérium, ktoré asymptoticky smeruje k nevyhnutnému. Tu sa dozviete, čo je hladina asymptotickej významnosti, metóda pravdepodobnostného pomeru a ako sú konštruované Bartlettov test a chí-kvadrát test nezávislosti.

Lineárny model

Túto kapitolu možno vnímať ako doplnok, a to aplikáciu štatistiky v prípade lineárnej regresie. Pochopíte, aké známky sú dobré a za akých podmienok. Dozviete sa, odkiaľ sa vzala metóda najmenších štvorcov, ako zostaviť testy a prečo je potrebná F-distribúcia.

Slovník pojmov

Do oddielu 7

Autokovariancia - pre stacionárny rad Xt kovariancia náhodných premenných Xt9 Xt+T9 y(t) Cov(Xn Xt+T).

Autokorelačný spoj -ACF - pre stacionárny rad Xt - postupnosť jeho autokorelácií p(t) = Corr(Xt9 Xt+ r), r = 0,1, 2,...

Autokorelácia, autokorelačný koeficient - pre stacionárny rad Xt korelačný koeficient náhodných veličín Xn Xt+T, p(t) = Corr(Xt, Xt+T).

Biely šum, proces bieleho šumu - stacionárny náhodný proces Xt s nulovým priemerom a nenulovým rozptylom,

pre ktoré Corr(Xt, Xs) = 0 pri t Ф s.

„Úspornejšie“ modely patria medzi určitý súbor alternatívnych modelov časových radov, modely s najmenším počtom odhadovaných koeficientov.

Časový rad - séria hodnôt nejakej premennej meraná v po sebe nasledujúcich bodoch v čase. Časovým radom sa rozumie aj náhodný proces s diskrétnym časom (náhodná postupnosť), ktorého realizáciou je pozorovaný rad hodnôt.

Vzorová autokorelačná funkcia (SACF - sample ACF) - sekvencia vzorových autokorelácií r (k), & = 0, 1,2, zostavená z existujúcej implementácie časového radu. Analýza tejto sekvencie pomáha identifikovať proces kĺzavého priemeru a jeho poradie.

Vzorová parciálna autokorelačná funkcia (SPACF-sample PACF) - sekvencia vzorových parciálnych autokorelácií rpart(k), k = 0, 1, 2, skonštruovaná z existujúcej implementácie časového radu. Analýza tejto sekvencie pomáha identifikovať proces kĺzavého priemeru a jeho poradie.

Vzorové autokorelácie sú odhady autokorelácií p(k) náhodného procesu, skonštruované z existujúcej implementácie časového radu. Jedna z možností na odhad autokorelácie p(k) má tvar:

T-kf?x " И)У t+k И) у (к) 1 t

kde p = x = - ^xt - odhad pre p = E(Xt), ] tk

y(k) = y](xt p)(xt+k p) - odhad pre autokovarianciu y(k).

Vzorové parciálne autokorelácie sú odhady parciálnych autokorelácií prap(t) náhodného procesu, skonštruované z existujúcej implementácie časového radu.

Gaussovský proces bieleho šumu je proces bieleho šumu, ktorého jednorozmerné distribúcie sú normálne distribúcie s nulovým matematickým očakávaním.

Gaussov náhodný proces - náhodný proces, pre ktorý pre akékoľvek celé číslo m > O a akúkoľvek množinu časov tx< t2 < ... < tm совместные распределения случайных величин Xti, Xtm являются m-мерными нормальными распределениями.

Inovácia je aktuálna hodnota náhodnej chyby na pravej strane vzťahu, ktorá určuje proces autoregresie Xr Inovácia nie je

koreluje s oneskorenými hodnotami Xt_k9 k= 1, 2, ... Po sebe idúce hodnoty inovácií (inovačná sekvencia) tvoria proces bieleho šumu.

Informačné kritérium Akaike (AIC) je jedným z kritérií pre výber „najlepšieho“ modelu spomedzi niekoľkých alternatívnych modelov. Medzi alternatívnymi hodnotami rádu autoregresného modelu sa vyberie hodnota, ktorá minimalizuje hodnotu

o 2k A1C(£) = 1n0£2+r,

Odhad rozptylu inovácií єг v modeli AR je v poriadku.

Kritérium Akaike asymptoticky nadhodnocuje (nadhodnocuje) skutočnú hodnotu k0 s nenulovou pravdepodobnosťou.

Hannan-Quinnove informačné kritérium (HQC) je jedným z kritérií výberu „najlepšieho“ modelu spomedzi niekoľkých alternatívnych modelov. Medzi alternatívnymi hodnotami rádu autoregresného modelu sa vyberie hodnota, ktorá minimalizuje hodnotu

UQ(k) = In a2k + k - ,

kde T je počet pozorovaní;

(t£ - odhad rozptylu inovácií st v modeli AR A>-tého rádu.

Kritérium má pomerne rýchlu konvergenciu k skutočnej hodnote k0 pri T -» oo. Pre malé hodnoty T však toto kritérium podhodnocuje poradie autoregresie.

Schwarzovo informačné kritérium (SIC) je jedným z kritérií výberu „najlepšieho“ modelu spomedzi niekoľkých alternatívnych modelov. Medzi alternatívnymi hodnotami rádu autoregresného modelu sa vyberie hodnota, ktorá minimalizuje hodnotu

SIC(£) = lno>2+Ar-,

kde T je počet pozorovaní;

A? - posúdenie rozptylu inovácií st v modeli AR rádu A:.

Korelogram - pre stacionárny rad: graf závislosti autokorelačných hodnôt p(t) stacionárneho radu od t. Korelogram sa tiež nazýva dvojica grafov uvedených v protokoloch analýzy údajov v rôznych balíkoch štatistickej analýzy: a graf vzorovej autokorelačnej funkcie a graf vzorovej parciálnej autokorelačnej funkcie. Prítomnosť týchto dvoch grafov pomáha identifikovať model ARMA generujúci dostupný súbor pozorovaní.

Backcasting je technika na získanie presnejšej aproximácie funkcie podmienenej pravdepodobnosti pri odhadovaní modelu kĺzavého priemeru MA(q):

Xt = et + bxst_x + b2st_2 + ... + bqet_q9 bq Ф0,

podľa pozorovaní xl9..., xt. Výsledok maximalizácie (bez bx, bl9 ..., bq) podmienenej pravdepodobnostnej funkcie zodpovedajúcej pozorovaným hodnotám xХ9х29 ...9хт pre pevné hodnoty є09 є_Х9 є_д+Х9 závisí od zvolených hodnôt b*0, е_є_д+1. Ak je proces MA(q) reverzibilný, potom môžeme dať 6*0 = є_х = ... = s_q+x = 0. Ale na zlepšenie kvality odhadu môžeme použiť metódu reverznej prognózy na „odhad“ hodnoty є09 e_Х9 є_д+х a použite odhadované hodnoty vo funkcii podmienenej pravdepodobnosti. Operátor oneskorenia (L)9 operátor spätného posunu - operátor definovaný vzťahom: LXt = Xt_x. Vhodné pre kompaktné zaznamenávanie modelov časových radov a pre formulovanie podmienok, ktoré zaisťujú určité vlastnosti série. Napríklad pomocou tohto operátora rovnica definujúca model ARMA(p, q).

Xt = Z ajxt-j + Z bj£t-j ><*Р*ъ>ych* Oh,

možno zapísať ako: a(L) Xt = b(b)єп kde

a(L) = 1 (axL + a2L2 + ... + apLp

b(L)=l+blL + b2L2 + ... + bqLq.

Problémom spoločných faktorov je prítomnosť spoločných faktorov v polynómoch a(L) a b(L)9 zodpovedajúcich komponentom AR a MA modelu ARMA:

Prítomnosť spoločných faktorov v špecifikácii modelu ARMA sťažuje praktickú identifikáciu modelu v rámci množstva pozorovaní.

Autoregresný proces prvého rádu (AR(1)) je náhodný proces, ktorého aktuálna hodnota je súčtom lineárnej funkcie procesnej hodnoty oneskorenej o jeden krok a náhodnej chyby, ktorá nekoreluje s minulými procesnými hodnotami. V tomto prípade postupnosť náhodných chýb vytvára proces bieleho šumu.

Autoregresný proces rádu p (autoregresný proces pth-rádu - AR(p)) je náhodný proces, ktorého aktuálna hodnota je súčtom lineárnej funkcie procesných hodnôt oneskorených o p krokov alebo menej a náhodnej chyby. nekorelujú s minulými procesnými hodnotami. V tomto prípade postupnosť náhodných chýb vytvára proces bieleho šumu.

Proces kĺzavého priemeru rádu q (proces kĺzavého priemeru qth-order - MA(g)) je náhodný proces, ktorého aktuálna hodnota je lineárnou funkciou aktuálnej hodnoty nejakého procesu bieleho šumu a hodnôt tohto proces bieleho šumu oneskorený o p krokov alebo menej.

Woldov rozklad je reprezentáciou široko stacionárneho procesu s nulovým matematickým očakávaním ako súčet procesu kĺzavého priemeru nekonečného poriadku a lineárne deterministického procesu.

Sezónna autoregresia prvého rádu (SAR(l) - sezónna autoregresia prvého rádu) je náhodný proces, ktorého aktuálna hodnota je lineárnou funkciou hodnoty tohto procesu oneskoreného o S krokov a náhodnej chyby nekorelovanej s minulé hodnoty procesu. V tomto prípade postupnosť náhodných chýb vytvára proces bieleho šumu. Tu S = 4 pre štvrťročné údaje, S = 12 pre mesačné údaje.

Sezónny kĺzavý priemer prvého rádu (SMA(l) - sezónny kĺzavý priemer prvého rádu) je náhodný proces, ktorého aktuálna hodnota sa rovná súčtu lineárnej funkcie aktuálnej hodnoty nejakého procesu bieleho šumu a hodnoty tohto procesu bieleho šumu oneskorený o S krokov. V tomto prípade postupnosť náhodných chýb vytvára proces bieleho šumu. Tu 5 = 4 pre štvrťročné údaje, 5 = 12 pre mesačné údaje.

Systém rovníc Yule - Walker je sústava rovníc, ktorá spája autokorelácie stacionárneho autoregresného procesu rádu p s jeho koeficientmi. Systém umožňuje dôsledne nájsť hodnoty autokorelácií a umožňuje pomocou prvých p rovníc vyjadriť koeficienty procesu stacionárnej autoregresie cez hodnoty prvých p autokorelácií, ktoré možno priamo použiť pri výber autoregresného modelu k reálnym štatistickým údajom.

Náhodný proces s diskrétnym časom (diskrétny stochastický proces, diskrétny náhodný proces) je postupnosť náhodných premenných zodpovedajúcich pozorovaniam uskutočneným v po sebe nasledujúcich okamihoch v čase, ktoré majú určitú pravdepodobnostnú štruktúru.

Proces zmiešaného autoregresného kĺzavého priemeru, autoregresný proces s rezíduami vo forme kĺzavého priemeru (autoregresívny kĺzavý priemer, zmiešaný autoregresný kĺzavý priemer - ARMA(p, q)) je náhodný proces, ktorého aktuálna hodnota je súčtom lineárna funkcia krokov oneskorených o hodnoty p alebo menej procesu a lineárna funkcia od aktuálnej hodnoty niektorého procesu bieleho šumu a hodnoty tohto procesu s oneskorením o q krokov alebo menej.

Box-Pierce Q-statistic – jedna z možností g-štatistiky:

Є = r£g2(*),

Ljung-Box Q-štatistika je jednou z možností g-štatistiky, ktorá je vhodnejšia ako štatistika Box-Pierce:

kde T je počet pozorovaní; r (k) - vzorové autokorelácie.

Používa sa na testovanie hypotézy, že pozorované údaje sú realizáciou procesu bieleho šumu.

Široko-zmyslový stacionárny, slabozmyslový stacionárny, slabo stacionárny, stacionárny druhého rádu, kovariančne-stacionárny stochastický proces - náhodný proces s konštantným matematickým očakávaním, konštantným rozptylom a invariantnými náhodnými veličinami Xt,Xt+T:

Cov(Xt,Xt+T) = r(r).

Striktne stacionárny, stacionárny v užšom zmysle (striktne stacionárny, striktne stacionárny) náhodný proces (stochastický proces) - náhodný proces so spoločnými rozdeleniami náhodných premenných Xh + T, ..., + T invariantných v r.

Podmienka reverzibility procesov MA(q) a ARMA(p, q) (podmienka invertibility) - pre procesy Xt tvaru MA(g): Xt = b(L)st alebo ARMA(p, q): a(L )(Xt ju ) = = b(L)st - podmienka na koreňoch rovnice b(z) = O, zabezpečujúca existenciu ekvivalentnej reprezentácie procesu Xt v podobe autoregresného procesu nekonečného rádu AR( oo):

Podmienka zvratnosti: všetky korene rovnice b(z) = O ležia mimo jednotkovej kružnice |z|< 1.

Stacionárna podmienka pre procesy AR(p) a ARMA(p, q) - pre procesy Xt tvaru AR(p): a(L)(Xt ju) = et alebo ARMA(p, q) a(L)( Xt ju) = = b(L)st - podmienka na koreňoch rovnice a(z) = 0, zabezpečujúca stacionárnosť procesu Xg Podmienka stacionárnosti: všetky korene rovnice b(z) = O ležia mimo jednotkovej kružnice |z|< 1. Если многочлены a(z) и b(L) не имеют общих корней, то это условие является необходимым и достаточным условием стационарности процесса Хг

Parciálna autokorelačná funkcia (PACF - parciálna autokorelačná funkcia) - pre stacionárny rad postupnosť parciálnych autokorelácií prap(r), m = 0, 1,2,...

Parciálna autokorelácia (PAC - parciálna autokorelácia) - pre stacionárny rad hodnota ppart(r) korelačného koeficientu medzi náhodnými premennými Xt nXt+k, očistená od vplyvu medziľahlých náhodných premenných Xt+l9...9Xt+k_Y.

Štádium diagnostiky modelu - diagnostika odhadovaného modelu ARMA, vybraného na základe dostupných sérií pozorovaní.

Fáza identifikácie modelu - výber modelu generovania série na základe dostupných sérií pozorovaní, určenie rádov p a q modelu ARMA.

Fáza vyhodnotenia modelu (estimation stage) - odhad koeficientov modelu ARMA, vybraných na základe dostupných sérií pozorovaní.

(Q-statistics) - testovacia štatistika používaná na testovanie hypotézy, že pozorované dáta sú implementáciou procesu bieleho šumu.

Do oddielu 8

Vektorová autoregresia rádu p (ph-order vector autoregression - VAR(p)) je model na generovanie skupiny časových radov, v ktorých aktuálna hodnota každého radu pozostáva z konštantnej zložky, lineárnych kombinácií oneskorených (až po rád). p) hodnoty tohto radu a iných sérií a náhodná chyba. Náhodné chyby v každej rovnici nekorelujú s oneskorenými hodnotami všetkých uvažovaných sérií. Náhodné vektory tvorené chybami v rôznych sériách súčasne sú nezávislé, identicky rozdelené náhodné vektory s nulovým priemerom.

Dlhodobý vzťah je určitý vzťah vytvorený v priebehu času medzi premennými, v súvislosti s ktorými dochádza k pomerne rýchlym osciláciám.

Dlhodobé multiplikátory (dlhodobé multiplikátory, rovnovážne multiplikátory) - v dynamickom modeli s autoregresne distribuovanými oneskoreniami - koeficienty cx,cs dlhodobej závislosti premennej od exogénnych premenných xi, xst. Koeficient Cj odráža zmenu hodnoty yt, keď sa aktuálna a všetky predchádzajúce hodnoty premennej xjt zmenia o jednu.

Impulzné multiplikátory (impact multiplikátor, short-run multiplikátor) - v dynamickom modeli s autoregresne rozdelenými oneskoreniami - hodnoty ukazujúce vplyv jednorazových (impulzných) zmien hodnôt exogénnych premenných chi, xst na prúdové resp. následné hodnoty premennej jr

Krížové kovariancie sú korelačné koeficienty medzi hodnotami rôznych zložiek vektorovej série v zhodných alebo divergentných bodoch v čase.

Krížová kovariančná funkcia je postupnosť krížových korelácií dvoch zložiek stacionárneho vektorového radu.

Modely s autoregresívnymi distribuovanými modelmi oneskorenia (ADL) sú modely, v ktorých aktuálna hodnota vysvetľovanej premennej je súčtom lineárnej funkcie niekoľkých oneskorených hodnôt tejto premennej, lineárnych kombinácií prúdu a niekoľkých oneskorených hodnôt vysvetľujúcich premenných. a náhodná chyba.

Prenosová funkcia je maticová funkcia, ktorá stanovuje vplyv jednotkových zmien v exogénnych premenných na endogénne premenné.

Proces generovania údajov (DGP) je pravdepodobnostný model, ktorý generuje pozorovateľné štatistické údaje. Proces generovania údajov je zvyčajne neznámy výskumníkovi, ktorý údaje analyzuje. Výnimkou sú situácie, keď si výskumník sám zvolí proces generovania údajov a umelé štatistické údaje získa simuláciou zvoleného procesu generovania údajov.

Štatistický model (SM) je model zvolený na vyhodnotenie, o ktorého štruktúre sa predpokladá, že zodpovedá procesu generovania údajov. Výber štatistického modelu sa uskutočňuje na základe existujúcej ekonomickej teórie, analýzy dostupných štatistických údajov a analýzy výsledkov predchádzajúcich štúdií.

Stacionárny vektorový (AG-rozmerný) rad (K-rozmerný stacionárny časový rad) - sekvencia náhodných vektorov dimenzie K, ktoré majú rovnaké vektory matematických očakávaní a rovnaké kovariančné matice, pre ktoré platí krížové korelácie (krížové korelácie) medzi hodnota k-tej zložky série v momente t a hodnota 1. zložky série v momente (t + s) závisí len od s.

Do oddielu 9

Hypotéza jednotkového koreňa (UR - unit root hypothesis) - hypotéza formulovaná v rámci modelu ARMA(^, q): a(L)Xt = b(L)cr Hypotéza, že autoregresný polynóm a(L) modelu ARMA má aspoň jeden koreň rovný 1. V tomto prípade sa zvyčajne predpokladá, že polynóm a(L) nemá korene, ktorých modul je menší ako 1.

Diferenciácia - prechod zo série úrovní Xt na sériu rozdielov Xt Xt_v Dôsledná diferenciácia radu umožňuje eliminovať stochastický trend prítomný v pôvodnom rade.

Integrovaný rad k - rad Xn, ktorý nie je stacionárny alebo stacionárny vzhľadom na deterministický trend (t. j. nie je radom TS) a pre ktorý je rad získaný ako výsledok ^-násobnej diferenciácie radu Xn stacionárny , ale séria získaná ako výsledok (k1)-násobnej diferenciácie radu Xr nie je séria HY.

Kointegračný vzťah je dlhodobý vzťah medzi viacerými integrovanými radmi, charakterizujúci rovnovážny stav systému týchto radov.

Model korekcie chýb je kombináciou krátkodobých a dlhodobých dynamických regresných modelov za prítomnosti kointegračného vzťahu medzi integrovanými sériami.

Operátor diferenciácie - operátor A, ktorý transformuje sériu úrovní Xt na sériu rozdielov:

Naddiferencovaný časový rad - rad získaný ako výsledok diferenciácie radu G5. Dôsledná diferenciácia radu GO pomáha eliminovať deterministický polynómový trend. Diferenciácia T-série má však niektoré nežiaduce dôsledky pri výbere modelu zo štatistických údajov a použití vybraného modelu na účely predpovedania budúcich hodnôt série.

Diferenčné stacionárne, LU-série (DS - diferenčné stacionárne časové rady) - integrované rady rôznych rádov k = 1,2, ... Sú redukované na stacionárny rad jednoduchou alebo viacnásobnou diferenciáciou, ale nemožno ich redukovať na stacionárny rad odpočítaním deterministického trendu.

Séria typu ARIMA(p, A, q) (ARIMA - autoregresívny integrovaný kĺzavý priemer) je časový rad, ktorý sa v dôsledku ^-násobnej diferenciácie redukuje na stacionárny rad ARMA(p, q).

Séria stacionárna vzhľadom na deterministický trend, séria G5

(TS - trend-stacionárne časové rady) - rady, ktoré sa stanú stacionárnymi po odčítaní deterministického trendu od nich. Do triedy takýchto radov patria aj stacionárne rady bez deterministického trendu.

Náhodná prechádzka, proces náhodnej chôdze - náhodný proces, ktorého prírastky tvoria proces bieleho šumu: AXt st, takže Xt = Xt_ x + єг

Random walk with drift, random walk with drift (random walk with drift) je náhodný proces, ktorého prírastky sú súčtom konštanty a procesu bieleho šumu: AXt = Xt Xt_ x = a + st, teda Xt = Xt_x + a + ег Konštanta a charakterizuje drift náhodných trajektórií chôdze, ktorý je neustále prítomný počas prechodu do nasledujúceho časového okamihu, na ktorý sa superponuje náhodná zložka.

Stochastický trend - časový rad Zt, pre ktorý

Z, = єх + є2 + ... + et. Hodnota náhodnej prechádzky v čase t je t

Xt = Х0 + ^ є8, takže Xt Х0 = єх + є2 + ... + єг Inými slovami, model

stochastický trend - proces náhodnej chôdze, „vyplývajúci z počiatku súradníc“ (pre to X0 = 0).

Šokové inovácie sú jednorazovou (impulznou) zmenou v inováciách.

Slutského efekt je efekt vytvárania falošnej periodicity pri diferenciácii série, ktorá je stacionárna vzhľadom na deterministický trend. Napríklad, ak je pôvodný rad súčtom deterministického lineárneho trendu a bieleho šumu, potom diferencovaný rad nemá deterministický trend, ale ukáže sa, že je autokorelovaný.

^-hypotéza (TS hypotéza) - hypotéza, že posudzovaný časový rad je stacionárny alebo séria stacionárna vzhľadom na deterministický trend.

Do oddielu 10

Dlhodobý rozptyl - pre sériu s nulovým matematickým očakávaním je definovaný ako limit

Var(ux +... + it)

G-yus T T-+OD

Dickey-Fullerove testy sú skupinou štatistických kritérií na testovanie hypotézy jednotkového koreňa v rámci modelov, ktoré predpokladajú nulové alebo nenulové matematické očakávanie časového radu, ako aj možnú prítomnosť deterministického trendu v rade.

Pri aplikácii Dickey-Fullerových kritérií sa najčastejšie vyhodnocujú štatistické modely

pAxt = a + (3t + cpxt_x + +є*> t = P + h---,T,

Axt =a + cpxt_x + ^0jAxt_j +£*, t = /7 + 1,..., Г,

Axt = cpxt_x + ]T 6j Axt_j +єп t = p +1,..., T.

Hodnoty /-štatistiky / získané pri vyhodnocovaní týchto štatistických modelov na testovanie hypotézy H0: cp = O sa porovnávajú s kritickými hodnotami /krit v závislosti od výberu štatistického modelu. Hypotéza jednotkového koreňa je zamietnutá, ak f< /крит.

Kwiatkowski-Phillips-Schmidt-Shin test (KPSS test) je kritériom na rozlíšenie DS a Г5-série, v ktorom sa ha-hypotéza berie ako nulová.

Leybournov test je kritériom na testovanie jednotkovej koreňovej hypotézy, ktorej štatistika sa rovná maximu dvoch hodnôt Dickey-Fullerovej štatistiky získaných z pôvodnej série a z časovo obrátenej série.

Perronov test – kritérium na testovanie nulovej hypotézy, že séria patrí do triedy DS, zovšeobecňuje Dickey-Fullerov postup na situácie, keď počas obdobia pozorovania dôjde k štrukturálnym zmenám v modeli v určitom časovom bode Tb vo forme buď posun úrovne (model „kolapsu“) alebo zmena sklonu trendu (model „zmeny rastu“) alebo kombinácia týchto dvoch zmien. Predpokladá sa, že moment Tb je určený exogénne – v tom zmysle, že nie je vybraný na základe vizuálneho skúmania sériovej krivky, ale je spojený s momentom známej rozsiahlej zmeny ekonomickej situácie, ktorá výrazne ovplyvňuje správanie uvažovanej série.

Hypotéza jednotkového koreňa je zamietnutá, ak je pozorovaná hodnota štatistiky testu ta pod kritickou úrovňou, t.j. Ak

Asymptotické distribúcie a kritické hodnoty pre štatistiku ta9 pôvodne zadané spoločnosťou Perron sú platné pre modely s inovačnými odľahlými hodnotami.

Phillipsov-Perronov test - kritérium, ktoré redukuje testovanie hypotézy, že rad xt patrí do triedy DS-sérií, na testovanie hypotézy R0: av = O v rámci štatistického modelu

SM: kxt=a + f3t + (pxt_x+un t = 2,...,T,

kde, ako v Dickey-Fullerovom kritériu, parametre an p možno považovať za rovné nule.

Na rozdiel od Dickeyho-Fullerovho kritéria je však povolená širšia trieda časových radov.

Kritérium je založené na G-štatistike na testovanie hypotézy H0:<р = О, но использует вариант этой статистики Zn скорректированный на возможную автокоррелированность и гетероскедастичность ряда иг

Schmidt-Phillipsov test - kritérium na testovanie hypotézy jednotkového koreňa v rámci modelu

kde wt = jSwt_x + st; t = 2,G;

y/ - parameter reprezentujúci úroveň; £ je parameter predstavujúci trend.

Kritérium DF-GLS (test DF-GLS) je kritérium, ktoré je asymptoticky účinnejšie ako kritérium Dickey-Fuller.

Kurtóza je koeficient distribúcie vrcholiaci.

Aditívny model odľahlej hodnoty je model, v ktorom po prekročení dátumu zlomu Tb séria yt okamžite začne oscilovať okolo novej úrovne (alebo novej trendovej línie).

Inovačný odľahlý model je model, v ktorom proces yt po prechode cez dátum prerušenia Tv len postupne dosiahne novú úroveň (alebo novú trendovú líniu), okolo ktorej začne oscilovať trajektória série.

Viacrozmerná procedúra na testovanie hypotézy jednotkového koreňa (Dolado, Jenkinson, Sosvilla-Rivero) - formalizovaná procedúra na použitie Dickey-Fullerových kritérií so sekvenčnou kontrolou možnosti redukcie pôvodného štatistického modelu, za ktorý sa model považuje.

PAxt = a + fit + (pxt_x + ^0jAxt-j +£7> t = P + h---9T.

Predpokladom pre použitie formalizovanej multivariačnej procedúry je nízka sila testov jednotkového koreňa. Preto multivariačný postup zahŕňa opakované testy hypotézy jednotkového koreňa v jednoduchších modeloch s menším počtom parametrov na odhad. To zvyšuje pravdepodobnosť správneho odmietnutia hypotézy jednotkového koreňa, ale je sprevádzané stratou kontroly nad úrovňou významnosti postupu.

Generalizovaný Perronov test - bezpodmienečné kritérium navrhnuté Zivotom a Andrewsom (týkajúce sa inovatívnych emisií), v ktorom sa datovanie bodu zmeny režimu vykonáva v „automatickom režime“, prehľadávaním všetkých možných možností datovania a výpočtom pre každé datovanie voľba / -štatistika ta na testovanie hypotézy koreňovej jednotky; Za odhadovaný dátum sa považuje dátum, pre ktorý je hodnota ta minimálna.

Cochranov postup, test variačného pomeru - postup na rozlíšenie TS a /)5-série, založený na špecifickom správaní týchto

séria vzťahu VRk = -, kde Vk = -D(Xt -Xt_k).

Štandardný Brownov pohyb je náhodný proces W(r) so spojitým časom, ktorý je spojitým analógom diskrétnej náhodnej prechádzky. Ide o proces, pri ktorom:

prírastky (W(r2) W(r()),(W(rk) W(rk_x)) sú spoločne nezávislé, ak 0< rx < г2 < ... < гк и W(s) W(r) ~ N(0, s г) при s >G;

realizácie procesu W(r) sú spojité s pravdepodobnosťou 1.

Veľkosť okna je počet vzorových autokovariancií radu použitých v odhade Newey-West pre dlhodobý rozptyl radu. Nedostatočná šírka okna vedie k odchýlkam od nominálnej veľkosti kritéria (úroveň významnosti). Súčasne zväčšenie šírky okna, aby sa predišlo odchýlkam od nominálnej veľkosti kritéria, vedie k zníženiu sily kritéria.

Dvojrozmerný Gaussov biely šum je sekvencia nezávislých, identicky distribuovaných náhodných vektorov s dvojrozmerným normálnym rozložením s nulovým matematickým očakávaním.

Deterministická kointegrácia (stochastická kointegrácia) je existencia pre skupinu integrovaných radov ich lineárnej kombinácie, ktorá ruší stochastické a deterministické trendy. Séria reprezentovaná touto lineárnou kombináciou je stacionárna.

Identifikácia kointegračných vektorov je výber základu pre kointegračný priestor pozostávajúci z kointegrujúcich vektorov, ktoré majú rozumnú ekonomickú interpretáciu.

Kointegračný priestor je množina všetkých možných kointegračných vektorov pre kointegračný systém radov.

Kointegrovaný časový rad, kointegrovaný časový rad v užšom zmysle, je skupina časových radov, pre ktoré existuje netriviálna lineárna kombinácia týchto radov, ktorá je stacionárnym radom.

Kointegračný vektor je vektor koeficientov netriviálnej lineárnej kombinácie viacerých radov, ktorý je stacionárnym radom.

Test maximálnej vlastnej hodnoty je kritérium, ktoré sa v Johansenovom postupe na odhadnutie kointegračnej hodnosti g systému integrovaných (poradie 1) radov používa na testovanie hypotézy H0: r = r* oproti alternatívnej hypotéze HA: r = r* + 1.

Stopový test je kritérium, ktoré sa v Johansenovom postupe na odhadnutie kointegračného poradia g systému integrovaných (poradie 1) radov používa na testovanie hypotézy H0: r = r* oproti alternatívnej hypotéze HA: r > g* .

Spoločné trendy sú skupina radov, ktoré riadia stochastickú nestacionárnosť systému kointegrovaných radov.

Grangerova kauzalita je skutočnosť zlepšenia kvality predpovede hodnoty yt premennej Y v čase t na základe súhrnu všetkých minulých hodnôt tejto premennej, pričom sa zohľadňujú minulé hodnoty nejakej inej premennej.

Päť situácií v Johansenovom postupe - päť situácií, od ktorých závisia kritické hodnoty štatistiky pravdepodobnostných kritérií používaných v Johansenovom postupe na odhad kointegračného poradia systému integrovaných (poradie 1) radov:

H2(d): v údajoch nie sú žiadne deterministické trendy, v SE nie sú zahrnuté konštanty ani trend;

H*(g): v údajoch nie sú žiadne deterministické trendy,

CE zahŕňa konštantu, ale nezahŕňa trend;

Hx (g): údaje majú deterministický lineárny trend, CE zahŕňa konštantu, ale nezahŕňa trend;

Н*(r) v údajoch je deterministický lineárny trend, v SE je zahrnutý konštantný a lineárny trend;

N(g): údaje majú deterministický kvadratický trend, CE zahŕňa konštantný a lineárny trend.

(Tu CE je kointegračná rovnica.)

Pre pevnú pozíciu r tvorí uvedených 5 situácií reťaz vnorených hypotéz:

H2(g) s H*(g) s I, (g) s Ng) s H(g).

To umožňuje pomocou kritéria pravdepodobnosti otestovať splnenie hypotézy umiestnenej vľavo v tomto reťazci v rámci hypotézy umiestnenej bezprostredne vpravo.

Kointegračná hodnost je maximálny počet lineárne nezávislých kointegračných vektorov pre danú skupinu radov, hodnosť kointegračného priestoru.

Stochastická kointegrácia je existencia pre skupinu integrovaných radov lineárnej kombinácie, ktorá ruší stochastický trend. Séria reprezentovaná touto lineárnou kombináciou neobsahuje stochastický trend, ale môže mať deterministický trend.

Phillipsov trojuholníkový systém je reprezentáciou TV systému kointegrovaných radov s kointegračným poradím r vo forme sústavy rovníc, z ktorých prvé r popisuje závislosť r vybraných premenných od zvyšných (N r) premenných (všeobecné trendy) a zvyšné rovnice popisujú modely na generovanie všeobecných trendov.

TV-dimenzionálny Gaussov biely šum (N-dimentional Gaussian white noise) je sekvencia nezávislých, identicky distribuovaných náhodných vektorov, ktoré majú TV-rozmerné normálne rozdelenie s nulovým matematickým očakávaním.

asymptoticky optimálne

  • - pojem, ktorý hovorí, že odhad je neskreslený v limite. Nech je postupnosť náhodných premenných na pravdepodobnostnom priestore, kde R je jednou z mier rodiny...

    Matematická encyklopédia

  • - koncept, ktorý presadzuje nezaujatosť kritéria v limite...

    Matematická encyklopédia

  • - riešenie diferenciálneho systému, ktorý je Ljapunov stabilný a priťahuje všetky ostatné riešenia s dostatočne blízkymi počiatočnými hodnotami...

    Matematická encyklopédia

  • - koncept, ktorý rozširuje myšlienku efektívneho odhadu na prípad veľkých vzoriek. Jednoznačná definícia A. e. O. nemá. Napríklad v klasike možnosť hovoríme o asymptotickej...

    Matematická encyklopédia

  • - žiaduce, účelné...

    Referenčný komerčný slovník

  • - 1. najlepšie, najpriaznivejšie, najvhodnejšie pre určité podmienky a úlohy 2...

    Veľký ekonomický slovník

  • - najvýhodnejšie, najlepšie možné...

    Veľká sovietska encyklopédia

  • - najlepšie, najvhodnejšie pre určité podmienky a úlohy...

    Moderná encyklopédia

  • - najlepšie, najvhodnejšie pre určité podmienky a úlohy...

    Veľký encyklopedický slovník

  • - ...
  • - ...

    Slovník pravopisu-príručka

  • - ...

    Slovník pravopisu-príručka

  • - ...

    Slovník pravopisu-príručka

  • - ...

    Slovník pravopisu-príručka

  • - ...

    Slovník pravopisu-príručka

  • - ...

    Slovník pravopisu-príručka

„asymptoticky optimálne“ v knihách

Optimálny vizuálny kontrast (OVC)

Z knihy Farba a kontrast. Technológia a kreatívny výber autora Zheleznyakov Valentin Nikolajevič

Optimálny vizuálny kontrast (OVC) Predstavte si čierny oblek osvetlený slnkom a bielu košeľu osvetlenú mesiacom. Ak zmeriame ich jas prístrojom, ukáže sa, že za týchto podmienok je čierny oblek mnohonásobne jasnejší ako biela košeľa, a predsa vieme, že

Aká je optimálna mierka?

Z knihy Twitonomika. Všetko, čo potrebujete vedieť o ekonomike, stručne a k veci od Comptona Nicka

Aká je optimálna mierka? Autorom konceptu optimálnej mierky je nemecko-britský filozof Fritz Schumacher, autor knihy „Menej je lepšie: Ekonomika ako ľudská esencia.“ Povedal, že kapitalistický sklon k „gigantizmu“ nie je len

8.4.2. Optimálna dráha rastu

Z knihy Ekonomická teória: Učebnica autora Machoviková Galina Afanasjevna

8.4.2. Optimálna cesta rastu Predpokladajme, že ceny zdrojov zostanú nezmenené, zatiaľ čo podnikový rozpočet neustále rastie. Spojením dotyčnicových bodov izokvant s izokostami dostaneme čiaru 0G - „cesta vývoja“ (cesta rastu). Táto čiara ukazuje rýchlosť rastu pomeru

Najlepšia možnosť

Z knihy ZSSR: od skazy k svetovej veľmoci. Sovietsky prielom od Boffa Giuseppe

Optimálna možnosť V ohni bojov v roku 1928 sa zrodil prvý päťročný plán. Od roku 1926 dve inštitúcie, Gosplan a VSNKh, pripravovali rôzne návrhy plánov jeden po druhom. Ich vývoj bol sprevádzaný neustálymi diskusiami. Ako jedna schéma

OPTIMÁLNA MOŽNOSŤ

Z knihy Ruský rock. Malá encyklopédia autora Bushueva Svetlana

Optimálne

Z knihy Veľká sovietska encyklopédia (OP) od autora TSB

Optimálny poriadok

Z knihy CSS3 pre webdizajnérov od Siderholma Dana

Optimálne poradie Pri používaní prefixov prehliadača je dôležité mať na pamäti poradie, v ktorom sú vlastnosti uvedené. Môžete si všimnúť, že v predchádzajúcom príklade sú vlastnosti predpony zapísané ako prvé, potom nasleduje vlastnosť bez predpony.

Optimálny človek

Z knihy Computerra Magazine č.40 zo dňa 31.10.2006 autora časopis Computerra

Optimálny človek Autor: Vladimir Guriev Niektoré témy, ktoré boli populárne pred štyridsiatimi rokmi, sa dnes zdajú také okrajové, že sa o nich takmer vážne nehovorí. Zároveň - súdiac podľa tónu článkov v populárnych časopisoch - pôsobili relevantne a rovnomerne

Najlepšia možnosť

Z knihy Stalin's First Strike 1941 [Kolekcia] autor Kremlev Sergej

Optimálna možnosť Analýza možných scenárov vývoja udalostí nevyhnutne núti zamyslieť sa nad výberom optimálnej možnosti. Nedá sa povedať, že by rôzne „letné“ možnosti, teda alternatívy viazané na máj – jún – júl 1941, vzbudzovali optimizmus. Nie oni

Najlepšia možnosť

Z knihy Veľká vlastenecká alternatíva autora Isaev Alexej Valerijevič

Optimálna možnosť Analýza možných scenárov vývoja udalostí nevyhnutne núti zamyslieť sa nad výberom optimálnej možnosti. Nedá sa povedať, že by rôzne „letné“ varianty, teda alternatívy viazané na máj – jún – júl 1941, vzbudzovali optimizmus. Nie oni

Optimálna kontrola

Z knihy Sebaúcta u detí a dospievajúcich. Kniha pre rodičov od Eyestad Gyru

Optimálna kontrola Čo znamená držať sa primerane pevne? To si musíte určiť sami, na základe svojich vedomostí o vlastnom dieťati a podmienkach prostredia, v ktorom žijete. Vo väčšine prípadov sa rodičia tínedžerov snažia chrániť svoje deti pred fajčením, pitím alkoholu,

Optimálny spôsob

Z knihy Paradox perfekcionistov od Ben-Shahar Tal

Optimálna cesta Neustále sme bombardovaní dokonalosťou. Adonis zdobí obálku Men’s Health, Elena the Beautiful zdobí obálku Vogue; ženy a muži na obrovskom plátne za hodinu či dve vyriešia svoje konflikty, rozohrajú ideálnu zápletku, oddajú sa ideálnej láske. Všetci sme počuli

Optimálny prístup

Z knihy Odborník č.07 (2013) autorský odborný časopis

Optimálny prístup Sergey Kostyaev, kandidát politických vied, vedúci výskumník INION RAS Ministerstvo obrany USA minulo miliardu dolárov na nefunkčný počítačový program Foto: EPA Od 1. marca sa výdavky Pentagonu pravdepodobne znížia o 43 mld.

Najlepšia možnosť

Z knihy Dve ročné obdobia autor Arsenyev L

Optimálna možnosť – Povedzte mi, je rozumné hrať na viacerých frontoch naraz? - pýtali sa novinári Bazileviča a Lobanovského na samom začiatku sezóny 75. "Je to nerozumné, samozrejme," odpovedali. - Ale je to potrebné. Sme presvedčení, že je nevyhnutné rozlišovať význam

Optimálna kontrola

Z knihy Riadenie osobných (rodinných) financií. Systémový prístup autora Steinbock Michail

Optimálna kontrola >> Pri optimálnej kontrole rozdeľujeme všetky výdavky do dvoch veľkých skupín: – „bežné“ – pravidelné výdavky, – jednorazové alebo neštandardné výdavky Optimálnu kontrolu je možné použiť až po niekoľkých mesiacoch podrobnej kontroly.

Asymptotické správanie (alebo asymptotika) funkcie v blízkosti určitého bodu a (konečného alebo nekonečného) sa chápe ako povaha zmeny funkcie, keďže jej argument x smeruje k tomuto bodu. Väčšinou sa snažia toto správanie znázorniť pomocou inej, jednoduchšej a naštudovanej funkcie, ktorá v okolí bodu a s dostatočnou presnosťou opíše zmenu funkcie, ktorá nás zaujíma, alebo vyhodnotí jej správanie z tej či onej strany. V tejto súvislosti vyvstáva problém porovnania charakteru zmeny dvoch funkcií v okolí bodu a, spojeného so zohľadnením ich kvocientu. Zvlášť zaujímavé sú prípady, keď sú pre x a obe funkcie buď nekonečne malé (nekonečne malé) alebo nekonečne veľké (nekonečne veľké). 10.1. Porovnanie infinitezimálnych funkcií Hlavným účelom porovnávania b.m. funkcií spočíva v porovnaní charakteru ich priblíženia k nule pri x a, alebo rýchlosti ich priblíženia k nule. Nech b.m. pre x a sú funkcie a(i) a P(x) nenulové v nejakom punktovanom okolí (a) bodu a av bode a sú rovné nule alebo nie sú definované. Definícia 10.1. Funkcie a(x) a 0(x) sa nazývajú b.m. rovnakého rádu pre a a napíšte og(a:) = v O (/?(«)) (symbol O sa číta „O veľké“), ak v x a existuje nenulová konečná hranica podielu a (x)//?(i), t.j. Je zrejmé, že podľa (7.24) platí Βi € R\(0) a zápis X^a0[a(x)). Symbol O má vlastnosť tranzitivity, t.j. ak v skutočnosti, berúc do úvahy definíciu 10.1 a vlastnosť súčinu funkcií (pozri (7.23)) s konečnými (v tomto prípade nenulovými) limitami, dostaneme ASYMPTOTICKÉ SPRÁVANIE FUNKCIÍ. funkcie. Definícia 10.2. Funkcia a(x) volá bm vyššieho rádu maličkosti v porovnaní s (3(x) (alebo relatívne k /3(x)) pre x a a zápis) (symbol o sa číta ako malý, ak hranica podielu a existuje a rovná sa nule. Aj v tomto prípade sa o funkcii hovorí, že je menšieho rádu v porovnaní s a(x) pre x a a slovo malosť sa zvyčajne vynecháva (ako napr. vyššieho rádu v definícii 10.2. To znamená, že ak lim (potom funkcia /)(x) je podľa definície 10.2 b.m. vyššieho rádu v porovnaní s a(x) pre x a a a(i) sú b.m. nižšieho rádu v porovnaní s /3(x) pre x a, pretože v tomto prípade lijTi (fi(x)/ot(x)) . Môžeme teda písať Podľa vety 7.3 o súvislosti medzi funkciou, jej limitou a b.m. funkcií z (10.3) vyplýva, že ot) je funkcia, b.m. pri. Preto a(x), t.j. hodnoty|a(z)| pre x blízke a, oveľa menšie ako hodnoty \0(x)\. Inými slovami, funkcia a(x) má tendenciu nulovať sa rýchlejšie ako funkcia /?(x). Veta 10.1. Produkt akéhokoľvek b.m. pre x a sú funkcie a(x) a P(x)) odlišné od nuly v nejakom punktovanom okolí bodu a, existujú pre x-¥a b.m. funkciou vyššieho rádu v porovnaní s každým z faktorov. Skutočne, podľa definície 10,2 b.m. vyššieho rádu (berúc do úvahy funkcie Definícia 7.10 b.m.), rovnosti znamenajú platnosť vety. Rovnosti obsahujúce symboly O a o sa niekedy nazývajú asymptotické odhady. Definícia 10.3. Funkcie ot(x) a /3(x) sa nazývajú neporovnateľné b.m. pre x -¥ a, ak neexistuje ani konečná, ani nekonečná limita ich pomeru, t.j. ak $ lim a(x)/0(x) (p £ ako aj $ lim 0(x)/a(x)). Príklad 10.1. A. Funkcie a(x) = x a /?(x) = sin2ar podľa definície 10.1 - b.m. rovnakého rádu pri x 0, pretože berúc do úvahy (b. Funkcia a(x) = 1 -coss, podľa definície 10.2, je b.m. vyššieho rádu v porovnaní s 0(x) = x pri x 0, keďže s berúc do úvahy c) Funkcia a(zz) = \/x je nižšieho rádu v porovnaní s fl(x) = x pre x 0, pretože g) Funkcie a(s) = = x podľa definície 10.3 sú neporovnateľné b.m. pri x 0, keďže limita ASYMPTOTICKÉ SPRÁVANIE FUNKCIÍ Porovnanie infinitezimálnych funkcií neexistuje (ani konečné, ani nekonečné - pozri príklad 7.5). Mocninná funkcia x11 s exponentom n 6 N, n > 1 je pri x a b.m. vyššieho rádu v porovnaní s xn~1) t.j. yapa = ao(a:n"*1), keďže lim (xL/xn"1) = Ak je potrebný presnejší porovnávací popis správania b.m. funkcie pre x - a jedna z nich je vybraná ako druh štandardu a nazývaná hlavná. Samozrejmosťou je výber hlavného b.m. do istej miery ľubovoľné (snažia sa zvoliť jednoduchšie: x pre x -*0; x-1 pre x -41; 1/x pre x ->oo atď.). Od stupňov 0k(x) hlavná b.m. funkcie /)(x) s rôznymi exponentmi k > 0 (pre k ^ 0 0k(x) nie je b.m.) tvoria porovnávaciu remízu pre odhad zložitejšej b.m. funkcie a(z). Definícia 10.4. Funkcia a(z) sa nazýva b.m. k-teho rádu maličkosti vzhľadom na (3(x) pre x a, a číslo k je rádu maličkosti, ak funkcie a(z) a /Zk(x) sú rovnakého rádu pre x a) t.j. ak sa v tomto prípade slovo „malosť“ zvyčajne vynecháva. Poznámka: 1) poradie k jednej funkcie b.m. vo vzťahu k inej môže byť ľubovoľné kladné číslo; 2) ak poradie funkcie a(x) vzhľadom na /3( x) sa rovná k, potom sa poradie funkcie P(x) vzhľadom na a(x) rovná 1/k; 3) nie vždy pre funkciu bm a(x), dokonca porovnateľné so všetkými mocninami /? *(x), môžete zadať konkrétnu objednávku k. Príklad 10.2. A. Funkcia cosx, podľa definície 10.4, - b.m. rádu k = 2 vzhľadom na 0(x) = x pre x 0, keďže berieme do úvahy b. Pozrime sa na funkcie. Ukážme, že pre akékoľvek Skutočne, podľa (7.32). Teda b.m. pre x -»+0 je funkcia a1/1 porovnateľná s xk pre ľubovoľné k > 0, ale pre túto funkciu nie je možné uviesť poradie malosti vzhľadom na x. # Určte poradie jedného b.m. funkcie vo vzťahu k inému nie je vždy jednoduché. Môžeme odporučiť nasledovný postup: 1) napísať vzťah a(x)/0k(x) pod znamienko limity, 2) analyzovať zapísaný vzťah a pokúsiť sa ho zjednodušiť; 3) na základe známych výsledkov urobte predpoklad o možnej hodnote k), pri ktorej bude existovať nenulová konečná hranica; 4) skontrolujte predpoklad výpočtom limitu. Príklad 10.3. Určme poradie b.m. funkcie tgx - sin x vzhľadom na x pre x -» 0, t.j. Nájdite číslo k > O také, že máme ASYMPTOTICKÉ SPRÁVANIE FUNKCIÍ. Porovnanie infinitezimálnych funkcií. V tomto štádiu, keď vieme, že pre x 0, podľa (7.35) a (7.36), (sinx)/x 1 a cosx -> 1, a berúc do úvahy (7.23) a (7.33), môžeme určiť túto podmienku ( 10.7) bude splnená pri k = 3. Priamy výpočet limity pri k = 3 totiž dáva hodnotu A = 1/2: Všimnite si, že pre k > 3 dostaneme nekonečnú limitu a pri limite sa bude rovnať na nulu.

Diplomová práca

Preto jedným zo spôsobov rozvoja testovania štatistických hypotéz bola cesta „empirickej“ konštrukcie kritérií, kedy konštruovaná štatistika kritéria vychádza z určitého princípu, geniálnej myšlienky či zdravého rozumu, no jej optimálnosť nie je zaručené. Aby sa odôvodnilo používanie takejto štatistiky pri testovaní hypotéz voči určitej triede alternatív, najčastejšie metódou...

  • 1. Podporujúce informácie
    • 1. 1. Informácie z teórie C/- a V-štatistiky
    • 1. 2. Definícia a výpočet účinnosti Bahadur
    • 1. 3. Na veľké odchýlky II- a V-štatistiky
  • 2. Baringhouse-Hentzeho kritériá symetrie
    • 2. 1. Úvod
    • 2. 2. Štatistiky
    • 2. 3. Štatistiky
  • 3. Kritériá exponenciality
    • 3. 1. Úvod
    • 3. 2. Štatistika I
    • 3. 3. Štatistika č
  • 4. Kritériá normality
    • 4. 1. Úvod
    • 4. 2. Štatistika B^
    • 4. 3. Štatistika V^n
    • 4. 4. Štatistika V|)P
  • 5. Kritériá pre súhlas s Cauchyho zákonom
    • 5. 1. Úvod
    • 5. 2. Štatistiky
    • 5. 3. Štatistiky

Asymptotické vlastnosti symetrie a kritériá zhody založené na charakterizácii (esej, ročníková práca, diplom, test)

Táto dizertačná práca vytvára a študuje kritériá dobrej zhody a symetrie na základe charakterizačných vlastností distribúcií a tiež vypočítava ich asymptotickú relatívnu účinnosť pre množstvo alternatív.

Konštrukcia štatistických kritérií a štúdium ich asymptotických vlastností je jedným z najdôležitejších problémov matematickej štatistiky. Pri testovaní jednoduchej hypotézy oproti jednoduchej alternatíve sa problém rieši pomocou Neyman-Pearsonovej lemy, ktorá, ako je známe, dáva optimálne (najvýkonnejšie) kritérium v ​​triede všetkých kritérií danej úrovne. Toto je test pomeru pravdepodobnosti.

Avšak pre zložitejšie a praktickejšie problémy testovania hypotéz, ktoré zahŕňajú buď testovanie zložitých hypotéz alebo zvažovanie komplexných alternatív, len zriedka existujú jednotne najsilnejšie testy a úloha testu pomeru pravdepodobnosti sa výrazne mení. Štatistika pomeru pravdepodobnosti sa zvyčajne nedá vypočítať explicitne, stráca svoju vlastnosť optimálnosti a jej rozdelenie je nestabilné voči zmenám v štatistickom modeli. Navyše, štatistik často vôbec nevie určiť typ alternatívy, bez čoho konštrukcia parametrických kritérií stráca zmysel.

Preto jedným zo spôsobov rozvoja testovania štatistických hypotéz bola cesta „empirickej“ konštrukcie kritérií, kedy konštruovaná štatistika kritéria vychádza z určitého princípu, geniálnej myšlienky či zdravého rozumu, no jej optimálnosť nie je zaručené.

Typickými príkladmi takejto štatistiky sú znamienková štatistika, Pearsonova štatistika x2 (1900), Kolmogorovova štatistika (1933), ktorá meria rovnomernú vzdialenosť medzi empirickou a skutočnou distribučnou funkciou, Kendallov koeficient poradovej korelácie (1938) alebo Bickel- Rosenblattova štatistika (1973), založená na kvadratickom riziku hodnotenia jadrovej hustoty. V súčasnosti má matematická štatistika mnoho desiatok „empirických“ štatistík na testovanie hypotéz zhody, symetrie, homogenity, náhodnosti a nezávislosti a v literatúre sa neustále navrhuje stále viac štatistík tohto typu. Obrovská literatúra je venovaná štúdiu ich presných a limitných rozdelení, odhadov rýchlosti konvergencie, veľkých odchýlok, asymptotických expanzií atď.

Aby sa odôvodnilo používanie takýchto štatistík pri testovaní hypotéz voči určitej triede alternatív, ich sila sa najčastejšie vypočítava pomocou štatistického modelovania. Avšak pre akékoľvek konzistentné kritérium má sila tendenciu k jednote so zvyšujúcou sa veľkosťou vzorky, a preto nie je vždy informatívna. Hlbšiu analýzu komparatívnych vlastností štatistiky možno vykonať na základe konceptu asymptotickej relatívnej efektívnosti (ARE). Rôzne prístupy k výpočtu AOE navrhli v polovici 20. storočia E. Pitman, J. Hodges a E. Lehman, R. Bahadur, G. Chernov a W. Kallenberg, výsledky vývoja teórie AOE v polovici 20. 90. roky boli zhrnuté v monografii. Existuje všeobecne uznávaný názor, že syntéza nových kritérií by mala byť sprevádzaná nielen analýzou ich vlastností, ale aj výpočtom AOE s cieľom posúdiť ich kvalitu a poskytnúť informované odporúčania na ich použitie v praxi.

Tento článok využíva myšlienku konštrukcie kritérií založených na charakterizácii rozdelení pomocou vlastnosti ekvidistribúcie. Teória charakterizácie pochádza z práce D. Polyu, publikovanej v roku 1923. Potom bola rozvinutá v prácach I. Martsinkeviča, S. N. Bernsteina, E. Lukacha, Yu. V. Linnika, A.A. Spevák, J. Darmois, V. P. Skitovič, S.R. Pao, A.M. Kagan, J. Galambos, S. Kotz, L. B. Klebanov a mnohí ďalší matematici. Literatúra na túto tému je veľká a v súčasnosti existuje niekoľko monografií venovaných charakteristikám, napríklad , , , , , , .

Myšlienka konštrukcie štatistických kritérií založených na charakterizácii ekvidistribučnej vlastnosti patrí Yu. V. Linnikovi. V závere svojho rozsiahleho diela napísal: „. možno nastoliť otázku konštrukcie kritérií pre zhodu vzorky s komplexnou hypotézou, založenou na identickom rozdelení dvoch zodpovedajúcich štatistík gi (xi> .xr) a g2(x, ¦¦¦xr), čím by sa znížil otázka kritéria homogenity“.

Vráťme sa ku klasickej Polyovej vete, aby sme na konkrétnom príklade vysvetlili, ako môže tento prístup fungovať. Vo svojej najjednoduchšej forme je táto veta formulovaná nasledovne.

Polyova veta. Nech X a Y sú dve nezávislé a identicky rozdelené stredové s. V. Potom s. V. (X + Y)//2 a X sú identicky rozdelené vtedy a len vtedy, ak je zákon rozdelenia X normálny.

Predpokladajme, že máme vzorku centrovaných nezávislých pozorovaní Xi, ., Xn a chceme otestovať (komplexnú) nulovú hypotézu, že rozdelenie tejto vzorky je normálne so strednou hodnotou 0 a určitým rozptylom. Pomocou našej vzorky zostrojme obvyklú empirickú distribučnú funkciu (d.f.) n

Fn (t) = n-^VD

Gn(t) = n~2? VD + Xj< iv^}, t <= R1. i, j=l

Na základe Glivenko-Cantelliho vety, ktorá platí aj pre V-štatistické empirické d.f. , pre veľké n sa funkcia Fn(t) rovnomerne približuje k d.f. F(t) = P (X< t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Tento dizajn, založený na myšlienke Yu. V. Linnika, však nedostal takmer žiadny vývoj, možno kvôli technickým ťažkostiam pri zostavovaní a analýze výsledných kritérií. Ďalším dôvodom je pravdepodobne to, že charakterizácií rozdelení pomocou vlastnosti ekvidistribúcie je málo a sú veľmi vzdialené.

Poznáme len niekoľko diel, ktoré sa v tej či onej miere venujú rozvoju myšlienky Yu. V. Linnika. Toto sú diela Baringhouse a Henze a Muliere a Nikitin, o ktorých sa bude diskutovať nižšie. Existujú aj práce, v ktorých sú kritériá dobrej zhody pre špecifické distribúcie tiež konštruované na základe charakterizácií, ale nie na základe ekvidistribúcie, napríklad , , , , , , , .

V literatúre sa najčastejšie používa charakterizácia exponenciálneho rozdelenia pomocou rôznych variantov vlastnosti no-memory , , , , , , .

Treba poznamenať, že takmer vo všetkých týchto prácach (okrem snáď) nie je vypočítaná alebo diskutovaná AOE zvažovaných kritérií. V tejto práci študujeme nielen asymptotické vlastnosti známych a nami navrhovaných kritérií založených na charakterizácii, ale tiež vypočítame ich lokálne presné (alebo približné) AOE podľa Bahadura.

Poďme teraz definovať pojem AOE. Nech (Tn) a (1^) sú dve postupnosti štatistík zostrojené zo vzorky X,., Xn s distribúciou Pd, kde v € 0 C sa testuje R1 a nulová hypotéza Ho: 9 € v C proti alternatíve A: v € ©-x = ©-6o. Nech Mm (a, P,0) je minimálna veľkosť vzorky X[,., Xn, pre ktorú postupnosť (Tn) s danou hladinou významnosti a > 0 dosiahne mocninu /3< 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Keďže relatívnu účinnosť ako funkciu troch argumentov nie je možné explicitne vypočítať ani pre najjednoduchšie štatistiky, je zvykom brať do úvahy limity:

Ptet, y (a,/?, 0), Ntet, y (a,/3,0).

V prvom prípade sa získa AOE podľa Bahadura, druhý limit určuje AOE podľa Hodges-Lehmana a tretí vedie k stanoveniu AOE podľa Pitmana. Keďže v praktických aplikáciách sú najzaujímavejšie prípady nízkej hladiny významnosti, vysokej moci a blízkych alternatív, všetky tri definície sa zdajú rozumné a prirodzené.

V tejto práci na porovnanie kritérií použijeme AOE podľa Bahadur. Má to viacero dôvodov. Po prvé, Pitmanova účinnosť je vhodná hlavne pre asymptoticky normálne štatistiky a za tejto podmienky sa zhoduje s lokálnou Bach-Durovou účinnosťou, . Uvažujeme nielen o asymptoticky normálnej štatistike, ale aj o štatistike kvadratického typu, pre ktorú sa limitné rozdelenie podľa nulovej hypotézy výrazne líši od normálneho, takže Pitmanova účinnosť nie je použiteľná. Po druhé, Hodges-Lehman AOE je nevhodný na štúdium obojstranných kritérií, pretože sa všetky ukázali ako asymptoticky optimálne a pre jednostranné kritériá sa tento AOE zvyčajne lokálne zhoduje s Bahadur AOE. Po tretie, významný pokrok sa nedávno dosiahol v oblasti veľkých odchýlok pre testovacie štatistiky, čo je rozhodujúce pri výpočte Bahadur AOE. Máme na mysli veľké odchýlky U- a V-štatistiky popísané v posledných prácach a.

Prejdime teraz k prehľadu obsahu dizertačnej práce. Prvá kapitola má pomocný charakter. Uvádza potrebné teoretické a technické informácie z teórie 11-štatistiky, teórie veľkých odchýlok a teórie asymptotickej efektívnosti podľa Bahadura.

Kapitola 2 je venovaná konštrukcii a štúdiu kritérií na testovanie hypotézy symetrie. Baringhouse a Henze navrhli myšlienku konštrukcie kritérií symetrie na základe nasledujúcej elementárnej charakterizácie.

Nech X a Y sú n.o.s.v.s, ktoré majú spojitú d.f. Potom |X| a |max (X, Y)| identicky rozdelené práve vtedy, ak sú X a Y symetricky rozdelené okolo nuly.

Túto charakterizáciu používame na vytvorenie nových kritérií symetrie. Pripomeňme, že viaceré klasické kritériá symetrie (pozri kapitolu 4) sú založené na charakterizácii symetrie ešte jednoduchšou vlastnosťou ekvidistribúcie X a -X.

Vráťme sa k charakteristike Baringhouse-Hentze. Nech X, ., Xn pozorovania majúce spojitú d.f.<7. Рассмотрим проверку гипотезы симметрии:

H0: OD = 1 –<3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в >Alternatíva 0-skew, t.j. d(x-v) = 2f(x)F ($x), c > 0-Lemanova alternatíva, t.j. G(x-, 6) = F1+ e (x), 6 > 0 a alternatíva znečistenia t.j. G(x-6) = (1 - 6) F(x) + 6Fr+1(x), v > 0, r > 0, kde F (x) a f (x) sú d.f. a hustota nejakého symetrického rozdelenia.

V súlade s vyššie uvedenou charakteristikou je konštruovaný empirický df založený na |Xj|,., Xn, n

Hn (t) = n~2 J2 Tmax (X^Xk)<г}. На основе этих функций составляются статистики: лоо ):

Nech X uY je nezáporné a nedegenerované n.o.s.v.s s d.f. diferencovateľným na nule. F a nechajte 0< а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Okrem konštrukcie samotného kritéria zhody a štúdia jeho asymptotických vlastností je zaujímavé vypočítať AOE nového kritéria a študovať jeho závislosť od parametra a.

Druhé zovšeobecnenie tejto charakterizácie patrí Des. Formulujeme ho na základe novších prác:

Nech Xi, ., Xm, m ^ 2 je nezáporné a nedegenerované i.s. r.v.s s d.f. diferencovateľným na nule. F. Potom sú štatistiky X a m minpfi, ., Xm) identicky rozdelené práve vtedy, ak F je d.f. exponenciálny zákon.

Nech Xx,., Xn sú nezávislé pozorovania s d.f. Na základe charakterizácií formulovaných vyššie môžeme testovať exponenciálnu hypotézu Ho, ktorá spočíva v tom, že (7 je d.f. exponenciálneho zákona. P, proti alternatíve H, ktorá spočíva v tom, že C f? pri slabom prídavnom podmienky.

V súlade s týmito charakteristikami sa skonštruuje empirická df. p = pVD< О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Navrhujeme založiť kritériá na kontrolu exponenciality na štatistike: pkp = - c&bdquo-(*)] aop(1).

Ako alternatívy volíme štandardné alternatívy používané v literatúre o exponenciálnom testovaní: Weibullovu alternatívu s d(x) = (β + 1)xx(-x1+β), x ^ 0- Makehamovu alternatívu s d(x) = ( 1 + 0(1 - exp (-x))) exp (-x - 0(exp (-x) - 1 + x)), x ^ 0 - alternatíva k linearite funkcie poruchovosti s d (x) = (1 + bx) exp[—x—^bx2], x^O.

Pre dve vyššie navrhnuté štatistiky sú limitné distribúcie podľa nulovej hypotézy napísané:

Veta 3.2.1 Pre štatistiku Uε pre n -* oo platí vzťah: kde Dz(a) je definované v (3.2.2). Veta 3.3.1 Pre štatistiku n ako n -> oo platí vzťah

U0,(t + 1)2A1(t)), kde D4(t) je definované v (3.3.6).

Keďže obe štatistiky závisia od parametrov a a m, zisťujeme, pri ktorých hodnotách parametrov dosahuje AOE podľa Bahadur svoje maximum a tieto hodnoty nájdeme. Okrem toho skonštruujeme alternatívu, v ktorej sa maximum dosiahne v bode a φ ½.

Štvrtá kapitola je venovaná testovaniu hypotézy normality. Existuje mnoho charakterizácií normálneho zákona ako jedného z ústredných zákonov teórie pravdepodobnosti a matematickej štatistiky a dve monografie venované výlučne tejto problematike. Zvážime mierne zjednodušenú verziu známej charakterizácie a:

Nech Xr, X2, ., Xm sú vycentrované na n.o.s.v.s s d.f. o konštanty a, a-2,., am sú také, že 0< а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Nech X,., Xn je vzorka s d.f. G. Na základe tejto charakterizácie môžeme testovať hlavnú hypotézu R0, ktorou je, že G je d.f. normálny zákon Fa (x) = Ф (x/a), proti alternatíve Hi, čo je, že G φ Fa. Skonštruuje sa zvyčajný empirický df. Gn a V-štatistická d.f. n^

Bm, n(t) = n~t (Ei + - +< *}),

1.¿-t=1 s

Symbol a ďalej znamená súčet všetkých permutácií indexov. Kritériá testovania normality môžu byť založené na nasledujúcich štatistikách:

B, n = Г dGn (t), J -00 oo

BmAt)-Gn(t)]dGn(t), oo

Kôš = G)