Saturday, 4 November 2017

Flytte Gjennomsnittet Alltid Stasjonær


4.2 Linjære stasjonære modeller for Time Series hvor den tilfeldige variabelen kalles innovasjon fordi den representerer delen av den observerte variabelen som er uforutsigbar gitt de siste verdiene. Den generelle modellen (4.4) antar det som er resultatet av et lineært filter som forandrer de siste innovasjonene, det vil si en lineær prosess. Denne linearitetsforutsetningen er basert på Wolds dekomponeringsteorem (Wold 1938) som sier at en hvilken som helst diskret, stasjonær kovariansprosess kan uttrykkes som summen av to ukorrelerte prosesser, hvor det er rent deterministisk og er en rent ubestemt prosess som kan skrives som en lineær summen av innovasjonsprosessen: hvor er en sekvens av serielt ukorrelerte tilfeldige variabler med null gjennomsnitt og felles varians. Tilstand er nødvendig for stasjonar. Formuleringen (4.4) er en endelig reparametrizering av den uendelige representasjonen (4.5) - (4.6) med konstant. Det er vanligvis skrevet i forhold til lagoperatøren definert av, som gir et kortere uttrykk: hvor lagoperatørpolynomene og er kalt polynomial og polynomial, henholdsvis. For å unngå parameterredundans antar vi at det ikke er felles faktorer mellom komponentene og komponentene. Deretter skal vi studere plottet til noen tidsserier generert av stasjonære modeller med sikte på å bestemme hovedmønstrene av deres tidsmessige evolusjon. Figur 4.2 inneholder to serier generert fra følgende stasjonære prosesser beregnet ved hjelp av genarma-kvantet: Figur 4.2: Tidsserier generert av modeller Som forventet beveger begge tidsserier seg rundt et konstant nivå uten endringer i varians på grunn av den stasjonære egenskapen. Videre er dette nivået nær det teoretiske gjennomsnittet av prosessen, og avstanden til hvert punkt til denne verdien er svært sjelden utenfor grensene. Videre viser utviklingen av serien lokale avvik fra middelprosessen, som er kjent som den gjennomsnittlige reversjonsadferd som karakteriserer stasjonære tidsserier. La oss studere detaljert egenskapene til de forskjellige prosessene, spesielt autokovariansfunksjonen som fanger de dynamiske egenskapene til en stokastisk stasjonær prosess. Denne funksjonen avhenger av måleenhetene, så det vanlige målet på gradvis linearitet mellom variabler er korrelasjonskoeffisienten. Ved stasjonære prosesser defineres autokorrelasjonskoeffisienten ved lag, betegnet ved, som korrelasjonen mellom og: Autokorrelasjonsfunksjonen (ACF) er autokovariansfunksjonen som standardiseres av variansen. Egenskapene til ACF er: Gitt symmetriegenskapen (4.10), representeres ACF vanligvis ved hjelp av et strekkdiagram ved de ikke-negative lag som kalles det enkle korrelogrammet. Et annet nyttig verktøy for å beskrive dynamikken til en stasjonær prosess er den delvise autokorrelasjonsfunksjonen (PACF). Den delvise autokorrelasjonskoeffisienten ved lag måler den lineære sammenhengen mellom og justeres for effektene av mellomverdiene. Derfor er det bare koeffisienten i den lineære regresjonsmodellen: Egenskapene til PACF er ekvivalente med ACF (4.8) - (4.10) og det er lett å bevise det (Box og Jenkins 1976). Som ACF, er den delvise autokorrelasjonsfunksjonen ikke avhengig av måleenhetene, og den er representert ved hjelp av et strekkdiagram på de ikke-negative lag som kalles delvis korrelogram. De dynamiske egenskapene til hver stasjonær modell bestemmer en bestemt form for korrelogrammene. Videre kan det påvises at for enhver stasjonær prosess, begge funksjoner, ACF og PACF, nærmer seg null når laget har en tendens til uendelig. Modellene er ikke alltid stasjonære prosesser, så det er først å bestemme betingelsene for stasjonar. Det er underkategorier av modeller som har spesielle egenskaper, slik at vi skal studere dem separat. Dermed, når og, det er en hvit støyprosess. når det er en ren, flytende gjennomsnittsprosess. , og når det er en ren autoregressiv prosessordre. . 4.2.1 Hvit støyprosess Den enkleste modellen er en hvit støyprosess, hvor er en sekvens av ukorrelerte null-middelvariabler med konstant varians. Det er betegnet av. Denne prosessen er stasjonær hvis dens varians er begrenset, siden gitt at: verifiserer betingelsene (4.1) - (4.3). Videre er ukorrelert over tid, slik at autokovariansfunksjonen er: Figur 4.7 viser to simulerte tidsserier generert fra prosesser med null gjennomsnitt og parametre og -0,7. Den autoregressive parameteren måler persistensen av tidligere hendelser i gjeldende verdier. For eksempel, hvis et positivt (eller negativt) sjokk påvirker positivt (eller negativt) for en tidsperiode som er lengre jo større er verdien av. Når serierne beveger seg mer grovt rundt gjennomsnittet på grunn av vekslingen i retning av effekten av, det vil si et sjokk som påvirker positivt i øyeblikket, har negative virkninger på, positivt i. Prosessen er alltid inverterbar, og den er stasjonær når parameteren til modellen er begrenset til å ligge i regionen. For å bevise den stasjonære tilstanden skriver vi først i den bevegelige gjennomsnittsformen ved rekursiv substitusjon av i (4.14): Figur 4.8: Befolkningskorrelogrammer for prosesser Det er en vektet sum av tidligere innovasjoner. Vektene avhenger av verdien av parameteren: når, (eller) øker innflytelsen av en gitt innovasjon (eller reduserer) gjennom tiden. Ved å ta forventninger til (4,15) for å beregne prosessens gjennomsnitt, får vi: Gitt det er resultatet en sum av uendelige termer som kun konvergerer for all verdi hvis i hvilket tilfelle. Et lignende problem vises når vi beregner det andre øyeblikket. Beviset kan forenkles, forutsatt at det vil si at. Da er variansen: Igjen går variansen til uendelig bortsett fra, i hvilket tilfelle. Det er enkelt å verifisere at både gjennomsnittet og variansen eksploderer når denne tilstanden ikke holder. Autokovariansfunksjonen til en stasjonær prosess er derfor autokorrelasjonsfunksjonen for den stasjonære modellen: Det vil si at korrelogrammet viser et eksponensielt henfall med positive verdier, alltid hvis det er positivt og med negative positive svingninger hvis det er negativt (se figur 4.8). Videre reduseres hastigheten av forfall som øker, jo større er verdien av jo sterkere den dynamiske korrelasjonen i prosessen. Endelig er det en cutoff i den delvise autokorrelasjonsfunksjonen ved første lag. Figur 4.9: Befolkningskorrelogrammer for prosesser Det kan vises at den generelle prosessen (Box og Jenkins 1976): Står bare hvis røttene til polynomens karakteristiske likning ligger utenfor enhetssirkelen. Midten av en stasjonær modell er. Er alltid invertible for noen verdier av parametrene. Den ACF går til null eksponentielt når røttene til er reelle eller med sinus-cosinusbølgefluktuasjoner når de er komplekse. Det er PACF som har en cutoff på laget, det vil si. Noen eksempler på Korrelogrammer for mer komplekse modeller, som for eksempel, kan ses i figur 4.9. De er svært lik mønstrene når prosessene har reelle røtter, men har en helt annen form når røttene er komplekse (se det første grafikkbildet i figur 4.9). 4.2.4 Autoregressiv Flytende Gjennomsnittlig Modell Den generelle (endelig rekkefølge) autoregressive glidende gjennomsnittlige bestillingsorden, er: Flytende gjennomsnitts - og eksponensielle utjevningsmodeller Som et første skritt i å bevege seg utover gjennomsnittlige modeller, tilfeldige gangmodeller og lineære trendmodeller, ikke-sesongbaserte mønstre og trender kan ekstrapoleres ved hjelp av en flytende gjennomsnitt eller utjevningsmodell. Den grunnleggende forutsetningen bak gjennomsnittlige og utjevningsmodeller er at tidsserien er lokalt stasjonær med et sakte varierende middel. Derfor tar vi et flytende (lokalt) gjennomsnitt for å anslå dagens verdi av gjennomsnittet, og deretter bruke det som prognosen for nær fremtid. Dette kan betraktes som et kompromiss mellom den gjennomsnittlige modellen og den tilfeldige-walk-uten-drift-modellen. Den samme strategien kan brukes til å estimere og ekstrapolere en lokal trend. Et glidende gjennomsnitt kalles ofte en quotsmoothedquot-versjon av den opprinnelige serien, fordi kortsiktig gjennomsnittsverdi medfører utjevning av støtene i den opprinnelige serien. Ved å justere graden av utjevning (bredden på det bevegelige gjennomsnittet), kan vi håpe å finne en slags optimal balanse mellom ytelsen til de gjennomsnittlige og tilfeldige turmodellene. Den enkleste typen gjennomsnittlig modell er. Enkel (likevektet) Flytende gjennomsnitt: Værvarselet for verdien av Y på tidspunktet t1 som er laget på tidspunktet t, er det enkle gjennomsnittet av de nyeste m-observasjonene: (Her og andre steder vil jeg bruke symbolet 8220Y-hat8221 til å stå for en prognose av tidsserien Y som ble gjort så tidlig som mulig ved en gitt modell.) Dette gjennomsnittet er sentrert ved period-t (m1) 2, noe som innebærer at estimatet av det lokale middel vil ha en tendens til å ligge bak den sanne verdien av det lokale gjennomsnittet med ca. (m1) 2 perioder. Således sier vi at gjennomsnittsalderen for dataene i det enkle glidende gjennomsnittet er (m1) 2 i forhold til perioden for prognosen beregnes. Dette er hvor lang tid det vil være å prognostisere prognoser bak vendepunkter i dataene . For eksempel, hvis du er gjennomsnittlig de siste 5 verdiene, vil prognosene være ca 3 perioder sent i å svare på vendepunkter. Merk at hvis m1, den enkle glidende gjennomsnittlige (SMA) modellen er lik den tilfeldige turmodellen (uten vekst). Hvis m er veldig stor (sammenlignbar med lengden på estimeringsperioden), svarer SMA-modellen til den gjennomsnittlige modellen. Som med hvilken som helst parameter i en prognosemodell, er det vanlig å justere verdien av k for å oppnå den beste kvote kvoten til dataene, dvs. de minste prognosefeilene i gjennomsnitt. Her er et eksempel på en serie som ser ut til å vise tilfeldige svingninger rundt et sakte varierende middel. Først kan vi prøve å passe den med en tilfeldig walk-modell, noe som tilsvarer et enkelt bevegelige gjennomsnitt på 1 sikt: Den tilfeldige turmodellen reagerer veldig raskt på endringer i serien, men i så måte velger den mye av kvotenivået i data (tilfeldige svingninger) samt quotsignalquot (det lokale gjennomsnittet). Hvis vi i stedet prøver et enkelt glidende gjennomsnitt på 5 termer, får vi et smidigere sett med prognoser: Det 5-tiden enkle glidende gjennomsnittet gir betydelig mindre feil enn den tilfeldige turmodellen i dette tilfellet. Gjennomsnittsalderen for dataene i denne prognosen er 3 ((51) 2), slik at den har en tendens til å ligge bak vendepunktene med tre perioder. (For eksempel ser det ut til at en nedtur har skjedd i perioden 21, men prognosene vender seg ikke til flere perioder senere.) Legg merke til at de langsiktige prognosene fra SMA-modellen er en horisontal rettlinje, akkurat som i tilfeldig gang modell. Således antar SMA-modellen at det ikke er noen trend i dataene. Mens prognosene fra den tilfeldige turmodellen ganske enkelt er lik den siste observerte verdien, er prognosene fra SMA-modellen lik et veid gjennomsnitt av de siste verdiene. De konfidensgrenser som beregnes av Statgraphics for de langsiktige prognosene for det enkle glidende gjennomsnittet, blir ikke større da prognoseperioden øker. Dette er åpenbart ikke riktig. Dessverre er det ingen underliggende statistisk teori som forteller oss hvordan konfidensintervallene skal utvide seg for denne modellen. Det er imidlertid ikke så vanskelig å beregne empiriske estimater av konfidensgrensene for lengre horisontprognoser. For eksempel kan du sette opp et regneark der SMA-modellen skulle brukes til å prognose 2 trinn foran, 3 trinn fremover, etc. i den historiske dataprøven. Du kan deretter beregne utvalgsstandardavvikene til feilene i hver prognosehorisont, og deretter konstruere konfidensintervaller for langsiktige prognoser ved å legge til og trekke ut multipler av riktig standardavvik. Hvis vi prøver et 9-sikt enkelt glidende gjennomsnitt, får vi enda jevnere prognoser og mer av en bremseeffekt: Gjennomsnittsalderen er nå 5 perioder (91) 2). Hvis vi tar et 19-årig glidende gjennomsnitt, øker gjennomsnittsalderen til 10: Legg merke til at prognosene nå faller bakom vendepunkter med ca 10 perioder. Hvilken mengde utjevning er best for denne serien Her er et bord som sammenligner feilstatistikken sin, også et gjennomsnitt på tre sikt: Modell C, 5-års glidende gjennomsnitt, gir den laveste verdien av RMSE med en liten margin over 3 term og 9-sikt gjennomsnitt, og deres andre statistikker er nesten identiske. Så, blant modeller med svært like feilstatistikk, kan vi velge om vi foretrekker litt mer respons eller litt mer glatt i prognosene. (Tilbake til toppen av siden.) Browns Simple Exponential Smoothing (eksponentielt vektet glidende gjennomsnitt) Den enkle glidende gjennomsnittsmodellen beskrevet ovenfor har den uønskede egenskapen som den behandler de siste k-observasjonene, like og fullstendig ignorerer alle foregående observasjoner. Intuitivt bør tidligere data diskonteres på en mer gradvis måte - for eksempel bør den siste observasjonen få litt mer vekt enn 2. siste, og den 2. siste skal få litt mer vekt enn den 3. siste, og så videre. Den enkle eksponensielle utjevning (SES) - modellen oppnår dette. La 945 betegne en quotsmoothing constantquot (et tall mellom 0 og 1). En måte å skrive modellen på er å definere en serie L som representerer dagens nivå (dvs. lokal middelverdi) av serien som estimert fra data til nå. Verdien av L ved tid t beregnes rekursivt fra sin egen tidligere verdi slik: Således er den nåværende glattede verdien en interpolering mellom den forrige glattede verdien og den nåværende observasjonen, hvor 945 styrer nærheten til den interpolerte verdien til den nyeste observasjon. Forventningen for neste periode er bare den nåværende glatte verdien: Tilsvarende kan vi uttrykke neste prognose direkte i forhold til tidligere prognoser og tidligere observasjoner, i en hvilken som helst av de tilsvarende versjoner. I den første versjonen er prognosen en interpolasjon mellom forrige prognose og tidligere observasjon: I den andre versjonen blir neste prognose oppnådd ved å justere forrige prognose i retning av den forrige feilen med en brøkdel av 945. Er feilen gjort ved tid t. I den tredje versjonen er prognosen et eksponentielt vektet (dvs. nedsatt) glidende gjennomsnitt med rabattfaktor 1-945: Interpolasjonsversjonen av prognoseformelen er den enkleste å bruke hvis du implementerer modellen på et regneark: det passer inn i en enkeltcelle og inneholder cellehenvisninger som peker på forrige prognose, forrige observasjon og cellen der verdien av 945 er lagret. Merk at hvis 945 1 er SES-modellen tilsvarer en tilfeldig turmodell (uten vekst). Hvis 945 0 er SES-modellen ekvivalent med den gjennomsnittlige modellen, forutsatt at den første glattede verdien er satt lik gjennomsnittet. (Gå tilbake til toppen av siden.) Gjennomsnittsalderen for dataene i prognosen for enkel eksponensiell utjevning er 1 945 i forhold til perioden for prognosen beregnes. (Dette skal ikke være åpenbart, men det kan enkelt vises ved å vurdere en uendelig serie.) Derfor har den enkle, glidende gjennomsnittlige prognosen en tendens til å ligge bak vendepunktene med rundt 1 945 perioder. For eksempel, når 945 0,5 lag er 2 perioder når 945 0.2 lag er 5 perioder når 945 0,1 lag er 10 perioder, og så videre. For en gitt gjennomsnittlig alder (det vil si mengden lag), er prognosen for enkel eksponensiell utjevning (SES) noe bedre enn SMA-prognosen (Simple Moving Average) fordi den legger relativt mer vekt på den siste observasjonen - dvs. det er litt mer quotresponsivequot for endringer som oppstod i den siste tiden. For eksempel har en SMA-modell med 9 vilkår og en SES-modell med 945 0,2 begge en gjennomsnittlig alder på 5 for dataene i prognosene, men SES-modellen legger mer vekt på de siste 3 verdiene enn SMA-modellen og ved Samtidig er det ikke 8220forget8221 om verdier som er mer enn 9 år gamle, som vist i dette diagrammet. En annen viktig fordel ved SES-modellen over SMA-modellen er at SES-modellen bruker en utjevningsparameter som er kontinuerlig variabel, slik at den lett kan optimaliseres ved å bruke en quotsolverquot-algoritme for å minimere den gjennomsnittlige kvadratfeilen. Den optimale verdien av 945 i SES-modellen for denne serien viser seg å være 0,2961, som vist her: Gjennomsnittsalderen for dataene i denne prognosen er 10,2961 3,4 perioder, noe som ligner på et 6-sikt enkelt glidende gjennomsnitt. De langsiktige prognosene fra SES-modellen er en horisontal rett linje. som i SMA-modellen og den tilfeldige turmodellen uten vekst. Vær imidlertid oppmerksom på at konfidensintervallene som beregnes av Statgraphics, divergerer nå på en rimelig måte, og at de er vesentlig smalere enn konfidensintervallene for den tilfeldige turmodellen. SES-modellen antar at serien er noe mer forutsigbar enn den tilfeldige turmodellen. En SES-modell er faktisk et spesielt tilfelle av en ARIMA-modell. slik at den statistiske teorien om ARIMA-modeller gir et solid grunnlag for beregning av konfidensintervall for SES-modellen. Spesielt er en SES-modell en ARIMA-modell med en ikke-sesongforskjell, en MA (1) og ikke en konstant periode. ellers kjent som en quotARIMA (0,1,1) modell uten constantquot. MA (1) - koeffisienten i ARIMA-modellen tilsvarer mengden 1-945 i SES-modellen. For eksempel, hvis du passer på en ARIMA (0,1,1) modell uten konstant til serien analysert her, viser den estimerte MA (1) - koeffisienten seg å være 0,7029, som er nesten nøyaktig en minus 0,2961. Det er mulig å legge til antagelsen om en konstant lineær trend uten null som en SES-modell. For å gjøre dette oppgir du bare en ARIMA-modell med en ikke-sesongforskjell og en MA (1) - sikt med en konstant, dvs. en ARIMA-modell (0,1,1) med konstant. De langsiktige prognosene vil da ha en trend som er lik den gjennomsnittlige trenden observert over hele estimeringsperioden. Du kan ikke gjøre dette i forbindelse med sesongjustering, fordi sesongjusteringsalternativene er deaktivert når modelltypen er satt til ARIMA. Du kan imidlertid legge til en konstant langsiktig eksponensiell trend for en enkel eksponensiell utjevningsmodell (med eller uten sesongjustering) ved å bruke inflasjonsjusteringsalternativet i prognoseprosedyren. Den aktuelle kvoteringskvoten (prosentvekst) per periode kan estimeres som hellingskoeffisienten i en lineær trendmodell som er montert på dataene i forbindelse med en naturlig logaritme transformasjon, eller det kan være basert på annen uavhengig informasjon om langsiktige vekstutsikter . (Tilbake til toppen av siden.) Browns Lineær (dvs. dobbel) Eksponensiell utjevning SMA-modellene og SES-modellene antar at det ikke er noen trend av noe slag i dataene (som vanligvis er OK eller i det minste ikke altfor dårlig for 1- trinnvise prognoser når dataene er relativt støyende), og de kan modifiseres for å inkorporere en konstant lineær trend som vist ovenfor. Hva med kortsiktige trender Hvis en serie viser en varierende vekstnivå eller et syklisk mønster som skiller seg tydelig ut mot støyen, og hvis det er behov for å prognose mer enn 1 periode framover, kan estimering av en lokal trend også være et problem. Den enkle eksponensielle utjevningsmodellen kan generaliseres for å oppnå en lineær eksponensiell utjevning (LES) modell som beregner lokale estimater av både nivå og trend. Den enkleste tidsvarierende trendmodellen er Browns lineær eksponensiell utjevningsmodell, som bruker to forskjellige glatte serier som er sentrert på forskjellige tidspunkter. Forutsigelsesformelen er basert på en ekstrapolering av en linje gjennom de to sentrene. (En mer sofistikert versjon av denne modellen, Holt8217s, blir diskutert nedenfor.) Den algebraiske form av Brown8217s lineær eksponensiell utjevningsmodell, som den enkle eksponensielle utjevningsmodellen, kan uttrykkes i en rekke forskjellige, men liknende former. Denne standardmodellen er vanligvis uttrykt som følger: La S betegne den enkeltglattede serien som er oppnådd ved å anvende enkel eksponensiell utjevning til serie Y. Dvs. verdien av S ved period t er gitt av: (Husk at, under enkle eksponensiell utjevning, dette ville være prognosen for Y ved periode t1.) Lad deretter Squot betegne den dobbeltslettede serien oppnådd ved å anvende enkel eksponensiell utjevning (ved hjelp av samme 945) til serie S: Endelig prognosen for Y tk. for noe kgt1, er gitt av: Dette gir e 1 0 (det vil si lure litt, og la den første prognosen være den samme første observasjonen) og e 2 Y 2 8211 Y 1. hvoretter prognosene genereres ved å bruke ligningen ovenfor. Dette gir de samme monterte verdiene som formelen basert på S og S dersom sistnevnte ble startet med S 1 S 1 Y 1. Denne versjonen av modellen brukes på neste side som illustrerer en kombinasjon av eksponensiell utjevning med sesongjustering. Holt8217s Lineær eksponensiell utjevning Brown8217s LES-modell beregner lokale estimater av nivå og trend ved å utjevne de siste dataene, men det faktum at det gjør det med en enkelt utjevningsparameter, stiller en begrensning på datamønstrene som den kan passe: nivået og trenden er ikke tillatt å variere til uavhengige priser. Holt8217s LES-modellen løser dette problemet ved å inkludere to utjevningskonstanter, en for nivået og en for trenden. Til enhver tid t, som i Brown8217s modell, er det et estimat L t på lokalt nivå og et estimat T t av den lokale trenden. Her beregnes de rekursivt fra verdien av Y observert ved tid t og de forrige estimatene av nivået og trenden ved to likninger som gjelder eksponensiell utjevning til dem separat. Hvis estimert nivå og trend ved tid t-1 er L t82091 og T t-1. henholdsvis, da var prognosen for Y tshy som ville vært gjort på tidspunktet t-1, lik L t-1 T t-1. Når den faktiske verdien er observert, beregnes det oppdaterte estimatet av nivået rekursivt ved å interpolere mellom Y tshy og dens prognose, L t-1 T t 1, med vekt på 945 og 1- 945. Forandringen i estimert nivå, nemlig L t 8209 L t82091. kan tolkes som en støyende måling av trenden på tidspunktet t. Det oppdaterte estimatet av trenden beregnes deretter rekursivt ved å interpolere mellom L t 8209 L t82091 og det forrige estimatet av trenden, T t-1. ved bruk av vekter av 946 og 1-946: Fortolkningen av trend-utjevningskonstanten 946 er analog med den for nivåutjevningskonstanten 945. Modeller med små verdier på 946 antar at trenden bare endrer seg veldig sakte over tid, mens modeller med større 946 antar at det endrer seg raskere. En modell med en stor 946 mener at den fjerne fremtiden er veldig usikker, fordi feil i trendberegning blir ganske viktig når det regnes med mer enn en periode framover. (Tilbake til toppen av siden.) Utjevningskonstantene 945 og 946 kan estimeres på vanlig måte ved å minimere gjennomsnittlig kvadratfeil i de 1-trinns prognosene. Når dette gjøres i Statgraphics, viser estimatene seg å være 945 0.3048 og 946 0.008. Den svært små verdien av 946 betyr at modellen tar svært liten endring i trenden fra en periode til den neste, så i utgangspunktet prøver denne modellen å estimere en langsiktig trend. I analogi med begrepet gjennomsnittlig alder av dataene som brukes til å estimere det lokale nivået i serien, er gjennomsnittsalderen for dataene som brukes til estimering av lokal trenden, proporsjonal med 1 946, men ikke akkurat lik den . I dette tilfellet viser det seg å være 10 006 125. Dette er et svært nøyaktig tall, forutsatt at nøyaktigheten av estimatet av 946 er virkelig 3 desimaler, men det er av samme generelle størrelsesorden som prøvestørrelsen på 100, så denne modellen er i gjennomsnitt over ganske mye historie i estimering av trenden. Prognoseplanet nedenfor viser at LES-modellen anslår en litt større lokal trend i slutten av serien enn den konstante trenden som er estimert i SEStrend-modellen. Også den estimerte verdien på 945 er nesten identisk med den som oppnås ved å montere SES-modellen med eller uten trend, så dette er nesten den samme modellen. Nå ser disse ut som rimelige prognoser for en modell som skal estimere en lokal trend. Hvis du 8220eyeball8221 ser dette, ser det ut som om den lokale trenden har vendt nedover på slutten av serien. Hva har skjedd Parametrene til denne modellen har blitt estimert ved å minimere den kvadriske feilen på 1-trinns prognoser, ikke langsiktige prognoser, i hvilket tilfelle trenden gjør ikke en stor forskjell. Hvis alt du ser på er 1-trinns feil, ser du ikke det større bildet av trender over (si) 10 eller 20 perioder. For å få denne modellen mer i tråd med øyehals ekstrapoleringen av dataene, kan vi manuelt justere trendutjevningskonstanten slik at den bruker en kortere basislinje for trendestimering. Hvis vi for eksempel velger å sette 946 0,1, er gjennomsnittsalderen for dataene som brukes til å estimere den lokale trenden 10 perioder, noe som betyr at vi gjennomsnittsverdi trenden over de siste 20 perioder eller så. Here8217s hva prognosen tomten ser ut hvis vi setter 946 0,1 mens du holder 945 0.3. Dette ser intuitivt fornuftig ut på denne serien, selv om det er sannsynlig farlig å ekstrapolere denne trenden mer enn 10 perioder i fremtiden. Hva med feilstatistikken Her er en modell sammenligning for de to modellene vist ovenfor, samt tre SES-modeller. Den optimale verdien av 945. For SES-modellen er ca. 0,3, men tilsvarende resultater (med henholdsvis litt mer responstid) oppnås med 0,5 og 0,2. (A) Holts lineær eksp. utjevning med alfa 0,3048 og beta 0,008 (B) Holts lineær eksp. utjevning med alfa 0,3 og beta 0,1 (C) Enkel eksponensiell utjevning med alfa 0,5 (D) Enkel eksponensiell utjevning med alfa 0,3 (E) Enkel eksponensiell utjevning med alfa 0,2 Deres statistikk er nesten identisk, slik at vi virkelig kan velge på grunnlag av 1-trinns prognosefeil i dataprøven. Vi må falle tilbake på andre hensyn. Hvis vi sterkt tror at det er fornuftig å basere dagens trendoverslag på hva som har skjedd i løpet av de siste 20 perioder eller så, kan vi gjøre en sak for LES-modellen med 945 0,3 og 946 0,1. Hvis vi ønsker å være agnostiker om det er en lokal trend, kan en av SES-modellene være enklere å forklare, og vil også gi mer mid-of-the-road prognoser for de neste 5 eller 10 periodene. (Tilbake til toppen av siden.) Hvilken type trend-ekstrapolering er best: Horisontal eller lineær Empirisk bevis tyder på at hvis dataene allerede er justert (om nødvendig) for inflasjon, kan det være uhensiktsmessig å ekstrapolere kortsiktig lineær trender veldig langt inn i fremtiden. Trender som tyder på i dag, kan løsne seg i fremtiden på grunn av ulike årsaker som forverring av produkt, økt konkurranse og konjunkturnedganger eller oppgang i en bransje. Av denne grunn utfører enkle eksponensielle utjevning ofte bedre ut av prøven enn det ellers kunne forventes, til tross for sin kvadratiske kvadratiske horisontal trend-ekstrapolering. Dampede trendmodifikasjoner av den lineære eksponensielle utjevningsmodellen brukes også i praksis til å introdusere en konservatismeddel i sine trendprognoser. Den demonstrede LES-modellen kan implementeres som et spesielt tilfelle av en ARIMA-modell, spesielt en ARIMA-modell (1,1,2). Det er mulig å beregne konfidensintervall rundt langsiktige prognoser produsert av eksponentielle utjevningsmodeller, ved å betrakte dem som spesielle tilfeller av ARIMA-modeller. (Pass på: ikke alle programmer beregner konfidensintervaller for disse modellene riktig.) Bredden på konfidensintervaller avhenger av (i) RMS-feilen i modellen, (ii) type utjevning (enkel eller lineær) (iii) verdien (e) av utjevningskonstanten (e) og (iv) antall perioder fremover du forutsetter. Generelt sprer intervallene raskere da 945 blir større i SES-modellen, og de sprer seg mye raskere når lineær snarere enn enkel utjevning brukes. Dette emnet blir diskutert videre i ARIMA-modellene i notatene. (Tilbake til toppen av siden.) En kort introduksjon til moderne tidsserie Definisjon En tidsserie er en tilfeldig funksjon x t av et argument t i et sett T. Med andre ord er en tidsserie en familie av tilfeldige variabler. x t-1. x t. x t1. som tilsvarer alle elementene i settet T, hvor T skal være et tallbart, uendelig sett. Definisjon En observert tidsserie t t e T o T regnes som en del av en realisering av en tilfeldig funksjon x t. Et uendelig sett med mulige realiseringer som kunne ha blitt observert kalles et ensemble. For å si ting strengere er tidsserien (eller tilfeldig funksjon) en reell funksjon x (w, t) av de to variablene w og t, hvor wW og t T. Hvis vi fastsetter verdien av w. vi har en reell funksjon x (t w) av tiden t, som er en realisering av tidsseriene. Hvis vi fikser verdien av t, har vi en tilfeldig variabel x (w t). For et gitt tidspunkt er det en sannsynlighetsfordeling over x. Dermed kan en tilfeldig funksjon x (w, t) betraktes som enten en familie av tilfeldige variabler eller som en familie av realisasjoner. Definisjon Vi definerer distribusjonsfunksjonen til den tilfeldige variabelen w gitt t 0 som P o) x (x). På samme måte kan vi definere fellesfordelingen for n tilfeldige variabler. Poengene som skiller tidsserieanalyse fra vanlige statistiske analyser er følgende. (1) Avhengigheten av observasjoner på forskjellige kronologiske tidspunkter spiller en viktig rolle. Med andre ord er rekkefølgen av observasjoner viktig. I vanlig statistisk analyse antas det at observasjonene er gjensidig uavhengige. (2) Domenet til t er uendelig. (3) Vi må gjøre en innledning fra en realisering. Realiseringen av den tilfeldige variabelen kan bare observeres en gang på hvert tidspunkt. I multivariat analyse har vi mange observasjoner på et begrenset antall variabler. Denne kritiske forskjellen krever antagelsen om stationaritet. Definisjon Den tilfeldige funksjonen x t sies å være strengt stasjonær dersom alle de endelige dimensjonsfordelingsfunksjonene som definerer x t forblir de samme selv om hele gruppen av poeng t 1. t 2. t n forskyves langs tidsaksen. Det er, hvis for noen heltall t 1. t 2. t n og k. Grafisk kan man forestille realiseringen av en strengt stasjonær serie som å ha ikke bare det samme nivået i to forskjellige intervaller, men også den samme fordelingsfunksjonen, helt ned til parametrene som definerer den. Forutsetningen om stasjonar gjør våre liv enklere og mindre kostbare. Uten stasjonæritet måtte vi prøve prosessen ofte på hvert tidspunkt for å bygge opp en karakterisering av distribusjonsfunksjonene i den tidligere definisjonen. Stasjonar betyr at vi kan begrense vår oppmerksomhet til noen av de enkleste numeriske funksjonene, det vil si fordelingens øyeblikk. De sentrale øyeblikkene er gitt ved Definisjon (i) Middelverdien av tidsserien t er det første ordens øyeblikk. (ii) Autokovariansfunksjonen av t er det andre øyeblikket om middelverdien. Hvis ts har du variansen av x t. Vi vil bruke til å betegne autokovariansen til en stasjonær serie, hvor k betegner forskjellen mellom t og s. (iii) Autokorrelasjonsfunksjonen (ACF) av t er Vi vil bruke til å betegne autokorrelasjonen til en stasjonær serie, hvor k angir forskjellen mellom t og s. (iv) Den delvise autokorrelasjonen (PACF). f kk. er sammenhengen mellom z t og z tk etter at de har fjernet sin gjensidige lineære avhengighet av de mellomliggende variablene z t1. z t2. z tk-1. En enkel måte å beregne den delvise autokorrelasjonen mellom z t og z tk er å kjøre de to regresjonene og deretter beregne korrelasjonen mellom de to restvektorer. Eller, etter å måle variablene som avvik fra deres middel, kan den delvise autokorrelasjonen bli funnet som LS-regresjonskoeffisienten på z t i modellen der punktet over variabelen indikerer at det måles som en avvik fra dens gjennomsnitt. (v) Yule-Walker-ligningene gir et viktig forhold mellom de delvise autokorrelasjonene og autokorrelasjonene. Multipliser begge sider av ligning 10 ved z tk-j og ta forventninger. Denne operasjonen gir oss følgende forskjellsligning i autocovariances eller, når det gjelder autokorrelasjoner Denne tilsynelatende enkle representasjonen er virkelig et kraftig resultat. Nemlig, for j1,2. k kan vi skrive hele systemet av ligninger, kjent som Yule-Walker-ligningene. Fra lineær algebra vet du at matrisen av r s er fullstendig rangert. Derfor er det mulig å anvende Cramers regel suksessivt for k1,2. å løse systemet for de delvise autokorrelasjonene. De tre første er Vi har tre viktige resultater på strengt stasjonære serier. Implikasjonen er at vi kan bruke en hvilken som helst endelig realisering av sekvensen til å estimere gjennomsnittet. Sekund . hvis t er strengt stasjonær og E t 2 lt da Implikasjonen er at autokovariansen bare avhenger av forskjellen mellom t og s, ikke deres kronologiske punkt i tid. Vi kunne bruke noen par intervaller i beregningen av autokovariansen så lenge tiden mellom dem var konstant. Og vi kan bruke en hvilken som helst begrenset realisering av dataene til å estimere autocovariances. For det tredje er autokorrelasjonsfunksjonen i tilfelle strenge stasjonar gitt av Implikasjonen er at autokorrelasjonen bare avhenger av forskjellen mellom t og s, og igjen kan de estimeres ved en endelig realisering av dataene. Hvis målet vårt er å estimere parametere som er beskrivende av de mulige realisasjonene av tidsserien, er kanskje streng stasjonærhet for begrensende. For eksempel, hvis gjennomsnitt og covariances av x t er konstant og uavhengig av kronologisk punkt i tid, er det kanskje ikke viktig for oss at fordelingsfunksjonen er den samme for ulike tidsintervaller. Definisjon En tilfeldig funksjon er stasjonær i vid forstand (eller svakt stasjonær eller stasjonær i Khinchins-forstand eller kovarians stasjonær) hvis m 1 (t) m og m 11 (t, s). Strenge stasjonar innebærer ikke i seg selv svak stasjonaritet. Svak stasjonaritet betyr ikke strenge stasjonar. Strenge stasjonar med E t 2 lt innebærer svak stasjonaritet. Ergodiske teoremer er opptatt av spørsmålet om de nødvendige og tilstrekkelige forholdene for å gjøre innfall fra en enkelt realisering av en tidsserie. I utgangspunktet koker det seg ned for å anta svak stasjonæritet. Teorem Hvis t er svakt stasjonær med gjennomsnittlig m og kovariansfunksjon, da er det for noen gitt e gt 0 og h gt 0 det eksisterer et tall T o slik at for alle T gt T o. hvis og bare hvis dette er nødvendig og tilstrekkelig betingelse er at autocovariances dør ut, i hvilket tilfelle prøven er en konsistent estimator for populasjonsmiddelet. Corollary Hvis t er svakt stasjonær med E tk xt 2 lt for noen t, og E tk xtx tsk x ts er uavhengig av t for noe heltall s, så hvis og bare hvis hvor A konsekvens av sammenhengen er antakelsen om at xtx tk er svakt stasjonær. Den ergotiske setningen er ikke mer enn en lov av store tall når observasjonene er korrelerte. Man kan på dette punkt spørre om de praktiske implikasjonene av stasjonar. Den vanligste bruken av bruk av tidssergeteknikker er å modellere makroøkonomiske data, både teoretisk og atoretisk. Som et eksempel på den tidligere, kan man ha en multiplikator-akselerator modell. For at modellen skal være stasjonær, må parameterne ha visse verdier. En test av modellen er da å samle de relevante dataene og estimere parametrene. Hvis estimatene ikke stemmer overens med stasjonar, må man revurdere enten den teoretiske modellen eller statistisk modell eller begge deler. Vi har nå nok maskiner til å begynne å snakke om modellering av univariate tidsseriedata. Det er fire trinn i prosessen. 1. bygge modeller fra teoretisk ogor erfaringskunnskap 2. identifisere modeller basert på dataene (observerte serier) 3. tilpasse modellene (estimere parametrene til modellen / modellene) 4. sjekke modellen Hvis det i fjerde trinn ikke er vi fornøyd, vi går tilbake til første trinn. Prosessen er iterativ til ytterligere kontroll og respektering gir ingen ytterligere forbedring i resultatene. Diagrammatisk definisjon Enkelte enkle operasjoner inkluderer følgende: Backshift operatøren Bx tx t-1 Foroveroperatøren Fx tx t1 Forskjellen operatør 1 - B xtxt - x t-1 Differansen operatøren oppfører seg på en måte som stemmer overens med konstanten i en uendelig serie . Det vil si at dets inverse er grensen til en uendelig sum. Nemlig, -1 (1-B) -1 1 (1-B) 1BB 2. Integreringsoperatøren S -1 Siden det er invers av differanseoperatøren, tjener integrasjonsoperatøren til å konstruere summen. MODELL BUILDING I denne delen gir vi en kort gjennomgang av de vanligste typene av tidsseriemodeller. På grunnlag av kunnskap om datagenereringsprosessen velger man en klasse av modeller for identifisering og estimering fra mulighetene som følger. Definisjon Anta at Ex t m er uavhengig av t. En modell som med egenskapene kalles den autoregressive bestillingsmodellen p, AR (p). Definisjon Hvis en tidsavhengig variabel (stokastisk prosess) tilfredsstiller, t, er det sagt å tilfredsstille Markov-egenskapen. På LHS er forventningen betinget av den uendelige historie x t. På RHS er det betinget av kun en del av historien. Fra definisjonene er en AR (p) - modell sett til å tilfredsstille Markov-eiendommen. Ved hjelp av backshift-operatøren kan vi skrive vår AR-modell som teorem En nødvendig og tilstrekkelig betingelse for at AR (p) - modellen skal være stasjonær, er at alle røttene til polynomet ligger utenfor enhetens sirkel. Eksempel 1 Vurder AR (1) Den eneste roten av 1 - f 1 B 0 er B 1 f 1. Forutsetningen for stasjonar krever det. Hvis da ser den observerte serien ut veldig frenetisk. F. eks vurdere hvor den hvite støyperioden har en normal fordeling med null-middel og en varians av en. Observasjonene bytter tegn med nesten alle observasjoner. Hvis derimot, vil den observerte serien bli mye jevnere. I denne serien har en observasjon en tendens til å ligge over 0 hvis forgjengeren var over null. Variansen av e t er s e 2 for alle t. Variansen av x t. når det er null, er gitt av Siden serien er stasjonær kan vi skrive. Derfor er autokovariansfunksjonen til en AR (1) - serie, uten å miste generalitet m 0 For å se hvordan dette ser ut som AR-parametrene, vil vi gjøre bruk av det faktum at vi kan skrive xt som følger Multiplikasjon med x tk og ta forventninger Merk at autocovariances dør ut som k vokser. Autokorrelasjonsfunksjonen er autokovariansen dividert med variansen av den hvite støybegrepet. Eller,. Ved bruk av tidligere Yule-Walker-formler for de delvise autokorrelasjonene vi har For en AR (1) dør autokorrelasjonene eksponentielt og de delvise autokorrelasjonene viser en spike ved ett lag og er null deretter. Eksempel 2 Vurder AR (2) Det tilhørende polynomet i lagoperatøren er. Røttene kunne bli funnet ved hjelp av den kvadratiske formelen. Røttene er når røttene er ekte, og følgelig vil serien falle eksponentielt som svar på et sjokk. Når røttene er komplekse og serien vil vises som en dempet skiltbølge. Stasjonarsteorien pålegger følgende forhold på AR-koeffisientene Autokovariansen for en AR (2) - prosess, med null-middel, er Deling gjennom av variansen av xt gir autokorrelasjonsfunksjonen Siden vi kan skrive Tilsvarende for andre og tredje autokorrelasjoner Den andre Autocorrelations er løst for rekursivt. Deres mønster styres av røttene til den andre ordens lineære forskjellligning Hvis røttene er ekte, vil autokorrelasjonene synke eksponentielt. Når røttene er komplekse, vil autokorrelasjonene vises som en dempet sinusbølge. Ved hjelp av Yule-Walker-ligningene, er de delvise autokorrelasjoner igjen, de autokorrelasjoner dør sakte ut. Den delvise autokorrelasjonen derimot er ganske særpreget. Den har pigger på en og to lags og er null etterpå. Stilling Hvis x t er en stasjonær AR (p) prosess, kan den tilsvarende skrives som en lineær filtermodell. Det vil si at polynomet i backshift-operatøren kan bli omvendt og AR (p) skrevet som et bevegelig gjennomsnitt av uendelig rekkefølge i stedet. Eksempel Anta at z t er en AR (1) prosess med null gjennomsnitt. Det som er sant for den nåværende perioden må også være aktuelt for tidligere perioder. Dermed ved rekursiv substitusjon kan vi skrive Square begge sider og ta forventninger høyre side forsvinner som k siden f 1. Derfor summen konvergerer til z t i kvadratisk gjennomsnitt. Vi kan omskrive AR (p) modellen som et lineært filter som vi vet å være stasjonære. Autokorrelasjonsfunksjonen og partiell autokorrelasjon Generelt antar at en stasjonær serie z t med gjennomsnittlig null er kjent for å være autoregressiv. Autokorrelasjonsfunksjonen til en AR (p) er funnet ved å ta forventningene til og deles gjennom av variansen av z t Dette forteller oss at r k er en lineær kombinasjon av tidligere autokorrelasjoner. Vi kan bruke dette ved å bruke Cramers regel til (i) å løse for f kk. Spesielt kan vi se at denne lineære avhengigheten vil forårsake f kk 0 for k gt p. Dette karakteristiske trekk ved autoregressive serier vil være svært nyttig når det gjelder identifisering av en ukjent serie. Hvis du har enten MathCAD eller MathCAD Explorer, kan du eksperimentere interactivley med noen for AR (p) ideene presentert her. Flytte gjennomsnittsmodeller Vurder en dynamisk modell der serien av interesse bare avhenger av en del av historien om den hvite støyperioden. Diagrammatisk kan dette være representert som Definisjon Anta at t er en ukorrelert sekvens av i. i.d. tilfeldige variabler med null gjennomsnittlig og endelig varianse. Deretter er en flytende gjennomsnittlig prosess av orden q, MA (q), gitt ved teoremet: En glidende gjennomsnittlig prosess er alltid stasjonær. Bevis: I stedet for å starte med et generelt bevis vil vi gjøre det for et bestemt tilfelle. Anta at z t er MA (1). Deretter . Selvfølgelig har en t null og endelige varians. Middelet av z t er alltid null. Autocovariances vil bli gitt av Du kan se at gjennomsnittet av den tilfeldige variabelen ikke er avhengig av tid på noen måte. Du kan også se at autokovariansen bare er avhengig av offset s, ikke på hvor i serien vi starter. Vi kan bevise det samme resultatet mer generelt ved å begynne med, som har den alternative glidende gjennomsnittlige representasjonen. Tenk først variansen av z t. Ved rekursiv substitusjon kan du vise at dette er lik Summen vi vet er en konvergent serie, slik at variansen er endelig og er uavhengig av tiden. Kovarianene er, for eksempel, Du kan også se at auto covariances avhenger bare av de relative punktene i tid, ikke det kronologiske tidspunktet. Vår konklusjon fra alt dette er at en MA () - prosess er stasjonær. For den generelle MA (q) prosessen blir autokorrelasjonsfunksjonen gitt av Den delvise autokorrelasjonsfunksjonen vil dø ut jevnt. Du kan se dette ved å invertere prosessen for å få en AR () - prosess. Hvis du har enten MathCAD eller MathCAD Explorer, kan du eksperimentere interaktivt med noen av MA (q) ideene presentert her. Mixed Autoregressive - Moving Average Models Definisjon Anta at t er en ukorrelert sekvens av i. i.d. tilfeldige variabler med null gjennomsnittlig og endelig varianse. Deretter gis en autoregressiv, bevegelig gjennomsnittsprosessordre (p, q), ARMA (p, q) av Roter til den autoregressive operatøren må alle ligge utenfor enhetens sirkel. Antall ukjente er pq2. P og q er åpenbare. De 2 inkluderer prosessnivået, m. og variansen av det hvite støybegrepet, sa 2. Anta at vi kombinerer våre AR - og MA-representasjoner slik at modellen er og koeffisientene normaliseres slik at bo 1. Da kalles denne representasjonen en ARMA (p, q) hvis røtter av (1) alle ligger utenfor enhetens sirkel. Anta at y t måles som avvik fra gjennomsnittet slik at vi kan slippe en o. da er autokovariansfunksjonen avledet fra hvis jgtq da MA-vilkårene faller ut i forventning om å gi. Det vil si, autokovariansfunksjonen ser ut som en typisk AR for lags etter at q de dør jevnt etter q, men vi kan ikke si hvordan 1,2,133, q vil se ut Vi kan også undersøke PACF for denne klassen av modellen. Modellen kan skrives som Vi kan skrive dette som en MA (inf) prosess som tyder på at PACFene dør sakte. Med noen aritmetikk kunne vi vise at dette skjer bare etter de første p-pigger bidratt av AR-delen. Empirisk lov I virkeligheten kan en stasjonær tidsserie vel være representert av p 2 og q 2. Hvis virksomheten din skal gi en god tilnærming til virkeligheten og godheten til passform er kriteriet ditt, så foretrekkes en fortapt modell. Hvis interessen din er prediktiv effektivitet, er den parsimoniske modellen foretrukket. Eksperimenter med ARMA-ideene presentert ovenfor med et MathCAD-regneark. Autoregressive Integrere Flytte Gjennomsnittlige Modeller MA-filter AR-filter Integrere filter Noen ganger er prosessen eller serien vi prøver å modellere ikke stasjonær i nivåer. Men det kan være stasjonært i, for eksempel, første forskjeller. Det er, i sin opprinnelige form, kanskje ikke autocovariances for serien ikke være uavhengig av det kronologiske tidspunktet. Men hvis vi bygger en ny serie som er de første forskjellene i den opprinnelige serien, oppfyller denne nye serien definisjonen av stasjonar. Dette er ofte tilfelle med økonomiske data som er svært trended. Definisjon Anta at z t ikke er stasjonær, men z t - z t-1 tilfredsstiller definisjonen av stasjonar. Også, den hvite støybegrepet har endelig mål og varians. Vi kan skrive modellen som dette heter en ARIMA (p, d, q) modell. p identifiserer rekkefølgen til AR-operatøren, d identifiserer strømmen på. q identifiserer rekkefølgen til MA-operatøren. Hvis røttene til f (B) ligger utenfor enhetens sirkel, kan vi omskrive ARIMA (p, d, q) som et lineært filter. Dvs. Det kan skrives som en MA (). Vi forbeholder oss diskusjonen om deteksjon av enhetsrøtter for en annen del av forelesningsnotatene. Tenk på et dynamisk system med x t som en inngangsserie og y t som en utgangsserie. Diagrammatisk vi har Disse modellene er en diskret analogi av lineære differensialligninger. Vi antar følgende forhold hvor b indikerer en ren forsinkelse. Husk det (1-B). Gjør denne substitusjonen, modellen kan skrives Hvis koeffisientpolynomet på y t kan inverteres, kan modellen skrives som V (B) kalles impulsresponsfunksjonen. Vi vil komme over denne terminologien igjen i vår senere diskusjon av vektorgotoregressive. kointegrerings - og feilkorrigeringsmodeller. MODELL IDENTIFIKASJON Etter å ha bestemt seg for en klasse av modeller, må man nå identifisere rekkefølgen av prosessene som genererer dataene. Det vil si at man må gjøre beste gjetninger når det gjelder rekkefølgen av AR - og MA-prosessene som kjører den stasjonære serien. En stasjonær serie kjennetegnes fullstendig av sine middel - og autokonferanser. Av analytiske grunner jobber vi vanligvis med autokorrelasjoner og delvise autokorrelasjoner. Disse to grunnleggende verktøyene har unike mønstre for stasjonære AR - og MA-prosesser. Man kunne beregne utvalgsestimater av autokorrelasjon og delvise autokorrelasjonsfunksjoner og sammenligne dem med tabulerte resultater for standardmodeller. Eksempel Autokovarians Funksjon Eksempel Autokorrelasjonsfunksjon Prøve-delvise autokorrelasjoner vil være Bruke autokorrelasjoner og delvise autokorrelasjoner er ganske enkelt i prinsippet. Anta at vi har en serie z t. med null betyr, som er AR (1). Hvis vi skulle kjøre regresjonen av z t2 på z t1 og z t, ville vi forvente å finne at koeffisienten på z t ikke var forskjellig fra null siden denne delvise autokorrelasjonen burde være null. På den annen side bør autokorrelasjonene for denne serien falle eksponentielt for økende lag (se AR (1) eksempelet ovenfor). Anta at serien er virkelig et bevegelige gjennomsnitt. Autokorrelasjonen skal være null overalt, men ved første lag. Den delvise autokorrelasjonen burde dø eksponentielt. Til og med fra vår veldig overskyede tromme gjennom grunnleggende tidsserier, er det tydelig at det er en dualitet mellom AR og MA prosesser. Denne dualiteten kan oppsummeres i følgende tabell.

No comments:

Post a Comment