Friday, 24 November 2017

Moving genomsnittet ekonometri


Flyttande medelvärde - MA. BREAKING DOWN Moving Average - MA. As ett SMA-exempel, överväga en säkerhet med följande stängningskurser över 15 dagar. Vecka 1 5 dagar 20, 22, 24, 25, 23.Veek 2 5 dagar 26, 28 , 26, 29, 27.Veek 3 5 dagar 28, 30, 27, 29, 28.A 10-dagars MA skulle genomsnittliga slutkurserna för de första 10 dagarna som första datapunkt. Nästa datapunkt skulle släppa den tidigaste Pris, lägg till priset på dag 11 och ta medeltalet och så vidare som visas nedan. Som noterat tidigare lagrar MAs nuvarande prisåtgärd eftersom de är baserade på tidigare priser, ju längre tid för MA, desto större är lagret en 200-dagars MA kommer att ha en mycket större grad av fördröjning än en 20-dagars MA eftersom den innehåller priser för de senaste 200 dagarna. Den längd som MA ska använda beror på handelsmålen, med kortare MAs som används för kortfristig handel Och långsiktiga MAs passar bättre för långsiktiga investerare 200-dagars MA följs i stor utsträckning av investerare och handlare, med raster över och under denna glidande genomsnittliga konsi Många av de viktigaste handelssignalerna är att de också ger viktiga handelssignaler på egen hand eller när två genomsnitt överstiger. En stigande MA indikerar att säkerheten är i en uptrend medan en minskande MA indikerar att den ligger i en nedåtgående trend. På liknande sätt är uppåtgående momentum Bekräftas med en bullish crossover som uppstår när en kortsiktig MA korsar en längre sikt MA Downward momentum bekräftas med en baisse crossover, som uppstår när en kortsiktig MA korsar en längre sikt MA. Tänk dig att du har uppgifter om priser för många produkter. För var och en av produkterna spelar du in veckoprisinformation. förstått obs 200.gen prodid n. Varje produkt har ett unikt genomsnittspris för produktpriset. 7. Du har uppgifter om veckopriserna i 200 veckor, expandera 200 bysort prodid gen t n label var t Week. Det finns också vissa säsongsvariationer säsongsbetonade 2 sin pi t 50. Förutom en generell tidstrendsgen trend t 005. Den första observationen är inte korrelerad med något genpris prodprice 2 5 trend rpoisson 10 10 om t 1 ersätta prisprodukt 2 Trend säsong 7 pris n-1 3 rpoisson 10 10 om t 2 ersätt pris prissättning trend säsongsbetonad 5 pris n-1 2 pris n-2 3 rpoisson 10 10 om t 3 ersätt pris prissättning trend säsong 3 pris n-1 2 pris n - 2 2 pris n-3 3 rpoisson 10 10 om t 4 ersätt prissättning trend säsong 3 pris n-1 175 pris n-2 125 pris n-3 1 pris n-4 3 rpoisson 10 10 om t 4. Skapa en globabl till Butik globala twograph. forv i 1 6 globala twograph line pris t om prodid i. twoway twograph, legend off title Sann prisutveckling för första sex produkter. Låt oss nu föreställa oss att ovanstående genererade data är den sanna prisinformationen som är fundamentalt observerbar. Istället har du flera samlingar av data per vecka på priser som variera beroende på några slumpmässiga tillsatsfel expandera 3.bysort prodid t gen prodobs n. gen pricecollect price normal 25. Men den prisinformation som du har har några poster som 10 har misstag Inmatad fel. gen entryerror rbinomial 1, 1 gen scalarror rormal 1.gen priceobs pricecollect 1 entryerror scalarerror label var priceobs Registrerat pris. Dessutom samlades 35 av dina prisuppgifter aldrig i gen saknade rbinomial 1, 35.drop om du saknar 1. Skapa en globabl för att lagra global twograph. forv i 1 6 globala twograph line priceobs t om du vill prodobs 1.twoway twograph, legend Off title Observerade prisutvecklingar för de första sex produkterna. Det finns inga priser för prodid entryerror Jag håller inmatningsfelet i datamängden som ett medel för jämförelse men det skulle inte observeras direkt. Frågan är. Kan du nu med denna röriga data återställa prisdata som liknar originalet. Det första som vi ska utnyttja är duplikatet inspelat data. scatter priceobs t om prodid 1, title Det är lätt att se enskilda avvikelser. Det är lätt att se enskilda avvikelser men vi vill inte gå igenom alla 200 produkter för att identifiera enskilda prisutjämnare. Vi vill komma fram till ett system för att identifiera avvikare. Låt s generera en genomsnittlig produkt och tid förkortad med egna prissatta medelvärden. Låt s flagga någon observation som är 120 större än medelvärdet eller 80 mindre än den genomsnittliga genflaggan Prisvärda prisobs 1 2 prisvärda prisobs 8. Låt oss se hur det fungerar två scatter priceobs t om prodid 1 scatter priceobs t om prodid 1 flagga 1 Msymbol lgx title Några av outliers kan identifieras bara titta på den genomsnittliga legenden off. corr flag entryerror Vår flagga är korrelerad ca 45 med postfel Det är bra men vi kan göra det bättre. Jag föreslår det istället för att använda bara medelvärdet att vi konstruerar ett glidande medelvärde av priser och se hur varje inmatning avviker från medelvärdet. Det enda problemet är att det rörliga genomsnittliga kommandot kräver xtset och det kräver bara en post per tidsperiod. Så säger jag Vi omkalkar tidsvariabeln och lägger till som om den spelades in vid en annan tidpunkt i veckan observationsnumret. Vi behöver nyligen generera prodob eftersom vi inte vet vilken observation som saknas från varje produkt genom att producera produktionen av prodobs n. gen t2 t 4 prodobs. Xtset anger panelens datapanel ID och tidsserie nivå xtset prodid t2. Kommandot vi ska använda är tssmooth. Det är kodat så att genom att ange ma betyder det att flytta genomsnittet och fönstret berättar för Stata hur många tidsperioder som ska räknas framåt och hur många bakom i den rörliga luftningen. Detta kommando kan ta en stund medan mamma ma kartriceobs priceobs är fönster 23 0 23 23 i Effekt 5 veckor framåt och 5 veckor bakom 0 berättar stata att inte inkludera sig själv i det genomsnittet. Det rörliga genomsnittet två scatter priceobs t om prodid 1 line mapriceobs t om prodid 1 line pricemean t om prodid 1 titel Moving Average är mindre acceptabelt för outliers. Det rörliga genomsnittet är stabilare än bara tidsgenomsnittet. Låt oss försöka flagga med hjälp av det glidande medelhöljet släpp flagg 2 gen flag2 mapriceobs priceobs 1 2 mapriceobs priceobs 8.two scatter priceobs t om prodid 1 scatter priceobs t om prodid 1 flag2 1 msymbol lgx titel Moving Average kan också vara användbar legend off. corr Flag2 entryerror. Släpp vår flaggade dataförlust om flag2 1. Kollapsa till den veckovisa nivån, kollapsa prisobs, med hjälp av etiketten var priceobs Medelpris observerat. forv i 1 6 globalt twograph scatter priceobs t om prodid i. twoway twograph, legend off title Observerade prisutvecklingar för Första sex produkterna Data ser mycket bättre ut, men vi har fortfarande tydligt några oönskade outliers. Vi skulle kunna dra nytta av produktutvecklingarna för att hjälpa till att identifiera avvikelser inom produktpriserna med hjälp av en egenprisvärde. Prisvärda prisobs. Om prodid 1 förutsäger resid1, restual. reg priceobs aveprice om prodid 2 förutsäger resid2, restual. reg priceobs aveprice om prodid 3 förutsäga resid3, residual. twoway line resid1 t om prodid 1 line priceobs t om prodid 1 line resid2 t om prodid 2 line priceobs t om prodid 2 line resid3 t om prodid 3 line priceobs t om prodid 3 title Resterna är tydliga indikatorer på Outliers legenden utanför. Slutligen låt oss släppa observationer med rester som är större än 1 5 standardavvikelser från medelvärdet. qui forv 1 200 reg priceobs aveprice om prodid jag förutspår residtemp, rest summa resttemp ersätt flagga residtemp-r medelvärde r sd 1 5 residtemp-r Genomsnittlig droppe residtemp. Låt oss se hur det fungerar två scatter priceobs t om prodid 2 scatter priceobs t om prodid 2 flagga 1 msymbol lgx title Nu försöker du bara ta bort några slutliga avvikande legenden av. Plotting produkt 1 prissättning i förhållande till utestängare globala twograph. forv i 1 6 globala twograph line priceobs t om prodid i. Slutligen släppa outliers fallet om flagga. En sista graf global twograph. forv i 1 6 global twograph scatter priceobs t om prodid i. twoway twograph, legend off title Observerade prisutvecklingar för första sex produkter. Inte lika ren som vår första graf men definitivt mycket förbättrad. Medelvärdena. Vid medelvärden. Med konventionella dataset är medelvärdet ofta det första och en av de mest användbara sammanfattningsstatistikerna för att beräkna När data är i form av en tidsserie , Seriens medelvärde är en användbar åtgärd men återspeglar inte dataens dynamiska natur. Medelvärden som beräknas över korta perioder, antingen före den aktuella perioden eller centrerad under den aktuella perioden, är ofta mer användbara eftersom sådana medelvärden kommer att variera, eller flytta när den aktuella perioden flyttas från tiden t2, t3 etc de är kända som rörliga medelvärden Mas Ett enkelt glidande medelvärde är typiskt det obesvättade medlet av k tidigare värden Ett exponentiellt vägt rörligt medelvärde är väsentligen detsamma som ett enkelt glidande medelvärde, men med bidrag till medelvärdet viktat av deras närhet till den aktuella tiden Eftersom det inte finns en, men en hel serie av glidande medelvärden för en given serie, kan Mas-uppsättningen själva plottas på Grafer analyseras som en serie och används vid modellering och prognoser En rad modeller kan konstrueras med hjälp av rörliga medelvärden, och dessa är kända som MA-modeller. Om sådana modeller kombineras med autoregressiva AR-modeller är de resulterande kompositmodellerna kända som ARMA eller ARIMA modeller jag är för integrated. Simple moving average. Eftersom en tidsserie kan betraktas som en uppsättning värden, kan t 1,2,3,4, n genomsnittet av dessa värden beräknas om vi antar att n är ganska Stor och vi väljer ett heltal k som är mycket mindre än n vi kan beräkna en uppsättning blockmedelvärden eller enkla rörliga medelvärden av ordning k. Varje åtgärd representerar genomsnittet av datavärdena över ett intervall av k observationer Observera att den första möjlig MA i ordning k 0 är det för tk Mer generellt kan vi släppa det extra prenumerationen i ovanstående uttryck och skriva. Detta säger att det uppskattade medelvärdet vid tiden t är det enkla genomsnittet av det observerade värdet vid tiden t och föregående k - 1 gång steg Om vikter är app Ljög som minskar bidraget från observationer som är längre bort i tiden, sägs det glidande medlet vara exponentiellt slätat. Flyttande medel används ofta som en form av prognoser, varvid det uppskattade värdet för en serie vid tiden t 1, S t 1 är Tagen som MA för perioden fram till och med tiden teg dagens estimering baseras på ett genomsnitt av tidigare inspelade värden fram till och med igår s för dagliga data. Enkela glidande medelvärden kan ses som en form av utjämning I det illustrerade exemplet Nedan har luftföroreningens dataset som visas i introduktionen till detta ämne ökat med en 7-dagars glidande genomsnittlig MA-linje, som visas här i rött. Såsom kan ses, släpper MA-linjen ut topparna och trågen i data och kan vara väldigt användbar för att identifiera trender Den vanliga framräkningsformeln innebär att de första k -1 datapunkterna inte har något MA-värde, men därefter sträcker sig beräkningarna till den slutliga datapunkten i serien. PM10 dagliga medelvärden, Greenwich. source London Luftkvalitetsnätverk. En anledning till att beräkna enkla rörliga medelvärden på det sätt som beskrivs är att det gör det möjligt att beräkna värden för alla tidsluckor från tid tk fram till idag, och som en ny mätning erhålls för tid t 1, är MA för tiden t 1 kan läggas till den redan beräknade uppsättningen. Detta ger en enkel procedur för dynamiska dataset. Det finns emellertid vissa problem med detta tillvägagångssätt. Det är rimligt att hävda att medelvärdet under de senaste 3 perioderna ska vara placerat i tid t-1, inte tiden t och för en MA över ett jämnt antal perioder, kanske det borde ligga i mitten mellan två tidsintervall. En lösning på denna fråga är att använda centrerade MA-beräkningar, där MA vid tid t är medelvärdet av en symmetrisk uppsättning värden runt t Trots det uppenbara meriterna används denna metod inte allmänt eftersom det krävs att data är tillgänglig för framtida händelser, vilket kanske inte är fallet. I fall där analysen helt och hållet består av en befintlig serie, användningen Av centrerad Mas kan vara att föredra. Enkela glidande medelvärden kan betraktas som en form av utjämning, avlägsna vissa högfrekventa komponenter i en tidsserie och markera men inte ta bort trender på samma sätt som det allmänna begreppet digital filtrering. en form av linjärt filter Det är möjligt att applicera en glidande medelberäkning till en serie som redan har blivit utjämnad, dvs utjämning eller filtrering av en redan slätad serie. Till exempel med ett glidande medelvärde av order 2 kan vi betrakta det som beräknat med användning av Vikter, så MA vid x 2 0 5 x 1 0 5 x 2 På samma sätt kan MA vid x 3 0 5 x 2 0 5 x 3 Om vi ​​tillämpar en andra nivå av utjämning eller filtrering har vi 0 5 x 2 0 5 x 3 0 5 0 5 x 1 0 5 x 2 0 5 0 5 x 2 0 5 x 3 0 25 x 1 0 5 x 2 0 25 x 3 dvs 2-stegs filtreringsprocessen eller fällningen har skapat en variabelt viktad symmetrisk rörelse Medelvärde, med vikter Flera omvandlingar kan producera ganska komplexa viktade glidmedel, varav några har varit fou nd av särskild användning inom specialiserade områden, såsom i livförsäkringsberäkningar. Flyttande medelvärden kan användas för att avlägsna periodiska effekter om de beräknas med periodens längd som känd. Exempelvis kan med månadsdata säsongsvariationer ofta avlägsnas om detta är målet med att använda ett symmetriskt 12 månaders glidande medelvärde med alla månader viktat lika, förutom det första och det sista som vägs med 1 2 Detta beror på att det kommer att finnas 13 månader i den symmetriska modellen nuvarande tid, t - 6 månader Totalt är Dividerat med 12 Liknande procedurer kan antas för vilken väldefinierad periodicitet. Exponentialt viktat glidmedelvärde EWMA. Med den enkla glidande medelformeln. Alla observationer är lika viktiga. Om vi ​​kallade dessa lika vikter skulle t var och en av k-vikterna motsvara 1 k så summan av vikterna skulle vara 1 och formeln skulle vara. Vi har redan sett att flera tillämpningar av denna process resulterar i vikterna varierande med exponentiellt vägd rörlig avera ges bidraget till medelvärdet från observationer som är mer borttagna i tid är övervägd minskad, vilket betonar senare lokala händelser. I huvudsak införs en utjämningsparameter, 0 1, och formeln reviderades till. En symmetrisk version av denna formel skulle vara av formuläret. Om vikterna i den symmetriska modellen väljas som villkoren för binomialexpansionen, kommer 1 2 1 2 2q att summera till 1 och när q blir stor kommer den att approximera normalfördelningen. Detta är ett formulär av kärnviktning, med binomialen som funktion som kärnfunktionen Den tvåstegsformning som beskrivs i föregående stycke är just detta arrangemang med q 1, vilket ger vikterna. Vid exponentiell utjämning är det nödvändigt att använda en uppsättning vikter som summerar till 1 och vilka geometriskt reduceras i vikt. Vikten som används är vanligtvis av formen. För att visa att dessa vikter summerar till 1, överväga utvidgningen av 1 som en serie Vi kan skriva. och expandera uttrycket i parentes med hjälp av Binomialformeln 1- xp där x 1- och p-1, vilket ger. Detta ger då en form av viktat glidande medelvärde av formuläret. Denna summering kan skrivas som en återkommande relation. som förenklar beräkningen kraftigt och undviker problemet att vikningsregimen strikt bör vara oändlig för vikterna att summa till 1 för små värden av detta är vanligen inte fallet. Notationen som används av olika författare varierar. Vissa använder bokstaven S för att indikera att formeln i huvudsak är en jämn variabel och skriv . Därför använder kontrollteori litteraturen ofta Z i stället för S för de exponentiellt viktade eller jämnda värdena, se exempelvis Lucas och Saccucci, 1990, LUC1 och NIST-webbplatsen för mer detaljer och fungerade exempel. Formlerna som nämns ovan härstammar från arbetet av Roberts 1959, ROB1, men Hunter 1986 använder HUN1 ett uttryck av formuläret. Det kan vara mer lämpligt för användning i vissa kontrollförfaranden Med 1 är medelvärdet enkelt det uppmätta värdet eller värdet av Föregående dataobjekt Med 0 5 är uppskattningen det enkla rörliga genomsnittsvärdet för nuvarande och tidigare mätningar. I prognosmodeller används värdet S t ofta som uppskattning eller prognosvärde för nästa tidsperiod, dvs som uppskattning för x vid tid t 1 Således har vi. Detta visar att prognosvärdet vid tid t 1 är en kombination av det föregående exponentiellt vägda glidande medlet plus en komponent som representerar det viktade prediktionsfelet vid tidpunkten t. Assuming en tidsserie ges och en prognos krävs. Ett värde krävs. Detta kan beräknas från befintliga data genom att utvärdera summan av kvadrerade prediktionsfel som erhålls med varierande värden för varje t 2,3, varvid den första uppskattningen är det första observerade datavärdet, x 1 In kontrollapplikationer värdet av är viktigt i det är används vid bestämning av de övre och nedre kontrollgränserna och påverkar den genomsnittliga körlängden ARL som förväntas innan dessa kontrollgränser bryts under antagandet Att tidsserierna representerar en uppsättning slumpmässiga, identiskt fördelade oberoende variabler med gemensam varians Under dessa omständigheter är variansen av kontrollstatistiken Lucas och Saccucci, 1990. Kontrollgränser brukar anges som fasta multiplar av denna asymptotiska varians, t. ex. gånger standardavvikelsen Om exempelvis 0 25 och data som övervakas antas ha en Normalfördelning, N 0,1, vid kontroll, kommer kontrollgränserna att vara - 134 och processen kommer att nå en eller annan gräns I 500 steg i genomsnitt Lucas och Saccucci 1990 LUC1 härled ARLs för ett brett spektrum av värden och under olika antaganden med användning av Markov Chain-förfaranden De tabulerar resultaten, inklusive att tillhandahålla ARL när medelvärdet av kontrollprocessen har skiftats av en del multipel av Standardavvikelse Till exempel med ett 0 5-skift med 0 25 är ARL mindre än 50-stegssteg. Tillvägagångssätten som beskrivs ovan är kända som en enda exponentiell utjämning, eftersom förfarandena är ap En gång till tidsserierna och sedan analyseras eller kontrollprocesser utförs på den resulterande utjämnade datasatsen Om datasetet innehåller en trend och eller säsongsmässiga komponenter kan två - eller tre-stegs exponentiell utjämning användas för att undanröja explicit modellering av dessa Effekter se vidare avsnittet om prognos nedan och NIST-arbetet. CHA1 Chatfield C 1975 Analysen av Times Series Theory and Practice Chapman och Hall, London. HUN1 Hunter J S 1986 Det exponentiellt vägda glidande medlet J av Quality Technology, 18, 203-210. LUC1 Lucas J M, Saccucci M S 1990 Exponentiellt vägda rörliga medelkontrollsystem Egenskaper och förbättringar Technometrics, 32 1, 1-12. ROB1 Roberts S W 1959 Kontrolldiagramtester baserat på geometriska rörliga medelvärden Technometrics, 1, 239-250.

No comments:

Post a Comment