Wednesday 16 August 2017

Contoh rata rata bergerak rata


Moving averages Moving averages Dengan dataset konvensional, nilai rata-rata seringkali merupakan yang pertama, dan salah satu statistik ringkasan yang paling berguna untuk dihitung. Bila data dalam bentuk deret waktu, mean seri adalah ukuran yang berguna, namun tidak mencerminkan sifat dinamis data. Nilai rata-rata yang dihitung selama periode korsleting, baik sebelum periode sekarang atau berpusat pada periode berjalan, seringkali lebih bermanfaat. Karena nilai rata-rata seperti itu akan bervariasi, atau bergerak, karena periode saat ini bergerak dari waktu t 2, t 3. dll, mereka dikenal sebagai moving averages (Mas). Rata-rata pergerakan sederhana adalah (biasanya) nilai rata-rata k yang tidak tertimbang sebelumnya. Rata-rata pergerakan tertimbang secara eksponensial pada dasarnya sama dengan rata-rata pergerakan sederhana, namun dengan kontribusi rata-rata tertimbang menurut jaraknya terhadap waktu saat ini. Karena tidak ada satu, tapi keseluruhan rangkaian rata-rata bergerak untuk rangkaian tertentu, himpunan Mas dapat digambarkan sendiri pada grafik, dianalisis sebagai seri, dan digunakan dalam pemodelan dan peramalan. Berbagai model dapat dibangun menggunakan moving averages, dan ini dikenal dengan model MA. Jika model seperti itu digabungkan dengan model autoregresif (AR), model komposit yang dihasilkan dikenal sebagai model ARMA atau ARIMA (yang saya terintegrasi). Rata-rata bergerak sederhana Karena deret waktu dapat dianggap sebagai himpunan nilai,, 1,2,3,4, n rata-rata nilai-nilai ini dapat dihitung. Jika kita berasumsi bahwa n cukup besar, dan kita memilih bilangan bulat k yang jauh lebih kecil dari n. Kita dapat menghitung satu set rata-rata blok, atau rata-rata bergerak sederhana (urutan k): Setiap ukuran mewakili rata-rata nilai data selama interval observasi k. Perhatikan bahwa MA yang pertama mungkin order k gt0 adalah bahwa untuk t k. Secara umum, kita dapat menurunkan subskrip ekstra dalam ungkapan di atas dan menulis: Ini menyatakan bahwa perkiraan mean pada waktu t adalah rata-rata sederhana dari nilai yang teramati pada waktu t dan langkah waktu k -1 sebelumnya. Jika bobot diterapkan yang mengurangi kontribusi pengamatan yang jauh melampaui waktu, rata-rata bergerak dikatakan merapikan secara eksponensial. Moving averages sering digunakan sebagai bentuk peramalan, dimana nilai estimasi untuk seri pada waktu t 1, S t1. Diambil sebagai MA untuk periode sampai dan termasuk waktu t. misalnya Taksiran hari ini didasarkan pada rata-rata nilai tercatat sebelumnya sampai dengan dan termasuk kemarin (untuk data harian). Simple moving averages dapat dilihat sebagai bentuk smoothing. Pada contoh diilustrasikan di bawah ini, dataset pencemar udara yang ditunjukkan dalam pendahuluan topik ini telah ditambah dengan garis rata-rata bergerak 7-hari (MA), yang ditunjukkan di sini berwarna merah. Seperti yang bisa dilihat, garis MA menghaluskan puncak dan palung data dan bisa sangat membantu dalam mengidentifikasi tren. Rumus perhitungan maju standar berarti bahwa titik data k pertama tidak memiliki nilai MA, namun setelah itu perhitungan berlanjut ke titik data akhir dalam rangkaian. Nilai rata-rata harian PM10, sumber Greenwich: London Air Quality Network, londonair. org. uk Salah satu alasan untuk menghitung rata-rata bergerak sederhana dengan cara yang dijelaskan adalah memungkinkan nilai dihitung untuk semua slot waktu dari waktu hingga saat ini, dan Sebagai pengukuran baru diperoleh untuk waktu t 1, MA untuk waktu t 1 dapat ditambahkan ke himpunan yang sudah dihitung. Ini menyediakan prosedur sederhana untuk dataset dinamis. Namun, ada beberapa masalah dengan pendekatan ini. Adalah wajar untuk mengatakan bahwa nilai rata-rata selama 3 periode terakhir, katakanlah, harus ditempatkan pada waktu t -1, bukan waktu t. Dan untuk MA selama periode genap mungkin sebaiknya ditempatkan di titik tengah antara dua interval waktu. Solusi untuk masalah ini adalah dengan menggunakan perhitungan MA terpusat, di mana MA pada waktu t adalah rata-rata seperangkat nilai simetris di sekitar t. Terlepas dari manfaatnya yang jelas, pendekatan ini umumnya tidak digunakan karena memerlukan data tersedia untuk kejadian di masa depan, yang mungkin tidak demikian. Dalam kasus di mana analisis seluruhnya merupakan rangkaian yang ada, penggunaan Mas terpusat mungkin lebih baik. Rata-rata pergerakan sederhana dapat dianggap sebagai bentuk pemulusan, menghilangkan beberapa komponen frekuensi tinggi dari deret waktu dan menyoroti (namun tidak menghilangkan) tren dengan cara yang mirip dengan pengertian umum penyaringan digital. Memang, moving averages adalah bentuk linear filter. Hal ini dimungkinkan untuk menerapkan perhitungan rata-rata bergerak ke rangkaian yang telah dihaluskan, yaitu merapikan atau menyaring rangkaian yang sudah diperhalus. Misalnya, dengan rata-rata bergerak dari order 2, kita dapat menganggapnya sebagai dihitung dengan menggunakan bobot, jadi MA pada x 2 0,5 x 1 0,5 x 2. Begitu juga MA pada x 3 0,5 x 2 0,5 x 3. Jika kita Oleskan tingkat kedua dari smoothing atau filtering, kita memiliki 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 yaitu penyaringan 2 tahap Proses (atau konvolusi) telah menghasilkan rata-rata pergerakan simetris tertimbang bervariasi, dengan bobot. Beberapa konvolusi dapat menghasilkan rata-rata pergerakan tertimbang yang cukup rumit, beberapa di antaranya telah ditemukan penggunaan khusus di bidang khusus, seperti dalam perhitungan asuransi jiwa. Moving averages dapat digunakan untuk menghilangkan efek periodik jika dihitung dengan panjang periodisitas seperti yang diketahui. Misalnya, dengan variasi musiman data bulanan seringkali dapat dihapus (jika ini adalah tujuannya) dengan menerapkan rata-rata pergerakan 12 jam simetris dengan semua bulan berbobot rata, kecuali yang pertama dan terakhir yang dibobot pada 12. Hal ini karena akan ada Menjadi 13 bulan dalam model simetris (waktu sekarang, t - 6 bulan). Total dibagi dengan 12. Prosedur serupa dapat diadopsi untuk periodisitas yang didefinisikan dengan baik. Rata-rata pergerakan tertimbang secara eksponensial (EWMA) Dengan rumus rata-rata bergerak sederhana: semua pengamatan sama-sama tertimbang. Jika kita menyebut bobot yang sama ini, alpha t. Masing k bobot sama dengan 1 k. Jadi jumlah bobotnya adalah 1, dan rumusnya adalah: Kita telah melihat bahwa beberapa aplikasi dari proses ini menghasilkan bobot yang bervariasi. Dengan rata-rata pergerakan tertimbang secara eksponensial, kontribusi terhadap nilai rata-rata dari pengamatan yang lebih banyak dihapus pada waktunya akan dikurangi, sehingga menekankan kejadian terkini (lokal). Pada dasarnya parameter penghalusan, 0lt alpha lt1, diperkenalkan, dan rumusan direvisi menjadi: Versi simetris dari rumus ini adalah bentuknya: Jika bobot pada model simetris dipilih sebagai persyaratan istilah ekspansi binomial, (1212) 2q. Mereka akan berjumlah 1, dan q menjadi besar, akan mendekati distribusi Normal. Ini adalah bentuk pembobotan kernel, dengan Binomial berperan sebagai fungsi kernel. Konvolusi dua tahap yang dijelaskan pada subbagian sebelumnya adalah pengaturan ini, dengan q 1, menghasilkan bobot. Dalam eksponensial smoothing perlu menggunakan seperangkat bobot yang berjumlah 1 dan yang mengurangi ukuran secara geometris. Bobot yang digunakan biasanya berbentuk: Untuk menunjukkan bahwa bobot ini berjumlah 1, pertimbangkan perluasan 1 sebagai rangkaian. Kita dapat menulis dan memperluas ekspresi dalam tanda kurung dengan menggunakan rumus binomial (1- x) hal. Dimana x (1-) dan p -1, yang memberikan: Ini kemudian memberikan bentuk rata-rata bergerak tertimbang dalam bentuk: Penjumlahan ini dapat ditulis sebagai relasi rekurensi: yang menyederhanakan perhitungan dengan sangat, dan menghindari masalah bahwa rezim pembobotan Harus benar-benar tak terbatas untuk bobot untuk jumlah ke 1 (untuk nilai-nilai kecil alfa. ini biasanya tidak terjadi). Notasi yang digunakan oleh penulis berbeda bervariasi. Beberapa menggunakan huruf S untuk menunjukkan bahwa rumus dasarnya adalah variabel yang merapikan, dan menulis: sedangkan literatur teori kontrol sering menggunakan Z daripada S untuk nilai tertimbang atau tertimbang secara eksponensial (lihat, misalnya, Lucas dan Saccucci, 1990, LUC1 , Dan situs NIST untuk lebih jelasnya dan contoh kerja). Rumus yang dikutip di atas berasal dari karya Roberts (1959, ROB1), namun Hunter (1986, HUN1) menggunakan ekspresi dari bentuk: yang mungkin lebih sesuai untuk digunakan dalam beberapa prosedur pengendalian. Dengan alpha 1, perkiraan rata-rata hanyalah nilai terukurnya (atau nilai dari item data sebelumnya). Dengan 0,5 perkiraan adalah rata-rata bergerak sederhana dari pengukuran arus dan sebelumnya. Dalam peramalan model nilai, S t. Sering digunakan sebagai perkiraan atau perkiraan nilai untuk periode waktu berikutnya, yaitu sebagai perkiraan untuk x pada waktu t 1. Jadi, kita memiliki: Ini menunjukkan bahwa nilai perkiraan pada waktu t 1 adalah kombinasi dari rata-rata bergerak tertimbang eksponensial sebelumnya Ditambah komponen yang merepresentasikan kesalahan prediksi tertimbang, epsilon. Pada waktu t. Dengan asumsi deret waktu diberikan dan perkiraan diperlukan, nilai untuk alpha diperlukan. Hal ini dapat diperkirakan dari data yang ada dengan mengevaluasi jumlah kesalahan prediksi kuadrat yang diperoleh dengan nilai alpha yang bervariasi untuk masing-masing t 2,3. Menetapkan perkiraan pertama menjadi nilai data pertama yang diamati, x 1. Pada aplikasi kontrol, nilai alpha penting dalam penentuan batas atas dan bawah, dan mempengaruhi rata-rata panjang run (ARL) yang diharapkan. Sebelum batas kontrol ini rusak (dengan asumsi bahwa deret waktu mewakili satu set variabel independen acak yang terdistribusi secara acak dengan varians umum). Dalam keadaan ini varians dari statistik kontrol: adalah (Lucas dan Saccucci, 1990): Batas kontrol biasanya ditetapkan sebagai kelipatan tetap dari varians asimtotik ini, mis. - 3 kali standar deviasi. Jika alpha 0,25, misalnya, dan data yang dipantau diasumsikan memiliki distribusi Normal, N (0,1), bila terkendali, batas kontrol akan menjadi - 1.134 dan prosesnya akan mencapai satu atau batas lainnya dalam 500 langkah. rata-rata. Lucas dan Saccucci (1990 LUC1) menurunkan ARL untuk berbagai nilai alfa dan dengan berbagai asumsi menggunakan prosedur Markov Chain. Mereka menabulasikan hasilnya, termasuk menyediakan ARL bila rata-rata proses kontrol telah digeser oleh kelipatan dari standar deviasi. Misalnya, dengan pergeseran 0,5 dengan alpha 0,25 ARL kurang dari 50 langkah waktu. Pendekatan yang dijelaskan di atas dikenal sebagai smoothing eksponensial tunggal. Karena prosedur diterapkan sekali pada deret waktu dan kemudian dianalisis atau dikendalikan dilakukan pada dataset yang dihaluskan. Jika dataset mencakup tren dan atau komponen musiman, smoothing eksponensial dua atau tiga tahap dapat diterapkan sebagai alat untuk menghapus (secara eksplisit memodelkan) efek ini (lihat lebih lanjut, bagian tentang Peramalan di bawah, dan contoh kerja NIST). CHA1 Chatfield C (1975) Analisis Seri Times: Teori dan Praktik. Chapman and Hall, London HUN1 Hunter J S (1986) Rata-rata pergerakan tertimbang secara eksponensial. J dari Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Skema Kontrol Rata-rata Bergerak Rata-rata Tertimbang: Properti dan Perangkat Tambahan. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Uji Chart Kontrol Berdasarkan Rata-rata Bergerak Geometrik. Technometrics, 1, 239-250 Struktur data ini cukup tidak layak untuk tujuan. Dengan asumsi id pengenal yang Anda butuhkan untuk membentuk kembali. misalnya Lalu rata-rata bergerak mudah. Gunakan tssmooth atau hanya menghasilkan. misalnya Lebih lanjut mengapa struktur data Anda tidak sesuai: Tidak hanya perhitungan rata-rata bergerak memerlukan satu lingkaran (tidak harus melibatkan egen), namun Anda akan menciptakan beberapa variabel tambahan baru. Menggunakan analisis berikutnya akan berada di antara canggung dan tidak mungkin. EDIT Ill memberi contoh loop, sementara tidak bergerak dari posisi saya bahwa tekniknya buruk. Saya tidak melihat alasan di balik konvensi penamaan Anda dimana P1947 adalah mean untuk 1943-1945 Saya menganggap itu hanya salah ketik. Mari kita anggap bahwa kita memiliki data untuk tahun 1913-2012. Untuk jangka waktu 3 tahun, kita kehilangan satu tahun di setiap akhir. Itu bisa ditulis lebih ringkas, dengan mengorbankan kebingungan makro dalam makro. Menggunakan bobot yang tidak sama mudah, seperti di atas. Satu-satunya alasan untuk menggunakan egen adalah bahwa hal itu tidak menyerah jika ada misi, yang akan dilakukan di atas. Sebagai soal kelengkapan, perhatikan bahwa mudah untuk menangani misi tanpa menggunakan egen. Dan penyebut Jika semua nilai hilang, ini akan berkurang menjadi 00, atau hilang. Jika tidak, jika ada nilai yang hilang, kita tambahkan 0 ke pembilang dan 0 ke penyebut, yang sama dengan mengabaikannya. Tentu kode ini bisa ditolerir seperti di atas rata-rata 3 tahun, tapi entah untuk kasus itu atau untuk rata-rata selama bertahun-tahun lebih, kita akan mengganti garis di atas dengan satu lingkaran, itulah yang biasa dilakukan. Stata: Analisis Data dan Perangkat Lunak Statistik Nicholas J Cox, Universitas Durham, Inggris Christopher Baum, Boston College egen, ma () dan keterbatasannya Statarsquos perintah yang paling jelas untuk menghitung moving averages adalah fungsi ma () dari egen. Dengan ekspresi, itu menciptakan rata-rata pergerakkan rata-rata ekspresi itu. Secara default, diambil sebagai 3. pasti aneh. Namun, seperti yang ditunjukkan oleh manual entry, egen, ma () mungkin tidak digabungkan dengan varlist:. Dan, untuk alasan itu saja, itu tidak berlaku untuk data panel. Bagaimanapun, itu berdiri di luar serangkaian perintah yang secara khusus ditulis untuk seri waktu melihat deret waktu untuk rinciannya. Pendekatan alternatif Untuk menghitung rata-rata bergerak untuk data panel, setidaknya ada dua pilihan. Keduanya bergantung pada dataset yang sebelumnya sudah tsset. Ini sangat layak dilakukan: Anda tidak hanya bisa menyelamatkan diri Anda berulang kali menentukan variabel panel dan variabel waktu, namun Stata berperilaku dengan cerdas mengingat adanya kesenjangan dalam data. 1. Tulis definisi Anda sendiri dengan menggunakan Menggunakan operator time-series seperti L. dan F.. Berikan definisi rata-rata bergerak sebagai argumen untuk menghasilkan pernyataan. Jika Anda melakukan ini, Anda tentu saja tidak terbatas pada rata-rata bergerak rata tertimbang (tak tertimbang) yang dihitung oleh egen, ma (). Misalnya, rata-rata bergerak tiga periode tertimbang rata-rata akan diberikan oleh dan beberapa bobot dapat dengan mudah ditentukan: Anda tentu saja dapat menentukan ekspresi seperti log (myvar), bukan nama variabel seperti myvar. Salah satu keuntungan besar dari pendekatan ini adalah bahwa Stata secara otomatis melakukan hal yang benar untuk data panel: nilai-nilai terdepan dan tertinggal ada di dalam panel, seperti logika yang menentukannya. Kelemahan yang paling menonjol adalah bahwa command line bisa agak lama jika moving average melibatkan beberapa istilah. Contoh lainnya adalah moving average satu sisi yang hanya berdasarkan nilai sebelumnya. Ini bisa berguna untuk menghasilkan harapan adaptif tentang variabel apa yang akan didasarkan semata-mata berdasarkan informasi sampai saat ini: perkiraan seseorang terhadap periode saat ini berdasarkan empat nilai terakhir, dengan menggunakan skema bobot tetap (A 4-period lag mungkin Terutama yang biasa digunakan dengan kuartalan kuartalan.) 2. Gunakan egen, filter () dari SSC Gunakan filter fungsi egen yang ditulis pengguna () dari paket egenmore pada SSC. Di Stata 7 (diperbarui setelah 14 November 2001), Anda dapat menginstal paket ini setelah beberapa menit kemudian membantu menjelaskan rincian tentang filter (). Dua contoh di atas akan diberikan (Dalam perbandingan ini, pendekatan menghasilkan mungkin lebih transparan, tapi kita akan melihat contoh yang berlawanan dalam sekejap.) Kelemahannya adalah numlist. Mengarah ke kelambatan yang negatif: dalam kasus ini -11 mengembang menjadi -1 0 1 atau memimpin 1, lag 0, lag 1. Fibre coef, numlist lainnya, perbanyak item tertinggal atau barang yang sesuai: dalam hal ini item tersebut adalah F1.myvar . Myvar dan L1.myvar. Efek dari pilihan normalisasi adalah untuk mengukur setiap koefisien dengan jumlah koefisien sehingga coef (1 1 1) menormalkan setara dengan koefisien 13 13 13 dan coef (1 2 1) normalisasi sama dengan koefisien 14 12 14 Anda harus menentukan tidak hanya kelambatan tapi juga koefisiennya. Karena egen, ma () menyediakan kasus yang sama berbobot, alasan utama untuk egen, filter () adalah untuk mendukung kasus bobot yang tidak sama, yang mana Anda harus menentukan koefisiennya. Bisa juga dikatakan bahwa mewajibkan pengguna untuk menentukan koefisien adalah sedikit tekanan tambahan pada mereka untuk memikirkan koefisien apa yang mereka inginkan. Pembenaran utama untuk bobot yang sama adalah, kami kira, kesederhanaan, namun bobot yang sama memiliki sifat domain frekuensi yang buruk, untuk menyebutkan hanya satu pertimbangan. Contoh ketiga di atas bisa jadi salah satunya sama rumitnya dengan pendekatan menghasilkan. Ada kasus di mana egen, filter () memberikan formulasi yang lebih sederhana daripada menghasilkan. Jika Anda ingin filter binomial sembilan-istilah, yang menurut para ahli iklim berguna, maka mungkin terlihat kurang mengerikan daripada, dan lebih mudah untuk mendapatkan yang benar daripada, Sama seperti dengan pendekatan menghasilkan, egen, filter () bekerja dengan baik dengan data panel. Sebenarnya, seperti yang dinyatakan di atas, ini tergantung pada dataset yang sebelumnya telah di-download. Tip grafis Setelah menghitung rata-rata bergerak Anda, Anda mungkin ingin melihat grafik. Perintah yang ditulis pengguna tsgraph cerdas tentang dataset tsset. Instal di Stata 7 yang up-to-date oleh ssc inst tsgraph. Bagaimana dengan subsetting dengan jika None dari contoh di atas menggunakan jika pembatasan. Sebenarnya egen, ma () tidak akan mengizinkan jika ditentukan. Terkadang orang ingin menggunakan jika saat menghitung moving averages, namun penggunaannya sedikit lebih rumit dari biasanya. Apa yang akan Anda harapkan dari sebuah moving average yang dihitung dengan if. Mari kita kenali dua kemungkinan: Penafsiran yang lemah: Saya tidak ingin melihat hasil apapun untuk pengamatan yang dikecualikan. Interpretasi yang kuat: Saya bahkan tidak ingin Anda menggunakan nilai untuk pengamatan yang dikecualikan. Inilah contoh konkretnya. Misalkan sebagai konsekuensi dari beberapa jika kondisi, pengamatan 1-42 dimasukkan tetapi tidak diobservasi. Tapi rata-rata bergerak untuk 42 akan bergantung, antara lain, pada nilai untuk pengamatan 43 jika rata-rata melebar ke belakang dan ke depan dan panjangnya minimal 3, dan juga akan bergantung pada beberapa pengamatan dan seterusnya dalam beberapa situasi. Dugaan kami adalah kebanyakan orang akan mengikuti interpretasi yang lemah, tapi apakah itu benar, egen, filter () tidak mendukung jika keduanya. Anda selalu bisa mengabaikan apa yang tidak Anda inginkan atau bahkan menetapkan nilai yang tidak diinginkan hilang setelahnya dengan menggunakan ganti. Catatan tentang hasil yang hilang pada ujung seri Karena rata-rata bergerak adalah fungsi lag dan lead, egen, ma () menghasilkan missing dimana lag dan lead tidak ada, pada awal dan akhir rangkaian. Pilihan nomiss memaksa perhitungan rata-rata bergerak pendek yang tidak dipalsukan untuk ekornya. Sebaliknya, tidak menghasilkan atau egen, filter () tidak, atau memungkinkan, sesuatu yang istimewa untuk menghindari hasil yang hilang. Jika salah satu nilai yang dibutuhkan untuk perhitungan hilang, maka hasilnya hilang. Terserah kepada pengguna untuk memutuskan apakah operasi pembedahan diperlukan untuk pengamatan semacam itu, mungkin setelah melihat dataset dan mempertimbangkan sains yang mendasarinya yang dapat dibawa untuk ditanggung.

No comments:

Post a Comment