Daftar Terkurasi dari Konsep Peramalan Deret Waktu Penting – Menuju AI

Daftar Terkurasi dari Konsep Peramalan Deret Waktu Penting – Menuju AI

Pengarang: Kumar kaushal

Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.

Daftar detail konsep yang terkait dengan peramalan deret waktu dan penjelasannya, bersama dengan paket untuk Python. Ini akan menjadi daftar masuk bagi siapa saja yang tertarik untuk memahami topik utama peramalan deret waktu

Foto oleh Stephen Phillips – Hostreviews.co.uk di Unsplash

Anda mungkin pernah menemukan beberapa artikel yang terkait dengan perkiraan deret waktu. Mereka pasti telah menjelaskan beberapa konsep tetapi tidak semua atau sebagian besar dari mereka. Artikel ini dimaksudkan untuk menjadi daftar masuk bagi siapa saja yang ingin memahami konsep-konsep utama yang terkait dengan peramalan deret waktu. Ini akan menjelaskan konsep bersama dengan pustaka dan paket berbasis python untuk analisis dan peramalan deret waktu.

Apa itu data deret waktu?

Ini adalah urutan titik data yang dikumpulkan atau direkam selama interval waktu yang konsisten. Data deret waktu melampirkan interval waktu untuk setiap nilai. Interval waktu bisa menit, jam, hari, bulan, atau apa pun, dan itu harus sama. Ini disebut Frekuensi dari data deret waktu.

Apa itu tren, musiman, dan siklus?

Jika data memiliki kenaikan atau penurunan jangka panjang, tren hadir dalam data.

Pola berulang pada titik waktu tertentu (tahun) disebut sebagai Musiman. Polanya harus berulang secara konsisten. Peningkatan penjualan pakaian hangat selama musim dingin adalah contoh musiman. Perbedaan antara Cyclicity dan Seasonality adalah bahwa dalam kasus Cyclicity, fluktuasi memiliki sifat acak dan tidak dalam periode yang tetap.

Model apa yang biasanya digunakan untuk peramalan?

Model peramalan deret waktu secara umum dapat dipisahkan ke dalam kategori luas berikut – Klasik (atau statistik), ML (berbasis Machine Learning), dan Combinational.

Yang klasik sebagian besar adalah jenis model statistik. Contoh terkenal dari model tersebut adalah Auto Regression (AR), Moving Average (MA), Auto Regression Moving Average (ARMA), Auto Regression Integrated Moving Average (ARIMA), ARIMAX (X berarti eXogenous), SARIMAX (S berarti Musiman), Eksponensial menghaluskan, dan lain-lain. Pendekatan berbasis ML termasuk XGBoost, Random Forest, dan lainnya menggunakan pendekatan regresi. Metode deep learning yang digunakan dalam peramalan time series adalah LSTM, N-BEATS, DeepAR, dan lain-lain. Beberapa metode kombinasi juga telah dicoba. Misalnya- pemenang kompetisi M5 menggunakan kombinasi berbobot sama yang melibatkan enam model. Setiap model memanfaatkan pendekatan pembelajaran dan perangkat pelatihan yang berbeda.

Model mana yang akan digunakan dalam kasus deret waktu multivariat?

Dalam kasus deret waktu multivariat, model seperti VAR ( Vector Auto Regression) dan turunannya (VARMA dan VARMAX) dapat digunakan.

Model mana yang akan digunakan dalam kasus data yang mudah menguap?

Model lanjutan seperti GARCH (Generalized Autoregressive Conditional Heteroskedastisitas) dapat digunakan di sini.

Saat melatih dan memvalidasi model, dapatkah kita mengacak data secara acak sebelum melakukan pemisahan uji-latih?

Tidak, karena data deret waktu bersifat kronologis, kami tidak dapat mengacak dan melakukan pemisahan uji kereta secara acak. Nilai di bagian belakang data dapat dianggap sebagai set pengujian, dan nilai lainnya digunakan sebagai rangkaian kereta.

Apa yang harus dilakukan jika ada nilai yang hilang dalam data?

Ya, memperlakukan nilai yang hilang akan menjadi jawaban yang jelas. Namun, karena kekhasan data deret waktu, pendekatannya akan berbeda di sini dibandingkan dengan metode yang banyak dikenal. Ini karena nilai antara interval waktu yang berurutan saling mempengaruhi. Interpolasi linier, interpolasi Spline, Pengamatan Terakhir Dibawa ke Depan, dan Pengamatan Selanjutnya Dibawa Maju adalah beberapa metode.

Apa metrik untuk mengevaluasi kinerja model peramalan deret waktu?

Metrik evaluasi sama seperti dalam kasus model regresi. Ini adalah R-kuadrat, Mean Absolute Error (MAE), Root Mean Squared Error (RMSE), dan lainnya.

Apa saja paket berbasis python yang tersedia untuk peramalan deret waktu?

Daftar di bawah ini menyebutkan beberapa paket berbasis python:

tsfresh, AutoTS, Kats, Prophet, dart, sktime, statsmodel, PyFlux, dan Orbit. Referensi ke paket disebutkan di bagian Referensi artikel ini.

Apa stasioneritas dari data deret waktu, dan apa pentingnya?

Suatu data stasioner memiliki rata-rata konstan, varians konstan, dan kovarians yang konsisten antara periode pada jarak yang identik. Tes ADF dilakukan untuk mengkonfirmasi stasioneritas data deret waktu. Ini penting karena dengan stasioneritas, sifat statistik data tidak akan berubah seiring waktu.

Apa itu variabel eksogen dan endogen?

Variabel eksogen adalah variabel yang tidak tergantung pada variabel lain, dan variabel output tergantung pada variabel ini. Memasukkan variabel ini dapat menjelaskan penambahan penjelasan yang lebih baik ke model peramalan deret waktu.

Variabel endogen adalah variabel yang bergantung pada variabel lain dan di mana variabel output bergantung.

Apa pentingnya White Noise?

Istilah kesalahan dalam model deret waktu harus White Noise. Jika bukan White Noise, maka masih ada beberapa pola yang perlu diperhitungkan oleh model.

Ikuti saya (kumarkaushal.bit) untuk topik yang lebih menarik terkait Ilmu Data, di mana konsep-konsep penting dijelaskan secara lugas dan mudah dipahami.

Referensi:

Daftar Konsep Peramalan Seri Waktu Penting yang Dikurasi awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Jeffrey Hayes