House Property Sales - Time Series Analysis and Forecasting
Source Dataset: https://www.kaggle.com/htagholdings/property-sales
Overview
Project ini menggunakan ARIMA dan SARIMA model untuk meramalkan rata-rata harga rumah satu tahun ke depan. Model terbaik dipilih berdasarkan akurasi terbaik atau Mean Absolute Percentage Error (MAPE) terendah. Project ini juga melakukkan Adfuller test dan menunjukkan autocorellation plot dan partial autocorrelation plot untuk original time-series, deseasonal time-series, dan time-series yang telah di-differencing.
Summary
Bussiness Insight
Dari project ini, dapat disimpulkan bahwa rata-rata harga rumah terus meninggi dengan berjalannya waktu. Pada bagian model. SARIMA lebih baik daripada ARIMA dalam memprediksi time series ini, yang dapat diartikan bahwa komponen seasonal cukup penting dalam memprediksi rata-rata harga rumah. Untuk ringkasan hasilnya dapat dilihat di bawah ini, sedangkan untuk lengkapnya dapat dilihat di notebook ini.
Dataset
Time series decomposition
Terlihat dari komponen trendnya, bahwa rata-rata harga rumah terus meninggi seiringnya berjalan dengan waktu. Dan terdapat pola di komponen seasonal setiap tahunnya.
Splitting Dataset
Original Time Series
Deseasonal Time Series
Untuk melihat autocorrelation plot dan partial autocorrelation plotnya dapat dilihat di notebook ini
ARIMA dan SARIMA
Pada ARIMA tidak terlalu terlihat peramalan yang signifikan, mengingat hasilnya hanya memberi kita garis lurus:
Itu kenapa pada ARIMA punya Mean Absolute Percentage Error (MAPE) yang sangat besar. Sedangkan SARIMA memiliki MAPE yang kecil hanya sekitar 4% dan ini hasilnya:
Dan untuk diagnostic modelnya sudah diperlihatkan di notebook.
Predictions
Saya mencoba memprediksi dalam jangka waktu 1 tahun menggunakan SARIMA (Yang dimana SARIMA adalah model yang lebih baik daripada ARIMA dalam kasus ini).