House Property Sales - Time Series Analysis and Forecasting

1 minute read

Source Dataset: https://www.kaggle.com/htagholdings/property-sales

Overview

Project ini menggunakan ARIMA dan SARIMA model untuk meramalkan rata-rata harga rumah satu tahun ke depan. Model terbaik dipilih berdasarkan akurasi terbaik atau Mean Absolute Percentage Error (MAPE) terendah. Project ini juga melakukkan Adfuller test dan menunjukkan autocorellation plot dan partial autocorrelation plot untuk original time-series, deseasonal time-series, dan time-series yang telah di-differencing.

Summary

Bussiness Insight

Dari project ini, dapat disimpulkan bahwa rata-rata harga rumah terus meninggi dengan berjalannya waktu. Pada bagian model. SARIMA lebih baik daripada ARIMA dalam memprediksi time series ini, yang dapat diartikan bahwa komponen seasonal cukup penting dalam memprediksi rata-rata harga rumah. Untuk ringkasan hasilnya dapat dilihat di bawah ini, sedangkan untuk lengkapnya dapat dilihat di notebook ini.

Dataset

GitHub Logo

GitHub Logo

GitHub Logo

Time series decomposition

GitHub Logo

Terlihat dari komponen trendnya, bahwa rata-rata harga rumah terus meninggi seiringnya berjalan dengan waktu. Dan terdapat pola di komponen seasonal setiap tahunnya.

Splitting Dataset

Original Time Series

GitHub Logo

Deseasonal Time Series

GitHub Logo

Untuk melihat autocorrelation plot dan partial autocorrelation plotnya dapat dilihat di notebook ini

ARIMA dan SARIMA

Pada ARIMA tidak terlalu terlihat peramalan yang signifikan, mengingat hasilnya hanya memberi kita garis lurus:

GitHub Logo

Itu kenapa pada ARIMA punya Mean Absolute Percentage Error (MAPE) yang sangat besar. Sedangkan SARIMA memiliki MAPE yang kecil hanya sekitar 4% dan ini hasilnya:

GitHub Logo

Dan untuk diagnostic modelnya sudah diperlihatkan di notebook.

Predictions

Saya mencoba memprediksi dalam jangka waktu 1 tahun menggunakan SARIMA (Yang dimana SARIMA adalah model yang lebih baik daripada ARIMA dalam kasus ini).

GitHub Logo