Multiple Linear Regression – Pendahuluan

[latexpage]

Agar model memiliki tingkat prediksi yang tinggi, diperlukan multiple linear regression. Makin banyak faktor yang mempengaruhi perhitungan sebuah regresi, akan makin baik sebuah model melakukan prediksi.

Contoh: Harga rumah, tidak hanya dipengaruhi oleh luas bangunan saja, tapi ada faktor luas tanah, jumlah kamar tidur, jumlah kamar mandi, ada tidaknya garasi, lokasi yang strategis dan tahun bangunan.

Persamaan Multiple Linear Regression

$\hat{y} = b_0 + b_1 x_1 + b_2 x_2 + … + b_k x_k$

  • $\hat{y}$ : variable yang akan diprediksi.
  • b0 : konstan.
  • $x_1..x_k$ : independent variable (predictor).
  • $b_1..b_k$ : koefisien independent variable.

Tidak semua faktor/variable dapat dimasukan kedalam pembuatan model Multiple Regression. Menambahkan variable yang tidak relevan, akan menyebabkan model tidak akurat dalam melakukan prediksi.

Dengan menggunakan contoh harga rumah diatas, misalkan ada variable warna rumah, tentu hal ini tidak akan mempengaruhi harga rumah.

Adjusted R-Squared

Untuk multiple linear regression, pengukuran model menggunakan Adjusted R-Squared. Nilai Adjusted R-Squared akan selalu lebih kecil dari R-Squared.

Adjusted R-Squared digunakan sebagai basis dalam membandingkan models, dengan syarat model menggunakan dependent variable dan dataset yang sama. Model dengan Adjusted R-Squared yang lebih besar adalah model yang lebih menjelaskan data.

Contoh, Adj. R-Squared model-a adalah 0.392 dan Adj. R-Squared model-b adalah 0.399, maka model-b lebih menjelaskan variability data (model-b lebih prediktif).

Untuk lebih jelasnya, lihat lesson selanjutnya untuk memahami bagaimana membandingkan model Linear Regression.

Sharing is caring: