Implementasi Random Forest – Part 3

Membuat Random Forest sangat mudah, library yang digunakan adalah library sklearn. Untuk parameter akan dibahas parameter tuning pada modul terpisah.

#Random Forest Model
from sklearn.ensemble import RandomForestClassifier
#from sklearn.ensemble import RandomForestRegressor
model = RandomForestClassifier(n_estimators = 300,
                               random_state = 1502)
model.fit(X_train, y_train)

Setelah model dibuat, kita akan melakukan prediksi dan model assesment.

#Predictions
predictions = model.predict(X_test)
predictions[:5]

Hasilnya adalah:

array([0, 1, 1, 1, 1], dtype=uint8)

Dalam melakukan assesment biasanya faktor yang diperhatikan adalah accuracy jika dataset balance dan f1 score jika dataset tidak balance.

Pada kasus kita, kita dapat lihat pada kolom card_yes, 78% aplikasi kartu kredit diterima. Artinya dataset tidak balance. Maka dalam melakukan assesment digunakan f1 score.

#Model Assessment
from sklearn.metrics import classification_report, f1_score

print(classification_report(y_test, predictions))

Dapat dilihat f1-score untuk accuracy mencapai 0.98, dapat disimpulkan model cukup akurat dalam menyelesaikan masalah.

Berikutnya kita ekstrak nilai f1-score, karena akan digunakan dalam parameter tuning.

#F1 Score
f1_score(y_test, predictions)

Pada modul berikutnya kita akan gunakan machine learning untuk menghasilkan insight.

Sharing is caring: