Membuat Random Forest sangat mudah, library yang digunakan adalah library sklearn. Untuk parameter akan dibahas parameter tuning pada modul terpisah.
#Random Forest Model
from sklearn.ensemble import RandomForestClassifier
#from sklearn.ensemble import RandomForestRegressor
model = RandomForestClassifier(n_estimators = 300,
random_state = 1502)
model.fit(X_train, y_train)
Setelah model dibuat, kita akan melakukan prediksi dan model assesment.
#Predictions predictions = model.predict(X_test) predictions[:5]
Hasilnya adalah:
array([0, 1, 1, 1, 1], dtype=uint8)
Dalam melakukan assesment biasanya faktor yang diperhatikan adalah accuracy jika dataset balance dan f1 score jika dataset tidak balance.
Pada kasus kita, kita dapat lihat pada kolom card_yes, 78% aplikasi kartu kredit diterima. Artinya dataset tidak balance. Maka dalam melakukan assesment digunakan f1 score.
#Model Assessment from sklearn.metrics import classification_report, f1_score print(classification_report(y_test, predictions))

Dapat dilihat f1-score untuk accuracy mencapai 0.98, dapat disimpulkan model cukup akurat dalam menyelesaikan masalah.
Berikutnya kita ekstrak nilai f1-score, karena akan digunakan dalam parameter tuning.
#F1 Score f1_score(y_test, predictions)
Pada modul berikutnya kita akan gunakan machine learning untuk menghasilkan insight.