Gaussian Mixture Model – Part 3

Setelah kita tentukan jumlah cluster, pada modul ini kita akan membuat Gaussian Mixture model. Setelah model dibuat, tahap yang terpenting adalah melakukan interpretasi. Pertama kita prediksi cluster untuk setiap customer. Kemudian kita buat dataframe cluster. Selanjutnya periksa berapa banyak customer pada masing-masing cluster. Akan menghasilkan series seperti berikut: Selanjutnya kita interpretasi model dengan melihat nilai … Read more

Sharing is caring:

Gaussian Mixture Model – Part 2

AIC dan BIC Untuk menentukan jumlah jumlah cluster yang optimum digunakan AIC (Akaike’s Information Criterion) dan BIC (Bayesian Information Criterion). AIC dan BIC juga dapat digunakan untuk memilih model yang paling relevant. AIC dan BIC menggunakan tradeoff antara simplicity dan goodness of fit. Simplicity menunjukan berapa banyak dimensi yang dimiliki model, yang perlu diperhatikan adalah, … Read more

Sharing is caring:

Gaussian Mixture Model – Part 1

Untuk mempelajari Gaussian Mixture model, kita akan gunakan contoh kasus aplikasi kartu kredit. Disini kita akan mempelajari bagaimana menentukan jumlah cluster optimum dan menerapkannya kedalam Gaussian Mixture Model. Selanjutnya, kita interpretasikan hasil segmentasi tersebut. Anda dapat download data untuk tutorial di CreditCard.csv. Untuk kemudahan mengikuti tutorial, disarankan untuk menggunakan Google Colab. Persiapan Direktori Jika Anda … Read more

Sharing is caring:

Pengenalan Teknik Clustering dan Gaussian Mixture

Clustering adalah terminilogi yang lebih luas dari unsupervised learning, dimana tidak dibutuhkan dependent variable, atau pada machine learning sering disebut “y”. Untuk lebih jelasnya apa itu clustering, Anda dapat lihat gambar berikut: MIsalnya Anda ingin mendapatkan 3 cluster untuk data diatas, maka algoritma akan mengelompokan data berdasarkan karakteristiknya dan mengelompokannya menjadi 3 cluster. Kita akan … Read more

Sharing is caring: