Setelah kita tentukan jumlah cluster, pada modul ini kita akan membuat Gaussian Mixture model.
#Gaussian Mixture Model
model = GaussianMixture(n_components= 3,
random_state = 1502).fit(df)
Setelah model dibuat, tahap yang terpenting adalah melakukan interpretasi.
Pertama kita prediksi cluster untuk setiap customer.
#Predict the cluster for each customer cluster = pd.Series(model.predict(df))
Kemudian kita buat dataframe cluster.
#Create Cluster variable df['cluster'] = cluster
Selanjutnya periksa berapa banyak customer pada masing-masing cluster.
#Check how many people per cluster df.cluster.value_counts()
Akan menghasilkan series seperti berikut:
2 720
1 303
0 296
Name: cluster, dtype: int64
Selanjutnya kita interpretasi model dengan melihat nilai rata-rata dari model.
#Interpretation
pd.DataFrame(model.means_,
columns = list(df.iloc[:,:-1].columns))

Untuk memahami masing-masing kolom, silakan lihat penjelasan variable di R_Expenditure and Default Data.pdf.
Kemudian beri nama untuk masing-masing cluster berdasarkan informasi diatas. Kami memberi nama cluster seperti berikut.
#Names
#Cluster 0: Non-Credit Users
#Cluster 1: Successful Entrepreneurs
#Cluster 2: young employees
File Google colab untuk tutorial ini dapat diakses di Gaussian Mixture Model.ipynb.
Latihan
Untuk latihan kita akan mempelajari behaviour dari pengguna kartu kredit atau kita akan melakukan behaviour analisis.
Data yang digunakan adalah CC General.csv.
Untuk solusi dari kami, silakan lihat di Gaussian Mixture Model Challenge.ipynb.
Sampai disini tutorial Gaussian Mixture Menggunakan Python sudah selesai, semoga bermanfaat.