Gaussian Mixture Model – Part 3

Setelah kita tentukan jumlah cluster, pada modul ini kita akan membuat Gaussian Mixture model.

#Gaussian Mixture Model
model = GaussianMixture(n_components= 3,
                        random_state = 1502).fit(df)

Setelah model dibuat, tahap yang terpenting adalah melakukan interpretasi.

Pertama kita prediksi cluster untuk setiap customer.

#Predict the cluster for each customer
cluster = pd.Series(model.predict(df))

Kemudian kita buat dataframe cluster.

#Create Cluster variable
df['cluster'] = cluster

Selanjutnya periksa berapa banyak customer pada masing-masing cluster.

#Check how many people per cluster
df.cluster.value_counts()

Akan menghasilkan series seperti berikut:

2    720
1    303
0    296
Name: cluster, dtype: int64

Selanjutnya kita interpretasi model dengan melihat nilai rata-rata dari model.

#Interpretation
pd.DataFrame(model.means_,
             columns = list(df.iloc[:,:-1].columns))

Untuk memahami masing-masing kolom, silakan lihat penjelasan variable di R_Expenditure and Default Data.pdf.

Kemudian beri nama untuk masing-masing cluster berdasarkan informasi diatas. Kami memberi nama cluster seperti berikut.

#Names
#Cluster 0: Non-Credit Users
#Cluster 1: Successful Entrepreneurs
#Cluster 2: young employees

File Google colab untuk tutorial ini dapat diakses di Gaussian Mixture Model.ipynb.

Latihan

Untuk latihan kita akan mempelajari behaviour dari pengguna kartu kredit atau kita akan melakukan behaviour analisis.

Data yang digunakan adalah CC General.csv.

Untuk solusi dari kami, silakan lihat di Gaussian Mixture Model Challenge.ipynb.

Sampai disini tutorial Gaussian Mixture Menggunakan Python sudah selesai, semoga bermanfaat.

Sharing is caring: