Pada modul ini kita akan menentukan common support region.
Pertama akan melakukan logistic regression.
#Logist Regression import statsmodels.api as sm confounders_csr = sm.add_constant(confounders) csr_model = sm.Logit(treat, confounders_csr).fit()
Selanjutnya melakukan predictions.
probabilities = csr_model.predict(confounders_csr)
Berikutnya kita akan melakukan persiapan untuk common support region dengan membuat dataframe untuk treat dan probabilitas.
df_prob = np.vstack([treat, probabilities]) df_prob = np.transpose(df_prob)
Kemudian pisahkan antara treated dan non-treated.
non_treated = df_prob[:,0] == 0 non_treated = df_prob[non_treated, 1] treated = df_prob[:,0] == 1 treated = df_prob[treated, 1]
Selanjutnya kita visualisasikan common support region untuk memudahkan kita melihat common support region.
sns.kdeplot(non_treated, shade = True, color = 'red') sns.kdeplot(treated, shade = True, color = 'blue')

Graph diatas sesuai dengan apa yang kita perlukan. Dimana area overlap cukup besar. Dapat disimpulkan kita akan mendapatkan matching yang bagus.
Sampai disini kita sudah memeriksa common suport region, pada modul selanjutnya kita akan melakukan matching menggunakan Python.