Data Correlations Menggunakan Pandas

Dengan menggunakan library pandas, kita akan lihat correlations dari data feature yang telah kita prepare pada modul sebelumnya. Data bisa download di https://drive.google.com/file/d/1MmhdmdwiHQVlW41IA28OiitAYJEKheFH/view?usp=sharing Pertama kita import library yang digunakan yaitu Pandas, Matplotlib dan Seaborn. Seaborn adalah library yang dikembangkan diatas matplotlib yang berguna untuk data visualization. Load data kedalam pandas dataframe. Kemudian drop beberapa column … Read more

Sharing is caring:

Missing Value Ratio

Pada modul ini akan dibahas implementasi missing value ratio untuk melakukan feature selection menggunakan Python. Data yang digunakan bisa download di https://drive.google.com/file/d/1zkYF7Ihyi8ycM_Al-4Lu-Yp9KYhhFX8_/view?usp=sharing Import library yang digunakan, yaitu pandas. Load data melb_data.csv ke pandas dataframe menggunakan perintah pd.read_csv(). Periksa missing value pada dataset dengan menggunakan perintah missing_val = df.isnull().sum().sort_values(ascending=False). Lalu tampilkan data tersebut untuk melihat column … Read more

Sharing is caring:

Feature Selection – Method

Ada beberapa metoda feature selection yang umum digunakan, yaitu Filter, Embedded dan Wrapper. Filter Method Umumnya digunakan pada tahap preprocessing. Pemilihan features tidak tergantung kepada algoritma ML yang akan digunakan . Features dipilih berdasarkan score test statistik kolerasi. Untuk implementasi menggunakan Python lihat di https://skillplus.web.id/feature-selection-metoda-filter/ Embedded Method Feature dipilih saat proses model training. Menggunakan learning … Read more

Sharing is caring:

Feature Selection – Pendahuluan

Feature selection adalah proses memilih feature yang tepat untuk melatih model ML. Untuk melakukan feature selection, kita perlu memahami hubungan antara variables. Hubungan antar dua random variables disebut correlation dan dapat dihitung dengan menggunakan correlation coefficient. Range nilai correlation coeficient adalah: Positif maks +1, korelasi positif, artinya kedua variable akan bergerak searah. Negatif maks -1, … Read more

Sharing is caring: