Data preparation untuk ML atau Machine Learning salah satu langkah awal dalam Machine Learning Workflow. Boleh dikatakan, hampir sebagian besar waktu digunakan untuk mempersiapkan data.
Karena data yang buruk akan menghasilkan model yang buruk dalam melakukan prediksi, maka data cleaning perlu dilakukan untuk memastikan data yang berkualitas baik.
Untuk dapat mengikuti tutorial ini Anda harus sudah
- Memahami Python Dasar.
- Sudah pernah membuat model ML sederhana.
Tutorial Bahasa Python Dasar bisa lihat di https://skillplus.web.id/python-programming-dasar/
Tutorial ML dasar, bisa dilihat tutorial https://skillplus.web.id/data-science-dasar/
Berikut topik yang akan dibahas
- Pengenalan Features dan Labels Pada Machine Learning
- Pengenalan Feature Engineering
- Permasalahan Umum Data
- Handling Missing Values
- Handling Outliers
- Feature Selection – Pendahuluan
- Feature Selection – Method
- Missing Value Ratio
- Data Correlations Menggunakan Pandas
- Data Correlation Menggunakan YellowBrick
- Feature Selection Metoda Filter
- Feature Selection Metoda Wrapper
- Feature Selection Metoda Embedded
1 thought on “ML Data Preparation menggunakan Python”