Pandas DataFrame – Method untuk Filtering Data

Method isin() Method isin() sangat berguna untuk filtering multiple kondisi pada satu kolom. Masih melanjutkan dari modul sebelumnya, contoh ingin filter data pegawai di Team Marketing, Finance dan Sales. Pendekatan lama, adalah dengan membuat 3 kondisi seperti berikut Dengan menggunakan method isin() akan menjadi lebih sederhana Method isnull() dan notnull() Method isnull() berguna untuk memeriksa … Read more

Sharing is caring:

Pandas DataFrame – Filtering Data

Melanjutkan dari modul sebelumnya, pada modul ini kita akan membahas data filtering. Untuk melakukan filtering, diperlukan kondisi tertentu. Contoh, tampilkan data Gender == “Female” atau Team == “Marketing”. Berikut contoh melakukan filtering untuk data Gender == Female. Cara penulisan diatas akan menjadi sulit dibaca jika kondisi filtering lebih dari satu. Oleh karena itu dapat dilakukan … Read more

Sharing is caring:

Pandas DataFrame – Latihan Optimisasi Data

Melanjutkan dari modul sebelumnya, kita akan melakukan optimisasi dataframe dengan mengubah tipedata kolom. Berikut status terakhir dari modul sebelumnya. Dari info diatas, dapat dilakukan optimisasi untuk kolom: Gender, dari string menjadi Category. Senior Management, dari string menjadi boolean. Jika kita bandingkan memory usage turun menjadi 42.6+ KB dari 62.6+ KB.

Sharing is caring:

Pandas DataFrame – menggunakan parse_dates dan to_datetime()

Pada modul ini akan digunakan data source baru https://drive.google.com/file/d/1z6QQlhyLhaHGntdt5QwMPSPW9iJIOZyb/view?usp=sharing Pandas secara default tidak mengkonversi data date dari csv menjadi date time. Untuk melakukan konversi ada dua cara, saat import data menggunakan parse_dates atau melalui method to_datetime(). Menggunakan parse_dates Parameter parse_dates dapat diisi dengan single string atau list of string dari nama kolom yang akan diparse … Read more

Sharing is caring: