Pandas DataFrame – Filtering Data

Melanjutkan dari modul sebelumnya, pada modul ini kita akan membahas data filtering.

Untuk melakukan filtering, diperlukan kondisi tertentu. Contoh, tampilkan data Gender == “Female” atau Team == “Marketing”.

Berikut contoh melakukan filtering untuk data Gender == Female.

df[df["Gender"] == "Female"]

Cara penulisan diatas akan menjadi sulit dibaca jika kondisi filtering lebih dari satu. Oleh karena itu dapat dilakukan dengan cara penulisan berikut.

kondisi = df["Gender"] == "Female"
df[kondisi]

Selain menggunakan tanda equal (==), kita juga bisa menggunakan not equal (!=). Contoh menampilkan data bukan dari team Marketing.

Perhatian operator lainnya dapat digunakan seperti >, >=, < dan <=.

kondisi = df["Team"] != "Marketing"
df[kondisi]
Mungkin timbul pertanyaan, bagaimana jika ingin filtering data dengan 2 kondisi? Kita dapat gunakan operator boolean and menggunakan simbol & dan or menggunakan simbol |.

Contoh, filter data female dan bukan team marketing.

kondisi1 = df["Gender"] == "Female"
kondisi2 = df["Team"] != "Marketing"
df[kondisi1 & kondisi2]
Latihan

Tampilkan data pegawai yang termasuk Senior Management atau Start Date sebelum 1990-01-01.

Solusi

kondisi1 = df["Senior Management"]
kondisi2 = df["Start Date"] < '1990-01-01'
df[kondisi1 | kondisi2]

Sharing is caring:

Leave a Comment