Pandas String – Method String Search

Pada modul ini kita akan membahas method untuk melakukan string search.

Pertama kita load library dan data yang digunakan. Perhatikan pada modul ini kita akan drop NaN value.

import pandas as pd

df = pd.read_csv("chicago.csv").dropna(how="all")
df["Department"] = df["Department"].astype("category")
df.head()

Perhatian, sebelum melakukan string search, mengubah string case menjadi huruf kecil merupakan best practice.

Method contains()

Berguna untuk mencari dalam sebuah string target yang mengandung string yang dicari.

Contoh code akan mencari string mengandung kata “water” pada kolom poisition title.

df["Position Title"].str.lower().str.contains("water")
0         True
1        False
2        False
3        False
4        False
         ...  
32057    False
32058    False
32059    False
32060    False
32061    False
Name: Position Title, Length: 32062, dtype: bool

Pandas akan mengembalikan series yang berisi boolean value. Series ini kemudian digunakan untuk menampilkan data polisi yang mempunyai jabatan area perairan.

mask = df["Position Title"].str.lower().str.contains("water")
df[mask]

Method startswith()

Berguna mencari string yang dimaksud pada awal teks target.

Contoh mencari kata water pada awal dari Position Ttile. Kita gunakan sebagai kondisi untuk menampilkan data.

kond = df["Position Title"].str.lower().str.startswith("water")
df[kond]

Method endswith()

Berguna untuk mencari string pada akhir teks target.

Contoh mencari posisi yang diakhir “ist”.

kond = df["Position Title"].str.lower().str.endswith("ist")
df[kond]

Sharing is caring:

Leave a Comment