Pada modul ini kita akan membahas method untuk melakukan string search.
Pertama kita load library dan data yang digunakan. Perhatikan pada modul ini kita akan drop NaN value.
import pandas as pd
df = pd.read_csv("chicago.csv").dropna(how="all")
df["Department"] = df["Department"].astype("category")
df.head()
Perhatian, sebelum melakukan string search, mengubah string case menjadi huruf kecil merupakan best practice.
Method contains()
Berguna untuk mencari dalam sebuah string target yang mengandung string yang dicari.
Contoh code akan mencari string mengandung kata “water” pada kolom poisition title.
df["Position Title"].str.lower().str.contains("water")
0 True
1 False
2 False
3 False
4 False
...
32057 False
32058 False
32059 False
32060 False
32061 False
Name: Position Title, Length: 32062, dtype: bool
Pandas akan mengembalikan series yang berisi boolean value. Series ini kemudian digunakan untuk menampilkan data polisi yang mempunyai jabatan area perairan.
mask = df["Position Title"].str.lower().str.contains("water")
df[mask]
Method startswith()
Berguna mencari string yang dimaksud pada awal teks target.
Contoh mencari kata water pada awal dari Position Ttile. Kita gunakan sebagai kondisi untuk menampilkan data.
kond = df["Position Title"].str.lower().str.startswith("water")
df[kond]
Method endswith()
Berguna untuk mencari string pada akhir teks target.
Contoh mencari posisi yang diakhir “ist”.
kond = df["Position Title"].str.lower().str.endswith("ist")
df[kond]