Melanjutkan dari modul sebelumnya, kita akan bahas method string yang sering digunakan.
Pertama kita load library dan data yang digunakan.
import pandas as pd
df = pd.read_csv("chicago.csv")
df["Department"] = df["Department"].astype("category")
df.head()
Method lower()
Mengubah string menjadi huruf kecil. Contoh code mengubah isi kolom Name menjadi huruf kecil.
df["Name"].str.lower()
0 aaron, elvia j
1 aaron, jeffery m
2 aaron, karina
3 aaron, kimberlei r
4 abad jr, vicente m
...
32058 zygowicz, peter j
32059 zymantas, mark e
32060 zyrkowski, carlo e
32061 zyskowski, dariusz
32062 NaN
Name: Name, Length: 32063, dtype: object
Method upper()
Mengubah string menjadi huruf besar. Contoh code mengubah isi kolom Name menjadi huruf besar.
df["Name"].str.upper()
0 AARON, ELVIA J
1 AARON, JEFFERY M
2 AARON, KARINA
3 AARON, KIMBERLEI R
4 ABAD JR, VICENTE M
...
32058 ZYGOWICZ, PETER J
32059 ZYMANTAS, MARK E
32060 ZYRKOWSKI, CARLO E
32061 ZYSKOWSKI, DARIUSZ
32062 NaN
Name: Name, Length: 32063, dtype: object
Method title()
Mengubah string menjadi bentuk title, yaitu huruf besar pada setiap awal kata. Contoh code mengubah isi kolom Name menjadi title.
df["Name"].str.title()
0 Aaron, Elvia J
1 Aaron, Jeffery M
2 Aaron, Karina
3 Aaron, Kimberlei R
4 Abad Jr, Vicente M
...
32058 Zygowicz, Peter J
32059 Zymantas, Mark E
32060 Zyrkowski, Carlo E
32061 Zyskowski, Dariusz
32062 NaN
Name: Name, Length: 32063, dtype: object
Method len()
Untuk menghitung panjang string. Contoh code menghitung panjang string dari setiap nama.
df["Name"].str.len()
0 15.0
1 17.0
2 14.0
3 19.0
4 19.0
...
32058 18.0
32059 17.0
32060 19.0
32061 19.0
32062 NaN
Name: Name, Length: 32063, dtype: float64
Tips, untuk mengubah perubahan pada dataframe gunakan assignment terhadap kolom yang dimaksud. Contoh, mengubah permanent perubahan isi kolom Name menjadi tipe title.
df["Name"] = df["Name"].str.title()