Pandas String – Method yang Umum Digunakan

Melanjutkan dari modul sebelumnya, kita akan bahas method string yang sering digunakan.

Pertama kita load library dan data yang digunakan.

import pandas as pd

df = pd.read_csv("chicago.csv")
df["Department"] = df["Department"].astype("category")
df.head()

Method lower()

Mengubah string menjadi huruf kecil. Contoh code mengubah isi kolom Name menjadi huruf kecil.

df["Name"].str.lower()
0            aaron,  elvia j
1          aaron,  jeffery m
2             aaron,  karina
3        aaron,  kimberlei r
4        abad jr,  vicente m
                ...         
32058     zygowicz,  peter j
32059      zymantas,  mark e
32060    zyrkowski,  carlo e
32061    zyskowski,  dariusz
32062                    NaN
Name: Name, Length: 32063, dtype: object

Method upper()

Mengubah string menjadi huruf besar. Contoh code mengubah isi kolom Name menjadi huruf besar.

df["Name"].str.upper()
0            AARON,  ELVIA J
1          AARON,  JEFFERY M
2             AARON,  KARINA
3        AARON,  KIMBERLEI R
4        ABAD JR,  VICENTE M
                ...         
32058     ZYGOWICZ,  PETER J
32059      ZYMANTAS,  MARK E
32060    ZYRKOWSKI,  CARLO E
32061    ZYSKOWSKI,  DARIUSZ
32062                    NaN
Name: Name, Length: 32063, dtype: object

Method title()

Mengubah string menjadi bentuk title, yaitu huruf besar pada setiap awal kata. Contoh code mengubah isi kolom Name menjadi title.

df["Name"].str.title()
0            Aaron,  Elvia J
1          Aaron,  Jeffery M
2             Aaron,  Karina
3        Aaron,  Kimberlei R
4        Abad Jr,  Vicente M
                ...         
32058     Zygowicz,  Peter J
32059      Zymantas,  Mark E
32060    Zyrkowski,  Carlo E
32061    Zyskowski,  Dariusz
32062                    NaN
Name: Name, Length: 32063, dtype: object

Method len()

Untuk menghitung panjang string. Contoh code menghitung panjang string dari setiap nama.

df["Name"].str.len()
0        15.0
1        17.0
2        14.0
3        19.0
4        19.0
         ... 
32058    18.0
32059    17.0
32060    19.0
32061    19.0
32062     NaN
Name: Name, Length: 32063, dtype: float64

Tips, untuk mengubah perubahan pada dataframe gunakan assignment terhadap kolom yang dimaksud. Contoh, mengubah permanent perubahan isi kolom Name menjadi tipe title.

df["Name"] = df["Name"].str.title()

Sharing is caring:

Leave a Comment