Pandas DataFrame – Retrieve Row Menggunakan Index Label dengan Method loc[]

Data yang digunakan masih melanjutkan dari modul sebelumnya, yaitu data film jamesbond.csv.

Langkah pertama kita load library dan data. Pada saat load data, kita atur index menggunakan kolom Film.

Perintah sort_index() penting agar Pandas lebih cepat dalam mencari data. Hal ini akan sangat berdampak jika menggunakan jumlah data yang besar.

import pandas as pd

df = pd.read_csv("jamesbond.csv", index_col="Film")
df.sort_index(inplace=True)

df.head()

Method loc[]

Method loc[] berguna untuk mengakses row berdasarkan index label.

Berikut contoh mengambil data dengan judul film Thunderball.

Perhatian: jika data yang dikembalikan berupa single row, maka akan ditampilkan dalam series.

df.loc["Thunderball"]
Year                          1965
Actor                 Sean Connery
Director             Terence Young
Box Office                   848.1
Budget                        41.9
Bond Actor Salary              4.7
Name: Thunderball, dtype: object

Berikut contoh jika data yang dikembalikan lebih dari 1 row.

df.loc["Casino Royale"]

Method loc dapat menggunakan parameter slicing. Contoh, retrieve data dari judul Dr. No sampai Live and Let Die

df.loc["Dr. No" : "Live and Let Die"]

Perhatian, pada loc, index terakhir (dalam hal ini “Live and Let Die”), akan disertakan. Jika Anda menggunakan index position, index terakhir tidak akan disertakan. (Lihat modul iloc).

Slicing lainya yang dapat digunakan adalah:

#akan retrieve data dari Judul Dr. No sampai akhir dataframe
df.loc["Dr. No" : ]

#akan retrieve data awal dataframe sampai Judul Dr. No 
df.loc[: "Dr. No"]

Kita juga dapat mengakses Row dengan beberapa Index Label.

df.loc[["Dr. No", "Octopussy"]]

Parameter kedua dari loc adalah parameter untuk mengakses kolom. Contoh kita ingin mengakses film dengan label Dr. No dengan kolom index 0, 1 dan 2.

df.loc["Dr. No", ["Year", "Actor"]]
Year             1962
Actor    Sean Connery
Name: Dr. No, dtype: object

Untuk parameter row, kita bisa melakukan slicing, sementara untuk parameter kolom tidak bisa.

#ERROR
df.loc["Dr. No", ["Year": "Budget"]]

#VALID, akan mengembalikan movie dari Dr. No sampai Goldfinger, dengan kolom Year dan Actor.
df.loc["Dr. No" : "Goldfinger", ["Year", "Actor"]]
Sharing is caring:

Leave a Comment