Pandas DataFrame – Mengakses Data Dengan Multi Index

Masih melanjutkan dari modul sebelumnya, mari kita load library dan data yang digunakan.

import pandas as pd

df = pd.read_csv("bigmac.csv", parse_dates=["Date"], index_col=["Date", "Country"])
df.sort_index(inplace=True)
df.head()

Contoh code, mengakses data dengan index 2010-01-01.

df.loc[("2010-01-01")]

Pandas akan mengembalikan seluruh data dengan tanggal yang dimaksud.

Berikut contoh untuk mengakses data tanggal 2010-01-01 dan negara adalah Britain.

df.loc[("2010-01-01", "Britain")]
Price in US Dollars    3.67
Name: (2010-01-01 00:00:00, Britain), dtype: float64

Pandas akan mengembalikan series yang berisi Price in US Dollars.

Untuk mengakses kolom tertentu, gunakan nama kolom pada parameter kedua.

df.loc[("2010-01-01", "Britain"), "Price in US Dollars"]
Date        Country
2010-01-01  Britain    3.67
Name: Price in US Dollars, dtype: float64

Jika kolom yang akan diakses lebih dari satu, gunakan tuple atau list dari label kolom yang dimaksud.

df.loc[("index1", "index2"), ("kolom1", "kolom2")]
# df.loc[("index1", "index2"), ["kolom1", "kolom2"]]

Sharing is caring:

Leave a Comment