Select Data MultiIndex

Menampilkan data dengan multiindex bisa dilakukan dengan filtering seperti yang sudah dibahas pada https://skillplus.web.id/dataframe-slicing-dan-filtering/

Kekurangan dengan filtering adalah, menghabiskan computing resource. Dengan menggunakan fungsi xs() data ditampilkan lebih cepat.

Pada modul ini akan kita gunakan fungsi pd.xs(“nama_kolom”) untuk menampilkan data multi index.

Data yang digunakan bisa download di https://drive.google.com/file/d/12u5Kk1RvowhbGIaZmVY5phRHHQPBXyLp/view?usp=sharing atau https://www.kaggle.com/usdot/flight-delays (flight.csv)

Contoh kasus, menampilkan data dengan DESTINATION_AIRPORT = LAX dan AIRLINE = AA.

Pertama import library pandas, kemudian read data. Perhatikan, pandas bisa membaca file csv dalam format zip gz.

Buat dataframe baru untuk menampung data yang sudah di index berdasarkan kolom DESTINATION_AIRPORT dan AIRLINE.

Kemudian gunakan perintah df.xs() dengan parameter value yang ingin ditampilkan, pada code digunakan LAX dan AA.

import pandas as pd

dfo = pd.read_csv("flights2.csv.gz", low_memory=False)

df = dfo.set_index(["DESTINATION_AIRPORT", "AIRLINE"])
df = df.sort_index()

df_new = df.xs(("LAX", "AA"))
df_new.head()

Selain menggunakan fungsi xs(), fungsi loc juga bisa digunakan untuk result yang sama.

df.loc[("LAX", "AA")]

Dengan berakhirnya modul ini, tutorial Mengolah data menggunakan Pandas Dasar sudah selesai.

Masih banyak teknik lain yang tidak bisa kami bahas satu persatu. Namun dengan memahami teknik dasar dan membaca dokumentasi dari official Pandas website, skill Anda dapat terus dikembangkan. Semoga bermanfaat.

Sharing is caring:

Leave a Comment