Manipulasi Pandas DataFrame – Mengunakan merge() – Menggunakan index

Jika sebelumnya kita menggunakan kolom non index sebagai key untuk join, pada modul ini kita akan membahas bagaimana melakukan join dengan index.

Untuk kebutuhan tutorial ini kita akan modif sedikit saat data loading yaitu mengatur index_col pada dataframe custs.

import pandas as pd

salesw1 = pd.read_csv("Restaurant - Week 1 Sales.csv")
custs = pd.read_csv("Restaurant - Customers.csv", index_col="ID")

Untuk menggunakan index parameter yang digunakan adalah

  • left_index, default false. Set True untuk menggunakan index pada dataframe kiri.
  • right_index, default false. Set True untuk menggunakan index pada dataframe kanan.

Berikut contoh melakukan left join dataframe salesw1 dengan dataframe custs dengan kondisi dataframe custs menggunakan index.

salesw1.merge(custs, how="left", left_on="Customer ID", right_index=True)

Dapat diperhatikan, saat menggunakan parameter index, kolom otomatis tidak dimasukan dalam dataframe.

Sharing is caring:

Leave a Comment