Manipulasi Pandas DataFrame – Mengunakan merge() – Label Kolom Berbeda

Pada modul sebelumnya, saat melakukan join, label kolom yang digunakan selalu sama. Apa yang terjadi bila label kolom berbeda?

Satu cara, Anda bisa mengganti nama kolom. Namun method merge memberikan fleksibilitas dengan menggunakan parameter:

  • left_on : nama kolom untuk dataframe kiri.
  • right_on: nama kolom untuk dataframe kanan.

Sebagai contoh, mari kita load library dan data yang digunakan. Kali ini akan digunakan data yang berbeda dari modul sebelumnya, yaitu week1 dan customers.

import pandas as pd

salesw1 = pd.read_csv("Restaurant - Week 1 Sales.csv")
custs = pd.read_csv("Restaurant - Customers.csv")

Jika Anda lihat data salesw1 menggunakan kolom Customer ID, sementara custs menggunakan kolom ID.

Untuk melakukan join dengan nama kolom yang berbeda, kita gunakan parameter left_on dan right_on.

salesw1.merge(custs, how="left", left_on="Customer ID", right_on="ID")

Jika Anda perhatikan, terdapat kolom duplikat yaitu, Customer ID dan ID. Anda dapat gunakan perintah yang telah dibahas pada modul sebelumnya dengan method drop().

salesw1.merge(custs, how="left", left_on="Customer ID", right_on="ID").drop("ID", axis=1)

Sharing is caring:

Leave a Comment