Pada modul ini kita akan bahas method merge dengan cara left join. Right join tidak akan dibahas karena konsepnya sama dengan left, hanya kebalikannya saja.
Merge left join akan mengambil semua data yang ada dataframe kiri, jika pada dataframe kanan tidak terdapat datanya akan diisi NaN.
Untuk lebih jelasnya langsung kita coba dalam code.
Pertama kita load library dan data yang digunakan. Data yang kita gunakan sedikit berbeda dengan modul sebelumnya, yaitu menggunakan data food.
import pandas as pd
salesw1 = pd.read_csv("Restaurant - Week 1 Sales.csv")
foods = pd.read_csv("Restaurant - Foods.csv")
Parameter merge yang umum digunakan adalah
- how: cara join, pada modul ini akan dibahas penggunaan outer.
- on: kolom yang digunakan sebagai key untuk proses join.
- suffixes: untuk menambahkan text suffix pada kolom hasil merge.
- sort: akan mengurutkan data berdasarkan key yang digunakan pada parameter on. Default adalah false.
salesw1.merge(foods, how="left", on="Food ID", sort=True)