Pada modul ini kita akan membahas grouping dengan multiple column, pertama kita load library dan data yang digunakan.
import pandas as pd
df = pd.read_csv("fortune1000.csv", index_col="Rank")
df.head()
Untuk melakukan multiple column grouping, kita passing nama kolom dalam list. Jika kita periksa
sect_ind = df.groupby(["Sector", "Industry"])
Jika kita cek ukuran dataframe hasil groupby menggunakan method size, dapat dilihat terdapat 2 grouping.
sect_ind.size()
Sector Industry
Aerospace & Defense Aerospace and Defense 20
Apparel Apparel 15
Business Services Advertising, marketing 2
Diversified Outsourcing Services 14
Education 3
..
Transportation Trucking, Truck Leasing 9
Wholesalers Miscellaneous 1
Wholesalers: Diversified 25
Wholesalers: Electronics and Office Equipment 8
Wholesalers: Food and Grocery 6
Length: 79, dtype: int64
Method yang telah dibahas sebelumnya seperti max, min, sum dan lainnya tetap dapat digunakan, contoh code menggunakan method sum().
sect_ind.sum()