Pandas GroupBy – Grouping Multiple Column

Pada modul ini kita akan membahas grouping dengan multiple column, pertama kita load library dan data yang digunakan.

import pandas as pd

df = pd.read_csv("fortune1000.csv", index_col="Rank")
df.head()

Untuk melakukan multiple column grouping, kita passing nama kolom dalam list. Jika kita periksa

sect_ind = df.groupby(["Sector", "Industry"])

Jika kita cek ukuran dataframe hasil groupby menggunakan method size, dapat dilihat terdapat 2 grouping.

sect_ind.size()
Sector               Industry                                     
Aerospace & Defense  Aerospace and Defense                            20
Apparel              Apparel                                          15
Business Services    Advertising, marketing                            2
                     Diversified Outsourcing Services                 14
                     Education                                         3
                                                                      ..
Transportation       Trucking, Truck Leasing                           9
Wholesalers          Miscellaneous                                     1
                     Wholesalers: Diversified                         25
                     Wholesalers: Electronics and Office Equipment     8
                     Wholesalers: Food and Grocery                     6
Length: 79, dtype: int64

Method yang telah dibahas sebelumnya seperti max, min, sum dan lainnya tetap dapat digunakan, contoh code menggunakan method sum().

sect_ind.sum()
Sharing is caring:

Leave a Comment