Pandas GroupBy – Method agg()

Pada modul ini kita akan membahas method agg(). Fungsi agg dapat melakukan

  • Fungsi aggregasi berbeda untuk kolom yang ditentukan.
  • Multiple aggregasi untuk kolom tertentu.

Untuk lebih jelas mari kita langsung coba di code.

Pertama load library dan data yang digunakan dan grouping berdasarkan sector.

import pandas as pd

df = pd.read_csv("fortune1000.csv", index_col="Rank")
sect = df.groupby("Sector")

df.head()

Fungsi Agregasi Berbeda Untuk Setiap Kolom

Fungsi agg() menggunakan parameter python dict yang berisi nama kolom dan method aggregasi.

Contoh code melakukan aggreasi sum untuk kolom revenue dan profits, sementara untuk kolom employees dilakukan aggregasi mean.

sect.agg({"Revenue": "sum", "Profits": "sum", "Employees": "mean"})

Multiple Agregasi untuk setiap kolom

Ada dua pendekatan, bila kolom tidak ditentukan, semua numeric kolom akan dilakukan agregasi sesuai dengan parameter berupa python list dengan isi fungsi aggregat yang dimaksud.

sect.agg(["size", "sum", "mean"])

Pendakan kedua adalah, menggunakan dict, namun untuk fungsi aggregat diisi list.

sect.agg({"Revenue": ["size", "sum"], "Profits": ["sum","mean"], "Employees": "mean"})
Sharing is caring:

Leave a Comment