Pandas DataFrame – Perbedaan Shared Method Antara Series dan DataFrame

Seperti yang sudah kita bahas pada modul sebelumnya, dataframe dan series banyak menggunakan method yang sama. Namun result dari method akan berbeda.

Berikut contoh perbandingan menggunakan method sum(), untuk keperluan tutorial ini silakan gunakan data berikut https://drive.google.com/file/d/1cHRIutCmu4wGt_xEZsT_P0hXWw3BEdEA/view?usp=sharing

df = pd.read_csv("revenue.csv", index_col="Date")
df.head()

Lalu kita buat series yang berisi data numeric.

sr = pd.Series([1, 1, 2, 3])
sr
0    1
1    1
2    2
3    3
dtype: int64

Berikutnya kita akan bandingkan fungsi sum pada series dan dataframe.

sr.sum()
7
df.sum()
# sama dengan df.sum(axis="index")
# df.sum(axis=0)
New York       5475
Los Angeles    5134
Miami          5641
dtype: int64

Pada dataframe secara default, sum akan dihitung dengan kolom grouping. Jika ingin sum berdasarkan baris grouping, maka kita harus gunaka parameter axis.

  • 0 atau “index” : akan menjumlahkan dengan kolom grouping.
  • 1 atau “columns” : akan menjumlahkan dengan baris grouping.

Untuk lebih jelas, lihat perbandingannya dengan baris grouping.

df.sum(axis="columns")
# atau df.sum(axis=1)
Date
1/1/16     1606
1/2/16     2060
1/3/16      967
1/4/16     2519
1/5/16      438
1/6/16     1935
1/7/16     1234
1/8/16     2313
1/9/16     2623
1/10/16     555
dtype: int64

Jadi perlu diperhatikan perbedaan antara dataframe dan series saat menggunakan method yang sama.

Sharing is caring:

Leave a Comment