Seperti yang sudah kita bahas pada modul sebelumnya, dataframe dan series banyak menggunakan method yang sama. Namun result dari method akan berbeda.
Berikut contoh perbandingan menggunakan method sum(), untuk keperluan tutorial ini silakan gunakan data berikut https://drive.google.com/file/d/1cHRIutCmu4wGt_xEZsT_P0hXWw3BEdEA/view?usp=sharing
df = pd.read_csv("revenue.csv", index_col="Date")
df.head()
Lalu kita buat series yang berisi data numeric.
sr = pd.Series([1, 1, 2, 3]) sr
0 1
1 1
2 2
3 3
dtype: int64
Berikutnya kita akan bandingkan fungsi sum pada series dan dataframe.
sr.sum()
7
df.sum() # sama dengan df.sum(axis="index") # df.sum(axis=0)
New York 5475
Los Angeles 5134
Miami 5641
dtype: int64
Pada dataframe secara default, sum akan dihitung dengan kolom grouping. Jika ingin sum berdasarkan baris grouping, maka kita harus gunaka parameter axis.
- 0 atau “index” : akan menjumlahkan dengan kolom grouping.
- 1 atau “columns” : akan menjumlahkan dengan baris grouping.
Untuk lebih jelas, lihat perbandingannya dengan baris grouping.
df.sum(axis="columns") # atau df.sum(axis=1)
Date
1/1/16 1606
1/2/16 2060
1/3/16 967
1/4/16 2519
1/5/16 438
1/6/16 1935
1/7/16 1234
1/8/16 2313
1/9/16 2623
1/10/16 555
dtype: int64
Jadi perlu diperhatikan perbedaan antara dataframe dan series saat menggunakan method yang sama.