Pandas DataFrame – Retrieve Data Terbesar dan terkecil

Masih menggunakan data dari modul sebelumnya, mari kita load library dan data yang digunakan.

import pandas as pd

df = pd.read_csv("jamesbond.csv", index_col="Film")
df.sort_index(inplace=True)

Dengan method yang sudah dipelajari sebelumnya, kita bisa mengambil data terbesar atau terkecil.

Contoh, dari data film jamesbond.csv, kita ingin menarik 3 data film dengan budget paling mahal.

df.sort_values("Budget", ascending=False).head(3)

Atau bisa menggunakan method nlargest() dan nsmallest().

Method nlargest dan nsmallest memiliki parameter:

n: untuk menentukan jumlah baris yang akan diretrieve.
columns: kolom mana yang akan dijadikan kondisi.

Contoh menggunakan nlargest() untuk memilih 3 film dengan budget termahal. Akan menghasilkan data yang sama seperti method diatas.

df.nlargest(n=3, columns="Budget")

Berikut contoh menggunakan nsmallest() untuk memilih 3 film dengan budget termurah.

df.nsmallest(n=3, columns="Budget")

Perintah nlargest() dan nsmallest() dapat digunakan juga pada series. Karena pada series hanya ada satu kolom, kita tidak perlu mengisi parameter columns.

Contoh menampilkan 3 data film dengan box office tertinggi.

df["Box Office"].nlargest(3)

Film
Skyfall        943.5
Thunderball    848.1
Goldfinger     820.4
Name: Box Office, dtype: float64

Perhatian, method largest() atau smallest() dari segi kecepatan lebih efisien dibandingkan dengan method manual sort dan head. Jadi gunakan method ini jika Anda memiliki data yang besar.

Sharing is caring:

Leave a Comment Cancel reply