Masih menggunakan data dari modul sebelumnya, mari kita load library dan data yang digunakan.
import pandas as pd
df = pd.read_csv("jamesbond.csv", index_col="Film")
df.sort_index(inplace=True)
Dengan method yang sudah dipelajari sebelumnya, kita bisa mengambil data terbesar atau terkecil.
Contoh, dari data film jamesbond.csv, kita ingin menarik 3 data film dengan budget paling mahal.
df.sort_values("Budget", ascending=False).head(3)
Atau bisa menggunakan method nlargest() dan nsmallest().
Method nlargest dan nsmallest memiliki parameter:
- n: untuk menentukan jumlah baris yang akan diretrieve.
- columns: kolom mana yang akan dijadikan kondisi.
Contoh menggunakan nlargest() untuk memilih 3 film dengan budget termahal. Akan menghasilkan data yang sama seperti method diatas.
df.nlargest(n=3, columns="Budget")
Berikut contoh menggunakan nsmallest() untuk memilih 3 film dengan budget termurah.
df.nsmallest(n=3, columns="Budget")
Perintah nlargest() dan nsmallest() dapat digunakan juga pada series. Karena pada series hanya ada satu kolom, kita tidak perlu mengisi parameter columns.
Contoh menampilkan 3 data film dengan box office tertinggi.
df["Box Office"].nlargest(3)
Film
Skyfall 943.5
Thunderball 848.1
Goldfinger 820.4
Name: Box Office, dtype: float64
Perhatian, method largest() atau smallest() dari segi kecepatan lebih efisien dibandingkan dengan method manual sort dan head. Jadi gunakan method ini jika Anda memiliki data yang besar.