Pengenalan pandas
Pandas adalah library yang umum digunakan data scientist untuk melakukan analisis data. Pandas memudahkan kita dalam mengimport data, karena support banyak format, seperti xls, csv, txt dan file lainnya.
Data diimport dalam format dataframe pandas object. Dan Seaborn bekerja sangat baik dengan dataframe dari pandas.
Tutorial ini tidak akan membahas pandas secara detail.
Berikut contoh menggunakan dataframe pandas untuk menampilkan countplot Seaborn. File csv bisa didownload di https://drive.google.com/file/d/1-ki18neT2cTWEUoj8jt6ioE-ebBGIoQd/view?usp=sharing
Gunakan method df.read_csv(“namafile.csv”) untuk load data csv kedalam pandas dataframe. Untuk menampilkan countplot, parameter yang dibutuhkan adalah x, yang diisi dengan nama column “profile_invest” dari file csv, dan parameter data yang diisi dengan variable df.
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd df = pd.read_csv("profile_invest.csv") ns.countplot(x="profile_invest", data=df) plt.show()
Berikut Isi dari pandas dataframe dari file csv yang dibaca.
participant usia profile_invest
0 1 25 aggressive
1 2 28 aggressive
2 3 32 moderate
3 4 45 safe
4 5 41 moderate
5 6 39 safe
6 7 29 moderate
7 8 45 aggressive
8 9 45 safe
9 10 41 moderate
10 11 35 safe
11 12 31 moderate