Categorical Plot

Contoh dari categorical plot adalah count plot dan bar plot. Count plot sudah pernah dibahas pada modul sebelumnya.

Cateogrical Plot umumnya digunakan untuk membandingkan antara groups data. Contoh group tipe investor, group jumlah tips per hari dan lainnya.

Mirip dengan relplot, catplot adalah method yang lebih flexible dari countplot yang sudah dibahas pada modul sebelumnya.

kind = count

Berikut contoh penggunaan catplot. Perhatikan pada code digunakan pandas read_csv, karena data yang akan digunakan bukan dataset dari seaborn.

Parameter order adalah parameter untuk mengatur urutan dari bar pada chart.

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

prof_inv = pd.read_csv("profile_invest.csv")

ord_prof = ["safe", "moderate", "aggressive"]

sns.catplot(x="profile_invest", data=prof_inv, kind="count", order=ord_prof)
plt.show()

kind = bar

Catplot juga dapat menampilkan mean dari quantitive varible per category. Cukup mengisi parameter kind dengan bar.

Berikut contoh bar plots dengan dataset tips.

import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")

sns.catplot(x="day", y="total_bill", data=tips, kind="bar")
plt.show()

Garis pada bar menunjukan 95% confidence intervals dari mean.

kind = box

Menampilkan distribution dari quantitative data, data yang ditampilkan adalah median, spread, dan outliers.

  • Median : ditunjukan garis tengah
  • Spread : ditunjukan garis tegak seperti huruf T dan T terbalik, disebut whisker.
  • Outlier : ditunjukan oleh point yang mengambang.

Untuk mengatur panjang pendek whisker gunakan parameter whis. Default whis adalah 1.5 * interquartile range, bisa diubah menjadi seperti berikut:

  • whis=2.0, whisker akan lebih panjang, ada data outlier yang hilang dari tampilan.
  • 5-95 percentiles , whis = [5, 95]
  • min-max, whis = [0, 100], perhatian, data outlier akan hilang dari tampilan.
Sharing is caring:

Leave a Comment