Handling Outliers
Outliers adalah data point yang jauh berbeda dari data point lainnya dalam satu dataset yang sama. Ada beberapa teknik untuk identifikasi outilier, diantaranya: Distance from mean dan Distance from fitted line. Distance from Mean Mean adalah nilai rata-rata dari suatu dataset. Jika suatu datapoint sangat jauh dari mean, dapat dipertimbangkan sebagai outliers. Selain mean, diperlukan … Read more