Library Python Untuk Data Science

Simple linear regression menggunakan Python cukup mudah, karena banyak library yang bisa digunakan.

Library pendukung yang digunakan adalah:

  • NumPy, library pendukung untuk mengolah multidimensional array.
  • Pandas, library untuk mengorganisasikan data dalam bentuk tabular dan labeling. Pandas juga memiliki banyak fungsi untuk melakukan data cleansing dan formating. Library penting untuk data science.
  • Matplotlib, library untuk melakukan ploting 2D, khusus untuk visualization hasil perhitungan library numpy.
  • StatsModel, library statistic yang dibuat berdasarkan library numpy. Dapat digunakan ini untuk linear regression, memudahkan programmer.
  • Sklearn, library untuk data science. Boleh dikatakan versi advanced dari statsmodel, karena data scientist memiliki kendali lebih terhadap data dan model.

Jika Anda menggunakan Anaconda, untuk memeriksa library apa saja yang sudah terinstall adalah dengan perintah conda list pada command prompt. Umumnya library diatas sudah otomatis diinstall oleh Anaconda saat melakukan instalasi awal.

conda list
conda list untuk melihat package/library yang sudah terinstall

Jika library yang dimaksud belum terinstall, gunakan salah satu perintah berikut, conda install nama_library atau pip install nama_library

conda install numpy atau pip install numpy

Sharing is caring: