Computer Vision Pipeline

Walaupun aplikasi computer vision sangat luas, namun semuanya menggunakan urutan langkah yang sama untuk memproses dan analisa data image, yang disebut computer vision pipeline.

Umumnya dimulai dengan mengumpulkan image dan data, processing, melakukan analisis dan recognition dan akhirnya melakukan prediksi berdasarkan informasi yang dikumpulkan.

Contoh penerapan pipeline diatas untuk sistem image classifier. Misal kita memiliki gambar sebuah motor, dan model diharapkan untuk memprediksi berdasarkan class: apakah gambar tersebut dalam class mobil, motor, dan pesawat.

Image classifier adalah algoritma dengan image sebagai input dan menghasilkan outputs sebuah label atau “class” yang mengidentifikasikan image tersebut.

  1. Input Image, komputer menerima visual input dari imaging device seperti kamera. Dapat berupa image atau video.
  2. Pada langkah pre-processing, berguna untuk melakukan standarisasi image. Umumnya dilakukan resizing, blurring, rotating, mengubah warna — misalnya dari color menjadi grayscale.
  3. Features digunakan untuk mendefinisikan sebuah object, biasanya berupa informasi bentuk dan warna. Contoh, fitur dari sebuah motor adalah roda motor, lampu depan, spakbor, dan lainnya. Keluaran dari proses feature extraction adalah features vector, berupa list bentuk unik yang dapat mengidentifikasikan sebuah objek.
  4. Feature diinput kedalam classification model. Vector dari langkah sebelumnya akan digunakan untuk memprediksi class dari image tersebut.
  5. Output berupa probabilitas untuk setiap class.

Untuk meningkatkan akurasi, kita bisa tingkatkan pada masing-masing langkah diatas:

  • Langkah 1, menambah data training.
  • Langkah 2, memperbaiki metode preprocesing untuk menghilangkan noise.
  • Langkah 3, mengekstrak feature yang lebih tepat.
  • Langkah 4, mengubah algoritma classifier dan melakukan tuning hyperparameters atau menambah training time.
Sharing is caring:

Leave a Comment