Modul ini akan membahas penggunanan AI untuk mengoptimalkan proses. Studi kasus yang digunakan adalah flow pengambilan barang di gudang menggunakan Q-Learning.
Q-learning adalah algoritma reinforcement learning yang model-free reinforcement. Tidak dibutuhkan model dari environment, karena itu disebut “model-free”. Q-Learning berguna untuk mencari value dari sebuah aksi pada state tertentu.
Q-Learning dapat menangani masalah dengan stochastic transitions dan rewards tanpan memerlukan adaptations.
Pada studi kasus, diumpamakan penggunaan robot untuk mengambil barang di gudang dengan layout sederhana dibawah:
Kita akan sederhanakan kasusnya menjadi masalah mencari route.
Dengan menggunakan pendekatan Q-Learning, Robot dalam menjalankan tugasnya harus mencari route terpendek dari satu lokasi ke lokasi lainnya.