Optimisasi Flow Pada Gudang Menggunakan Q-Learning – Part 2
Sebelum melakukan implementasi menggunakan Python, langkah pertama adalah Mendefinisikan Environment, yang terdiri dari States, Action dan Rewards. States States adalah input yang akan diterima oleh AI Model. Untuk kasus ini, adalah lokasi dari robot pada waktu t. Karena akan digunakan Q-Learning, input tidak dapat berupa teks. Untuk itu kita perlu lakukan encoding untuk maping teks … Read more