Episodic dan Continuing Task

Episodic dan Continuing Task adalah jenis task yang mungkin terjadi dalam Reinforcement Learning.

Episodic Task

Episodic task adalah interaksi antara agent dan environment yang memiliki ending point.

Contoh: Agent yang dilatih untuk memainkan game Atari Breakout. Interaksi berakhir ketika agent menang atau kalah.

Urutan interaksi dari awal hingga akhir disebut episode. Pada akhir episode, Agent dapat mengetahui reward yang diperoleh. Interaksi ini akan dimulai lagi dari awal dan baru, namun dengan tambahan, Agent sudah memiliki pengetahuan dari episode sebelumnya.

Proses ini akan berulang, hingga Agent akan lebih baik mengambil keputusan, untuk mendapatkan cumulative reward yang tinggi.

Pada konteks agent yang memainkan game, maka score tertinggi adalah targetnya.

Continuing Tasks

Continuing task adalah interaksi yang terus menerus tanpa akhir antara agent dan environment.

Contoh: algoritma untuk membeli atau menjual saham. Agent akan terus belajar mengambil keputusan, sambil terus berinteraksi dengan environment. Algoritma untuk tipe continuing task lebih rumit dibanding episodic.

Sharing is caring: