Pertanyaan
Teknik pembelajaraan penguatan yang bekerja dengan mempelajari fungsi dari nilai yang memberikan utility yang diharapkan untuk mengambi tindakan pada situasi tertentu disebut __ Maximum Flow Q- Learning Karatsuba Multiplication Metode Newton 2 poin
Solusi
Jawaban
Q-Learning
Penjelasan
Teknik pembelajaran penguatan yang bekerja dengan mempelajari fungsi dari nilai yang memberikan utility yang diharapkan untuk mengambil tindakan pada situasi tertentu disebut Q-Learning. Q-Learning adalah teknik pembelajaran penguatan yang digunakan dalam bidang kecerdasan buatan, khususnya dalam permainan berbasis keputusan. Dalam Q-Learning, agen belajar untuk menghitung nilai Q(s, a) untuk setiap keadaan dan tindakan, di mana Q(s, a) adalah nilai harapan dari penguatan yang diperoleh jika agen memilih tindakan a pada keadaan s. Teknik ini memungkinkan agen untuk membuat keputusan yang optimal berdasarkan informasi yang telah dipelajarinya.