Pertanyaan

Teknik pembelajaraan penguatan yang bekerja dengan mempelajari fungsi dari nilai yang memberikan utility yang diharapkan untuk mengambi tindakan pada situasi tertentu disebut __ Maximum Flow Q- Learning Karatsuba Multiplication Metode Newton 2 poin

Solusi

Terverifikasi Ahli
4.5 (179 Suara)
Darshit master ยท Tutor selama 5 tahun

Jawaban

Q-Learning

Penjelasan

Teknik pembelajaran penguatan yang bekerja dengan mempelajari fungsi dari nilai yang memberikan utility yang diharapkan untuk mengambil tindakan pada situasi tertentu disebut Q-Learning. Q-Learning adalah teknik pembelajaran penguatan yang digunakan dalam bidang kecerdasan buatan, khususnya dalam permainan berbasis keputusan. Dalam Q-Learning, agen belajar untuk menghitung nilai Q(s, a) untuk setiap keadaan dan tindakan, di mana Q(s, a) adalah nilai harapan dari penguatan yang diperoleh jika agen memilih tindakan a pada keadaan s. Teknik ini memungkinkan agen untuk membuat keputusan yang optimal berdasarkan informasi yang telah dipelajarinya.