Показать сообщение отдельно
  #14  
Старый 15.04.2020, 00:23
Аватар для Alexander B.
Alexander B. Alexander B. вне форума
Super Moderator
 
Регистрация: 05.06.2006
Сообщения: 1,517
Отправить сообщение для  Alexander B. с помощью ICQ
По умолчанию

"поэтому такое обучение является частным случаем обучения с учителем"
В статье про обучение с подкреплением.
Я смотрел как обучение "с подкреплением" реализуют, когда обучают ИИ играть в компьютерные игры. Фактически это чистое обучение с учителем + эволюционные алгоритмы (тысячи повторений).
Я просто не хочу в сортах говна разбираться, так сказать, как по мне это всё "обучение с учителем" в разных формах(что и написано в приведенной цитате из википедии).

Нужно делать обучение без учителя в принципе. Так что-бы в качестве поведенческой цели в ходе всего процесса было само по себе эффективное обучение.

Строим модель окружающего мира, и ведем себя так, что-бы максимально быстро эту модель проверять, улучать, отшлифовывать.
А когда модель будет готова, можно уже и заранее поставленных "целей подкрепления" достигать.
Ответить с цитированием