![]() |
|
#1
|
|||
|
|||
![]() Цитата:
А почему ты считаешь deep learning тупиковой веткой? Вроде же нервная система это нейросеть, обучаемая с подкреплениями. Цитата:
Для наглядности всегда можно показывать несколько этапов обучения, типа поведение Дафнии после миллиона квантов времени, после 10 миллионов и т.д. Думаю сомнений не возникнет. Я сейчас работаю над возможностью запускать несколько Дафний во вселенную и чтобы они друг друга видели. Затем планирую сделать на Юнити минимального клиента, который коннектится к серверу и кнопками управляет Дафнией. Чтобы юнитисты имели возможность легкого старта для написания нейросети. Для питона тоже бы неплохо сделать минимальный клиент... Если нужны подробности, чтобы убедиться подойдёт ли эта вселенная для твоих целей, всегда на связи, в том числе голосовой. |
#2
|
||||
|
||||
![]() Цитата:
Во первых не понимаю где ты видел в нейросети дафний или младенца такой вид обучения. А во вторых энтот их диплернинг и "графы" даже нейросетью с трудом язык поворачивается назвать, скорее уравнения с множеством переменных, где переменные выбираются через другие уравнения. |
#3
|
|||
|
|||
![]() Цитата:
обучение с учителем link обучение с подкреплением link Дафния должна сначала двигаться хаотически, случайно есть крошки. Поедания крошки это подкрепление. Она должна запоминать поведение, приведшее к подкреплению и повторять его постепенно совершенствуя. На словах легко, а как сделать? Затем можно сделать, допустим красные крошки, чтобы были невкусные, то есть отрицательное подкрепление. И Дафния должна будет их огибать. |
#4
|
||||
|
||||
![]() "поэтому такое обучение является частным случаем обучения с учителем"
В статье про обучение с подкреплением. Я смотрел как обучение "с подкреплением" реализуют, когда обучают ИИ играть в компьютерные игры. Фактически это чистое обучение с учителем + эволюционные алгоритмы (тысячи повторений). Я просто не хочу в сортах говна разбираться, так сказать, как по мне это всё "обучение с учителем" в разных формах(что и написано в приведенной цитате из википедии). Нужно делать обучение без учителя в принципе. Так что-бы в качестве поведенческой цели в ходе всего процесса было само по себе эффективное обучение. Строим модель окружающего мира, и ведем себя так, что-бы максимально быстро эту модель проверять, улучать, отшлифовывать. ![]() А когда модель будет готова, можно уже и заранее поставленных "целей подкрепления" достигать. |
#5
|
|||
|
|||
![]() Цитата:
![]() Но практика критерий истины, пробуй. Нервная система полностью на клиенте, ему и все карты в руки. Моя планируемая нервная система наверное будет подходить под категорию "обучение с подкреплением". |
#6
|
|||
|
|||
![]() В апреле продолжил:
Этап 2. Сверхбыстрая физика. 1. Теперь сервер поддерживает множество клиентов. Две дафнии впервые увидели друг друга. 2. На сервере реализован TCP/IP протокол для администратора. Он нужен для красивых демонстраций происходящего на сервере на графике Unreal Engine. Сейчас UE4 клиент уже умеет закачивать с сервера состояние вселенной (положение шариков корма), но пока он видит только собственную дафнию, что делают другие дафнии не видно. 3. Разработан минимальный клиент на WinApi, который коннектится к серверу, отображает состояние глаза Дафнии, а также даёт команды моторным нейронам с клавиатуры. 4. Создан ютуб-канал и записан демонстрационный ролик. https://youtu.be/VyoSWdGh6Rg Сервер https://github.com/talashby/DaphniaServer Клиент UE4 https://github.com/talashby/Daphnia Клиент WinApi https://github.com/talashby/DaphniaWinApi В планах сделать минимальные клиенты на Unity и на Python, для лёгкого старта желающих участвовать в проекте. Далее сам буду разрабатывать нервную систему на WinApi-клиенте. Преимущества научно-исследовательского проекта Дафния перед другими ИИ-проектами: - упрощённая физика с чёткими законами - распараллеливаемость физики На мой взгляд реальная физика слишком сложна для компьютерного моделирования, как в плане быстродействия, её трудно распараллелить по ядрам, так и в плане качественной реализации. Обычно приходится обходить множество нюансов, что является препятствием для усложнения мира, где существует ИИ. |