Показать сообщение отдельно
  #28  
Старый 14.03.2013, 11:00
Аватар для VPolevoj
VPolevoj VPolevoj вне форума
эрудит
 
Регистрация: 02.09.2009
Адрес: Санкт-Петербург
Сообщения: 1,185
По умолчанию

Цитата:
Сообщение от VPolevoj
И зря Alex говорит, что подобные алгоритмы не имеют отношения к работе нашего мозга - имеют, и самое непосредственное. Например, наше зрение занято примерно тем же...
Цитата:
Сообщение от Alex
Вот тут, пожалуйста, подробнее. Где, в каких исследованиях показано, что это процесс последовательный? Для меня это очень важно.
Alex, к сожалению, быстро найти ссылку не удалось, но могу дать наводку: про это исследование я прочитал в журнале "Наука и Жизнь" в номерах примерно в годах между 1975 и 1980 (если у тебя есть доступ к оглавлениям этих журналов - могу дать точную ссылку на статью. К моему большому сожалению, на их сайте все оказалось просто ужасно: архива нет, оглавления нет, и т.д., но я наткнулся на любителей "НиЖ" - поищи, может у них что найдешь).

Изложу пока суть этих экспериментов и основные выводы из них.

Лаборатория, о которой рассказывается в статье, занимается изучением зрения и процессами распознавания образов. Ими был использован такой механизм, с помощью которого можно предъявлять зрительный образ очень короткий промежуток времени (вплоть до микросекунд).

Принцип устройства, если тебе интересно, очень простой: окуляр как в микроскопе (можно даже два - и тогда можно смотреть сразу двумя глазами и, следовательно, можно при желании предъявлять одновременно два разных изображения), далее стоит призма, которая разделяет световой поток на два пучка (а точнее, она позволяет два пучка света собирать в один и направляет его в глаз), с одной стороны подается "шум" - обычно это сетчатое поле или решетка и т.д., а с другой стороны - нужное изображение. Переключение между ними осуществляется за счет разницы в освещенности (я не совсем понимаю сам механизм, но принцип этого устройства в том, что любые системы инертны - и механические, и даже электрические - но время замещения "шума" на картинку и обратно на "шум" можно таким приспособлением свести практически к нулю, и варьировать этот интервал в рамках микросекунд.

Вот, сажают человека за такое устройство и начинают ему предъявлять какое-нибудь изображение постепенно наращивая время предъявления. Поначалу он ничего не видит ("белый шум"), затем что-то у него проясняется (но он еще не понимает что - обычно делаются различные предположения: например, показывали картинку со страусом, а человек на этом этапе распознавания говорит: "Что-то бежит"). И лишь на какой-то миллисекунде (а для этого требуется примерно 100-200 миллисекунд) человек правильно называет то, что ему показывают.

Но из такого эксперимента мало что понятно. Тогда стали делать так: попросили не распознавать, а выбирать из предъявляемого набора образцов. И выяснили, что если требуется выбирать всего из двух образцов, то время на распознавание требуется минимальное (не помню точно, но скажем где-то 10 мс), если требуется выбрать из трех-четырех образцов, то время для этого нужно 20 мс, если из 5-8 образцов, то на это потребуется уже 30 мс и т.д. Любой программист сразу же уловит закономерность - это степени двойки.

Дальнейшие исследования показали, что чем сложнее картинка, тем больше времени требуется на её анализ и распознавание. Полное осмысление целостной "сложной картинки" занимает чуть больше 600 мс (то есть, как видишь, даже больше чем полсекунды), но такая ситуация случается у нас очень редко - обычно мы смотрим на то, что уже видели (причем, буквально 1/30 секунды назад).

Интересен в этом плане процесс распознавания "сложной картинки" (под сложной я подразумеваю сюжетную картинку с множеством персонажей - где требуется не просто узнать - распознать - всех персонажей, но и понять кто и чем занимается). В этой статье для примера приводится картинка из детского мультфильма, на ней изображена полянка на которой резвятся детки зверят - лисенок, зайчонок, бельчонок и т.д. - такая милая детская картинка.

Сначала, как водится, человек ничего не видит. Начинают увеличивать время... Первая реакция: "Кто-то кого-то ловит!" Смотрю сам... Вроде бы мирная картинка, почти идиллическая... детки... ну да, есть хищник - лисенок, с некоторой натяжкой можно подумать что потенциальная угроза есть, ... но потом, присмотревшись, понимаешь, что лисенок-то, оказывается, бегает по полянке С САЧКОМ и ЛОВИТ бабочек. Но как наш мозг из всего увиденного ПЕРВЫМ выделяет именно это?!!!

И лишь потом из всей сценки начинают выплывать отдельные персонажи и сюжетные линии. Но первое - это кто-то кого-то ловит!

То есть, на мой взгляд, аналогия с программами акинатор и моей программой Незнайка есть. Наш глаз, так же как эти программы, "задает вопросы", причем очередность вопросов имеет значение - первыми задаются самые важные вопросы, ключевые решающие для жизни, и лишь затем - второстепенные, и в самую последнюю очередь - уточняющие.

И при этом не забывай: то что нам не нужно, мы НЕ ВИДИМ - не замечаем, даже если это лежит прямо перед нашими глазами. То есть, зрение - избирательно!

У нас всегда идет процесс выбора из необходимого предъявляемого изнутри набора образов, а не процесс ВВОДА и обработки входной информации. Глаз - это не видеокамера, а скорее, сравниватель с заданными образцами. Поэтому полная скорость обработки целостной картинки зависит от количества уже имеющихся образов для сравнения - количества задаваемых вопросов, на которые нужно получить ответ.
Ответить с цитированием