Восприятие
Информация может поступать к органам чувств в виде отдельных единиц и фрагментов, но не таким мы воспринимаем этот мир. Мы воспринимаем мир предметов илюдей, воздействующих на нас как единые целостные образования, а не как конгломераты ощущений. Только при необычных обстоятельствах либо во время черчения или рисования мы начинаем замечать отдельные признаки и части стимулов; практически все остальное время мы видим трехмерные объекты и слышим слова или музыку.
Изучая восприятие, мы обращаемся к тому, как сенсорная информация интегрируется в перцепты объектов и как эти перцепты затем используются для ориентировки в окружающем мире (перцепт — это продукт процесса восприятия). Постоянно упоминаются две общие задачи. Перцептивная система должна определять: а) что это за объекты (яблоки, столы, кошки или еще что-то) и б) где эти объекты находятся (слева на расстоянии моей вытянутой руки, в сотне метров прямо передо мной или еще где-то). Эти же две задачи стоят перед слуховым восприятием (что это был за звук — телефон или сирена и откуда он пришел — спереди или сбоку) и перед другими сенсорными модальностями.
В случае зрения определение того, что это за объект, обычно связывают с процессом распознавания паттернов, или просто распознаванием. Для выживания оно имеет решающее значение, поскольку прежде чем делать вывод о каких-либо важных свойствах объекта, чаще всего надо сначала знать, что это за объект. Так, когда мы уже знаем, что объект — это яблоко, мы знаем и то, что он съедобен: а когда известно, что объект — это волк, мы знаем, что его лучше не беспокоить. Определение местоположения видимых объектов называется пространственной локализацией, или просто локализацией. Она тоже необходима для выживания. Благодаря локализации мы передвигаемся среди окружения. Если бы такой способности не было, мы бы постоянно наталкивались на объекты, не могли бы взять вещь, к которой тянемся, и натыкались бы на опасные предметы и хищников.
Помимо распознавания и локализации объектов другая задача нашей перцептивной системы состоит в том, чтобы сохранять постоянство видимых объектов, несмотря на то что их отпечатки на сетчатках глаз постоянно меняются. Эта константность восприятия также будет рассмотрена нами.
<Рис. Мы используем пространственную локализацию для перемещения в окружающей нас среде. Не обладая этой способностью, мы не могли бы безопасно перейти улицу.>
В ходе дальнейшего обсуждения мы сначала обратимся к выяснению того, как мозг распределяет решаемые им перцептивные задачи. Затем мы обратимся к тому, что на сегодня известно об основных процессах восприятия — локализации, распознавании и константности восприятия. При этом мы также обсудим роль внимания. Наконец, мы рассмотрим развитие восприятия. На протяжении всей этой главы мы прежде всего сосредоточимся на зрительном восприятии, поскольку это наиболее исследованная область. Не забывайте, однако, что задачи локализации, распознавания и константности, по-видимому, имеют отношение ко всем сенсорным модальностям. Возьмем, например, распознавание: с помощью слуха можно распознать сонату Моцарта, с помощью обоняния — жареную еду из Макдональдса, с помощью осязания — монету 25 центов в кармане брюк, а с помощью чувства тела — что танцуешь польку.
Разделение труда в мозге
За последнее десятилетие мы многое узнали о нервных процессах, лежащих в основе восприятия. В самом общем плане можно сказать, что часть мозга, отвечающая за зрение — зрительная кора, — функционирует по принципу разделения труда. Не вся зрительная кора участвует во всех или почти всех аспектах восприятия, а различные области специализированы для выполнения различных перцептивных функций (Kosslyn & Koenig, 1992; Zeki, 1993).
Зрительная кора
Более тысячи миллионов нейронов коры головного мозга восприимчивы к зрительным входным сигналам. Все, что нам известно об этих нейронах и о механизмах их функционирования, мы узнали благодаря использованию лишь небольшого числа техник. Наши знания, полученные в ходе исследований, проводимых на животных, основаны прежде всего на экспериментах, в которых (с помощью микроэлектродов) производилась запись электрических импульсов, идущих от отдельной клетки, о чем рассказывалось в главе 4. Развитие современных техник, используемых при проведении таких исследований, во многом обязано пионерским работам Дэвида Хьюбела и Торнстейна Визела (DavidHubelandTornsteinWiesel), получивших Нобелевскую премию в 1981 году.
Источником большей части наших знаний, полученных в ходе исследований с участием людей, являются «естественные эксперименты», т. е. случаи повреждений мозга у людей, проливающие свет на связь визуального поведения со специфическими участками мозга. В число исследователей, работающих в этой области, входят нейрологи (медицинские работники, специализирующиеся на лечении мозга), нейропсихологи (психологи, специализирующиеся на лечении и изучении пациентов с повреждениями мозга). Прекрасным введением в данную область исследований может послужить книга Оливера Сэка «Человек, который спутал свою жену со шляпой» (OliverSack. TheManWhoMistookHisWifeforaHat, 1987).
Наиболее впечатляющие открытия последних лет, касающиеся человеческого мозга, были сделаны с помощью получения изображений мозга без хирургического вмешательства. Эта область, получившая название визуальных исследований мозга, включает такие техники, как связанные с событиями потенциалы (event-relatedpotentials, ERP), позитронно-эмиссионная томография (ПЭТ) и функциональные магнитно-резонансные изображения (ФМРИ).
Наиболее важным участком мозга, ответственным за обработку визуальной информации, является область, называемая первичной зрительной корой, или зоной V1. Она расположена в задней, или затылочной, части мозга, показанной на рис. 5.1. Именно с этим участком коры большого мозга непосредственно соединены нейроны, посылающие зрительные сигналы от глаз. Все остальные чувствительные к визуальным сигналам участки мозга (их было идентифицировано более 30) связаны с глазами через зону V1.
Рис. 5.1. Две системы в зрительной коре.
Система локализации показана стрелками, идущими от задней части мозга к верхней; система распознавания показана стрелками от задней части мозга к нижней (по: Mishkin, Ungerleider& Macko, 1983).
карта зрительного поля натянута на заднюю часть коры, а ее центр приходится на наиболее удаленную заднюю точку коры.
Однако эта «карта» перевернута вверх ногами и отражена зеркально. Точки, расположенные в верхней половине зрительного поля, нанесены на карту ниже основной кортикальной складки, или долины, а точки, расположенные в нижней половине зрительного поля, представлены на карте выше этой складки. Левая половина зрительного поля соответствует правой стороне зоны V1, а правая половина зрительного поля — ее левой стороне.
Нейроны первичной зрительной коры восприимчивы ко многим характеристикам, которые содержит зрительный образ, таким как яркость, цвет, ориентация в пространстве и движение. Однако одной из наиболее важных характеристик этих нейронов является то, что каждый из них отвечает за анализ лишь очень небольшой области образа. В фовеальной части образа эти области могут быть столь малы, что позволяют рассмотреть детали, размеры которых меньше одного 1 миллиметра, на расстоянии вытянутой руки. Эти нейроны также взаимодействуют между собой только в пределах очень ограниченных областей. Преимущество такой организации состоит в том, что она позволяет одновременно производить очень подробный анализ всего зрительного поля. Однако такой анализ не позволяет координировать информацию о точках зрительного образа, не расположенных в непосредственной близости друг от друга; иными словами, она не позволяет «за деревьями видеть лес».
Для выполнения этой задачи кортикальные нейроны посылают информацию из зоны V1 во многие другие области мозга, анализирующие зрительную информацию. Каждая из этих областей специализируется на выполнении определенной задачи, например, анализе цвета, движения, формы и расположения в пространстве. Эти выполняющие более специфические задачи области также постоянно взаимодействуют с зоной V1, так что нейронную коммуникацию между этими областями правильнее будет представлять себе как переговоры, а не как одностороннее отдавание приказов (Damasio, 1990; Zeki, 1993). Одна из наиболее важных форм разделения труда при визуальном анализе, производимом мозгом, состоит в различии между локализацией и распознаванием
Система распознавания и система локализации
Положение о том, что локализация объекта и его распознавание — качественно различные задачи, подтверждается данными, согласно которым эти задачи выполняются различными участками зрительной коры.
В более современных исследованиях для подтверждения существования раздельных систем распознавания и локализации объектов в мозге человека были применены методы компьютерной томографии. Предполагается, что участки, где кровоток больше, участвуют в выполнении текущей задачи.
В одном из исследований с использованием ПЭТ испытуемым давались две задачи: одна — тест на узнавание лиц, т. е. задача на распознавание, а другая — тест мысленного вращения, который предположительно связан с локализацией. В задаче на узнавание лиц испытуемому в каждой пробе предъявлялась целевая картинка, а под ней — два тестовых изображения лица. На одном из тестовых изображений было то же лицо, что и на целевой картинке, но в измененной ориентации и при другом освещении; на другом — лицо другого человека. Испытуемый должен был решить, на какой из тестовых картинок изображено то же лицо, что и на целевой картинке (рис. 5.3а). При выполнении этой задачи наблюдался рост кровотока в распознающем отделе коры (ветвь, оканчивающаяся у основания коры), чего не наблюдалось в отделе, отвечающем за локализацию (ветвь, оканчивающаяся у вершины коры). В задаче с мысленным вращением результаты были совсем другими. Здесь испытуемым в каждой пробе показывали целевую картинку, на которой была двойная линия, а на некотором расстоянии от нее — точка. Под целевой картинкой были две тестовые. На одной из них была та же конфигурация, что и на цели, но повернутая на определенный угол; на другой была конфигурация с другим расположением точки и линий (рис. 5.3б). При решении этой задачи у испытуемых наблюдался рост кровотока в отделе коры, отвечающем за локализацию, чего не наблюдалось в отделе, отвечающем за распознавание. Следовательно, процессы локализации и распознавания протекают в совершенно различных участках зрительной коры (Gradyetal., 1992; Haxbyetal., 1990).
Рис. 5.3. Задачи на распознавание и локализацию.
Примеры рисунков, предъявлявшихся в задачах на сравнение а) лиц и 6) расположений точки (по: Gradyetal., 1992).
Разделение труда в зрительной коре не ограничивается делением между локализацией и распознаванием. Оказывается, что разные виды информации, используемой при распознавании, — например, цвет, форма, текстура — обрабатываются различными участками или клетками распознающего отдела коры.
Аналогичным образом, различным видам информации, используемым при распознавании — форме, цвету и текстуре, — также соответствуют специализированные подотделы мозга, ответственные за их анализ (Livingstone & Hubel, 1988; Zeki, 1993). Таким образом, зрительная кора состоит из многочисленных «модулей переработки», каждый из которых специализируется на выполнении определенной задачи. Чем больше мы узнаем о нейрологическом базисе других сенсорных модальностей (а также о других психологических функциях), тем более правдоподобной представляется данная модель, предполагающая разделение труда между различными модулями переработки информации.
Локализация
Чтобы знать расположение окружающих предметов, первое, что надо сделать, — это отделить объекты друг от друга и от фона. Затем перцептивная система может определять положение объектов трехмерного мира, включая их удаленность и характер движения.
Сегрегация объектов
Изображение, спроецированное на сетчатке глаза, является мозаикой из элементов различной яркости и цвета. Перцептивная система каким-то образом организует эту мозаику в ряд дискретных объектов, выступающих на некотором фоне. Такого рода организацией весьма интересовалась гештальт-психология — направление в психологии, возникшее в Германии в начале XXвека. Гештальт-психологи особую важность придавали восприятию целостных объектов или форм; они предложили ряд принципов, по которым мы организуем воспринимаемые объекты.
Фигура и фон. В стимуле, который состоит из двух и более различных участков, мы обычно видим одну часть как фигуру, а другую — как фон. Участки, видимые как фигура, содержат интересующие нас объекты: они кажутся более твердыми, чем фон, и видятся впереди фона.
Это простейший вид перцептивной организации. Рис. 5.4а показывает, что организация по принципу фигуры и фона может быть обратимой. Если вы посмотрите на эту картинку несколько секунд, то заметите, что в качестве фигуры можете воспринимать вазу или два профиля. То есть один и тот же контур можно видеть как часть одного или другого объекта. Тот факт, что вы можете делать это сами, говорит о том, что организация фигуры и фона является не частью физического стимула, а результатом работы нашей перцептивной системы.
Рис. 5.4. Обратимость фигуры и фона.
Три паттерна, на которых можно видеть либо белую вазу, либо два черных лица. Обратите внимание, что мы не можем видеть обе организации одновременно, даже если вы знаете, что обе они могут быть восприняты. Если белая область меньше по площади (а), вы скорее будете видеть вазу; если же меньшую площадь занимает черная область (б), вы скорее будете видеть лица.
Заметьте также, что лица и вазу невозможно увидеть одновременно. Вы «знаете», что можете увидеть каждое из этих изображений, но вы не можете «видеть» и то и другое изображение в один и тот же момент. Вообще говоря, чем меньше по размерам рассматриваемая область или форма, тем более вероятно, что вы сможете увидеть ее как фигуру. Это можно продемонстрировать, сравнив рис. 5.4а, б и в. Вазу легче увидеть, когда меньше по размерам белая область, а лица легче увидеть, когда меньше черная область (Weisstein & Wong, 1986).
На рис. 5.5 показан более сложный вариант обратимости фигуры и фона
. (Заметим, что отношения типа фигуры и фона могут восприниматься не только зрительно, но и в других модальностях. Например, можно слышать пение птицы на фоне уличных шумов или мелодию скрипки на фоне звуков остального оркестра.)
Рис. 5.5. Невольничий рынок с исчезающим бюстом Вольтера.
Обратимая фигура находится в центре этой картины Сальватора Дали (1940). Две монашки, стоящие под сводчатым проходом, превращаются в форму бюста Вольтера.
Группировка объектов.
Мы не только видим объекты на некотором фоне, но и группируем их определенным образом. Даже когда мы смотрим на простые паттерны из линий или точек, они объединяются в группы.
В качестве примера посмотрите на матрицу из точек, показанную на рис. 5.6а. Эти точки расположены на равных расстояниях друг от друга, поэтому их можно видеть как организованные в ряды и колонки и даже по диагональным линиям. Таким образом, перед нами неоднозначный паттерн, сходный по своим принципам организации с изображенными на рис. 5.4 и 5.5. Только одну из организаций можно видеть в каждый момент времени, и периодически происходит переключение между этими организациями.
Рис. 5.6. Гештальт-детерминанты группировки.
а) Точки, расположенные на равных расстояниях, могут зрительно восприниматься как ряды, колонки и даже диагонали. б) Группировка в колонки по смежности. в) Группировка в колонки по цветовому сходству. г) Группировка в колонки по сходству формы. д) Группировка по (вероятному) продолжению. е) Группировка по замыканию (контура).
Гештальт-психологи предложили ряд детерминант, определяющих группировку такого рода точечных паттернов. Например, если сократить расстояния между точками по вертикали, как на рис. 5.6б, вы скорее всего будете видеть колонки. Такой тип группировки называется группировкой по смежности. Если вместо изменения расстояний между точками мы изменим цвет или форму элементов, мы получим организацию точек на основе сходства (рис. 5.6в, г). Если мы переместим точки так, чтобы они располагались вдоль двух пересекающихся линий, мы получим группировку по вероятному продолжению (рис. 5.6д). А если мы с помощью линий, состоящих из точек, оградим замкнутое пространство, мы будем видеть группировку по замыканию (рис. 5.6е). Обратите внимание, что в последнем случае мы видим ромб, ограниченный двумя линиями, несмотря на то что данный паттерн может быть описан как хорошо знакомая нам буква М, отраженная зеркально по вертикали, или как буква К, отраженная по горизонтали. Этот факт свидетельствует о значительном влиянии гештальт-детерминант. Такие детерминанты помогают нам образовывать наиболее стабильные, согласованные и простые формы, возможные в рамках данного паттерна.
Все эти данные свидетельствуют о том, что визуальная группировка играет важную роль в организации нашего визуального опыта.
Хотя перцептуальная группировка изучалась преимущественно на примере зрительного восприятия, аналогичные детерминанты группировки, по-видимому, существуют и для слухового восприятия. Группировка по смежности с очевидностью проявляется при слуховом восприятии (хотя в данном случае речь идет о смежности во времени, а не в пространстве). Например, четыре удара по барабану с интервалом между вторым и третьим ударом будут восприниматься как две пары ударов. Аналогичным образом, известно, что замыкание также играет важную роль в восприятии музыкальных тонов и более сложных стимулов (Bregman, 1990).
Слух
Так же как и зрение, слух является важнейшим средством получения информации об окружении. Для многих из нас это основной канал коммуникации и средство передачи музыки. Как мы увидим, все это возможно благодаря тому, что небольшие изменения звукового давления приводят в колебательное движение мембрану внутреннего уха.
Как и глаз, ухо содержит две системы. Одна система усиливает и передает звук к рецепторам, после чего за дело принимается другая система, которая преобразует звук в нервные импульсы. Передающая система включает наружное ухо, состоящее из внешнего уха (pinna— ушная раковина) и слухового канала, а также среднее ухо, состоящее из барабанной перепонки и цепочки из трех костей — молоточка, наковальни и стремечка. Система преобразования расположена в части внутреннего уха, называемой улиткой и содержащей рецепторы звука.
<Рис. Если на рок-концерте сидеть или стоять перед акустическими системами, это может вызвать необратимую потерю слуха.>
Другие ощущения
По сравнению со зрением и слухом, другим ощущениям недостает тех богатых функциональных возможностей, из-за которых зрение и слух называют «высшими чувствами». И все же эти другие чувства жизненно важны. Например, ощущение запаха (обоняние) является одним из наиболее примитивных и наиболее важных из этих ощущений. Возможно, это связано с тем, что запах проникает в мозг по более прямому маршруту, чем любые другие ощущения. Рецепторы, расположенные в носовой полости, связаны с мозгом без посредства синапсов. Более того, в отличие от зрительных и слуховых рецепторов, обонятельные рецепторы испытывают непосредственное воздействие окружающей среды — они находятся прямо в носовой полости и не имеют перед собой защитной оболочки. (Тогда как зрительные рецепторы расположены позади роговой оболочки, а слуховые защищены наружным и средним ухом.)
Обоняние
Чувство запаха, или обоняние, помогает нашему выживанию: оно необходимо для обнаружения испорченной пищи или незакрытого газа, а потеря обоняния может привести к притуплению аппетита. И все же для многих других биологических видов обоняние еще важнее. Поэтому неудивительно, что у них обонянию отведена большая часть коры, чем у нас. У рыб обонятельная кора почти целиком охватывает полушария мозга, у собак — примерно одну треть, у человека — всего одну двадцатую часть. В этом отражены межвидовые различия в обонятельной чувствительности.
Поскольку обоняние у других видов развито столь хорошо, они часто используют его как ведущее средство коммуникации. Насекомые и некоторые высшие животные выделяют химические вещества, известные как феромоны и распространяющиеся по воздуху, так чтобы их могли унюхать другие представители этого же вида. Например, самка мотылька может выделять настолько сильный феромон, что самцов влечет к ней с расстояния в несколько миль. Установлено, что самец мотылька реагирует именно на феромон, а не на вид самки; его будет влечь к самке, находящейся в контейнере из проволочной сетки, несмотря на то, что ее вид недоступен, но не к самке в стеклянном контейнере, где ее хорошо видно, но путь для запаха блокирован.
Насекомые пользуются запахом, чтобы сообщать не только о «любви», но и о смерти. Когда муравей умирает, химические вещества, образующиеся при разложении его тела, стимулируют других муравьев отнести его тело на мусорную кучу снаружи гнезда. Если живого муравья пропитать этим феромоном разложения, другие муравьи тут же относят его на мусорную кучу. Когда он возвращается в гнездо, его уносят опять. Эти попытки преждевременных похорон продолжаются, пока «запах смерти» не выдохнется (Wilson, 1963).
Остались ли у нас, людей, пережитки этой примитивной системы общения? Эксперименты показывают, что как минимум мы можем отличать по запаху себя от других и мужчин от женщин. В одном из исследований испытуемые носили майку в течение 24 часов, не принимая душ и не пользуясь дезодорантом. Затем они сдавали майки экспериментатору. Каждому испытуемому экспериментатор предъявлял для обнюхивания три майки: собственную майку испытуемого, одну мужскую и одну женскую.
Основываясь только на запахе, большинство испытуемых обычно могли отличить свою собственную майку, а также определить, какую из двух остальных носил мужчина, а какую — женщина (Russel, 1976; Schleidt, Hold& Attili, 1981). Другие исследования показывают, что по запаху мы можем определять и более тонкие вещи. Между женщинами, которые живут или работают вместе, видимо, происходит обмен информацией посредством запаха относительно их менструального цикла, так что со временем их менструальные циклы синхронизируются и начинаются в одно время (Russel, Switz& Thompson, 1980; McClintock, 1971).
Система обоняния состоит из рецепторов, расположенных в носовом проходе, соответствующих участков мозга и соединяющих их проводящих нервных путей. Рецепторы обоняния расположены глубоко в носовой полости. Когда реснички (образования, похожие на волоски) этих рецепторов соприкасаются с молекулами пахучего вещества, появляется электрический импульс; таков процесс превращения. Этот импульс передается по нервным волокнам в обонятельную луковицу — участок мозга, находящийся как раз под передними долями. В свою очередь, обонятельная луковица соединяется с обонятельной корой, расположенной с внутренней стороны височных долей. (Любопытно, что существует прямая связь между обонятельной луковицей и частью коры, которая, как известно, участвует в формировании следов долговременной памяти; возможно, с этим связано представление, что характерный запах может сильно способствовать воспроизведению старых воспоминаний.)
Вкус
Вкус часто связывают с теми ощущениями, которые на самом деле к нему не относятся. Мы говорим, что еда «вкусная», но если запах устранить сильным замораживанием, ощущения от обеда тускнеют и тогда может быть трудно отличить красное вино от уксуса. И все же вкус (или густация) имеет самостоятельную ценность. Даже на сильном холоде можно отличить соленую пищу от несоленой.
В дальнейшем мы будем говорить о вкусе определенных веществ, хотя заметим, что вкушаемое вещество не является единственным фактором, определяющим его вкус. Наше генетическое устройство и опыт также влияют на вкус. Например, у всех людей разная чувствительность к горькому вкусу кофеина или сахарина, и это различие, видимо, предопределено генетически (Bartoshuk, 1979). В качестве другого примера молено привести жителей провинции Карнатака в Индии, которые едят много кислой пищи и находят вкус лимонной кислоты или хинина приятным; большинство из нас испытывает обратные ощущения. Это частное различие вкусов людей, видимо, определяется опытом, поскольку индусы, выросшие в западной стране, считают вкус лимонной кислоты и хинина неприятным (Moskowitzetal., 1975).
Вкусовая система.
Стимулом для вкуса служит вещество, растворенное в слюне — жидкости, похожей на соленую воду. Вкусовая система содержит рецепторы, расположенные на языке, в гортани и на нёбе; в эту систему входят также соответствующие участки мозга и проводящие нервные пути. В дальнейшем мы сосредоточимся на рецепторах языка. Эти вкусовые рецепторы расположены пучками, которые называются вкусовыми почками и находятся на шишечках языка и вокруг рта. На концах вкусовых почек имеются короткие, похожие на волоски образования, которые выходят наружу и контактируют с растворами во рту. В результате этого контакта возникает электрический импульс; таков процесс превращения. Электрический импульс затем поступает в мозг.
Для описания вкуса существует общепринятая терминология. Всякий вкус можно описать одним из четырех основных качеств или их комбинацией: сладкий, кислый, соленый и горький (McBurney, 1978). Эти четыре вкуса лучше всего представлены сахарозой (сладкий), соляной кислотой (кислый), поваренной солью (соленый) и хинином (горький). Когда испытуемых просят описать вкус различных веществ при помощи четырех основных видов вкуса, у них не возникает трудностей; если даже им дают возможность использовать для описания дополнительные названия качеств по своему выбору, они склонны ограничиваться этими четырьмя (Goldstein, 1989).
Для кодирования вкуса вкусовая система использует как активацию специфических нервных волокон, так и паттерны активации совокупности нервных волокон. Существует четыре типа нервных волокон — соответственно четырем основным вкусам. Хотя каждый тип волокна реагирует в некоторой степени на все четыре основных вкуса, лучше всего он реагирует только на один из них. Следовательно, имеет смысл говорить о «соленых волокнах», активность которых сигнализирует мозгу о наличии соленого вкуса. Итак, существует хорошее соответствие между субъективным ощущением вкуса и его нервным кодом.
Поздние стадии распознавания
Теперь, когда у пас уже есть некоторое представление об описании формы объекта, можно обратиться к тому, как это описание сопоставляется с теми описаниями форм, которые хранятся в памяти, с целью найти лучшее соответствие.
Простые сети.
Во многих исследованиях этапа сопоставления использовались простые паттерны, в частности, письменные или печатные буквы или слова. На рис. 5.13 показано, как мы можем хранить в памяти описания формы букв. Основная идея состоит в том, чтобы описывать буквы по определенным признакам, информация о которых для каждой буквы хранится в многосвязной сети (отсюда сам термин многосвязная модель). [В некоторых изданиях термин connectionistmodelпереводится как «коннектионистская модель». Поскольку существенным свойством здесь является именно множественность и многоуровневость связей между элементами, название «многосвязная модель» представляется нам более адекватным. — Прим. перев.] В многосвязной модели привлекает то, что легко представить, как такие сети реализуются в мозге с его массивами взаимосвязанных нейронов. Таким образом, многосвязность служит мостом между психологическими и биологическими моделями.
Рис. 5.13. Простая сеть.
Нижний уровень этой сети содержит признаки (наклонные линии, вертикальная линия и кривая, выгнутая вправо), верхний уровень содержит буквы, а связь между признаком и буквой означает, что данный признак является частью этой буквы. Поскольку эти связи возбуждающие, при активации признака активация передается букве.
Нижний уровень сети, показанной на рис. 5.13, содержит признаки — например, правую диагональ, левую диагональ, верикальную линию и кривую, выгнутую вправо. Эти признаки и буквы мы будем называть узлами сети. Связь между узлом признака и узлом буквы означает, что данный признак принадлежит этой букве. Стрелки на концах соединений означают, что связи являются возбуждающими; когда активируется тот или иной признак, активация передается букве (аналогично тому, как электрические импульсы распространяются по сети нейронов).
Сеть на рис. 5.13 говорит нам, что буква K состоит из правой диагонали, левой диагонали и вертикальной линии; буква Rсостоит из левой диагонали, вертикальной линии и кривой, выгнутой вправо; а буква P состоит из вертикальной линии и кривой, выгнутой вправо. (Для простоты мы здесь опускаем взаимосвязи признаков.) Чтобы понять, как при помощи этой сети можно распознать (или подобрать) букву, посмотрим, что происходит при предъявлении буквы K. Она будет активировать правую диагональ, левую диагональ и вертикальную линию. Все эти три признака будут активировать узел буквы K; два признака — левая диагональ и вертикальная линия — будут активировать узел буквы Rи один признак — вертикальная линия — будет активировать узел буквы P. Только в узле буквы K активированы все признаки, и следовательно, она будет выбрана как наиболее подходящая.
Эта модель слишком проста для объяснения многих аспектов распознавания. Чтобы понять, чего в этой модели не хватает, посмотрим, что происходит, когда предъявляется буква R(рис. 5.14). Она активирует левую диагональ, вертикальную линию и кривую, выгнутую вправо. Теперь в обоих узлах букв Rи P активированными оказываются все признаки этих букв, и в этой модели никак нельзя решить, какую букву следует выбрать. Чтобы остановиться на одном определенном варианте, эта модель должна знать: наличие левой диагонали означает, что на входе не может быть буквы P. Подобная отрицательная информация учтена в усложненной сети, показанной на рис. 5.14.
Рис. 5.14. Усложненная сеть.
Помимо активирующих связей эта сеть содержит тормозящие соединения между признаками и теми буквами, которые этих признаков не содержат.
В этой сети есть все то же, что и в предыдущей, плюс тормозные связи (они показаны с точками на концах) между признаками и теми буквами, которые не содержат этих признаков. Когда признак соединен с буквой тормозной связью, активация этого признака уменьшает активацию буквы. Если буква Rпредъявляется сети, показанной на рис. 5.14, левая диагональ вызывает торможение в узле буквы Р, снижая тем самым ее общий уровень активации; теперь наибольшая активация будет в узле буквы Rи, следовательно, она будет выбрана как наилучшее соответствие.
Сети с обратной связью.
Основную идею модели, которую мы только что рассмотрели, а именно что описание буквы должно содержать как те признаки, которые она имеет, так и те, которые в ней отсутствуют, — первоначально предложили исследователи искусственного интеллекта, которые разрабатывали компьютерные программы, моделирующие восприятие букв человеком. Хотя в то время такие идеи пользовались относительным успехом, в конце концов оказалось, что они неспособны адекватно объяснить данные о влиянии контекста на способность воспринимать буквы. В частности, оставалось непонятным, почему буква легче воспринимается, когда она предъявляется в составе слова, чем когда она предъявляется сама по себе. Так, если испытуемым на короткое время предъявляют изображение либо только буквы K, либо слова «WORK» (работа), а затем спрашивают, была ли последняя буква K или D, они отвечают точнее, если было предъявлено целое слово, а не одна буква (рис. 5.15).
Рис. 5.15. Восприятие букв и слов.
Этот рисунок иллюстрирует последовательность событий в эксперименте, в котором сравнивалось восприятие букв, предъявлявшихся отдельно или в составе слова. Сначала испытуемые видели точку фиксации, за ней следовало слово или отдельная буква, которые предъявлялись всего на несколько миллисекунд. Затем предъявлялся стимул, содержащий маскирующие знаки на том месте, где находились буквы, и два варианта ответа. Испытуемым надо было решить, какой из двух вариантов слова или буквы предъявлялся ранее (по: Reicher, 1969).
Чтобы объяснить этот результат, в вышеописанную сеть со связями между признаками и буквами надо внести несколько изменений. Во-первых, в нее надо добавить уровень слов и помимо этого добавить возбуждающие и тормозные связи от букв к словам (рис. 5.16).
Рис. 5.16. Сеть с активацией «сверху вниз».
В этой сети между буквами и словами, а также между признаками и буквами имеются возбуждающие и тормозные связи, и некоторые возбуждающие связи идут от слов к буквам.
Кроме того, надо добавить возбуждающие связи, идущие от слов обратно к буквам; эти последние будут обеспечивать обратную связь «сверху вниз», и тогда можно будет объяснить, почему при кратковременном предъявлении буква легче воспринимается в составе слова, чем когда она предъявляется отдельно. Если, например, буква Rпредъявляется отдельно, активируются ее признаки — вертикальная линия, левая диагональ и кривая, выгнутая вправо, — и эта активация распространяется к узлу буквы R. Поскольку буква предъявлялась на очень короткое время, не все признаки могли успеть активироваться и результирующая активация узла буквы Rмогла оказаться недостаточной для опознания. Если же буква Rпредъявляется в составе слова «RED» (красный), то помимо активации, идущей от признаков Rк буквенному узлу R, имеет место активация от признаков Е и Dк буквенным узлам; все эти частично активированные буквы частично активируют узел слова RED, который в свою очередь по обратным связям активирует свои буквы, используя соединения «сверху вниз».
Все это приводит к тому, что когда буква Rпредъявляется в составе слова, у нее возникает дополнительный источник активации, а именно сигнал, поступающий вниз от слова; вот почему букву, предъявленную в составе слова, распознать легче, чем предъявленную отдельно. На материале слов и букв были получены и многие другие результаты, согласующиеся с многосвязной моделью (McClelland& Rumelhart, 1981).
Такие модели также успешно используются в устройствах для чтения рукописного текста и распознавания речи (Coren, Ward& Enns, 1999).
Распознавание естественных объектов и обработка по принципу «сверху вниз»
Мы кое-что узнали о распознавании букв и слов, а как насчет естественных объектов — животных, растений, людей, одежды и мебели?
Признаки естественных объектов.
Форма естественных объектов состоит из более сложных признаков, чем линии и кривые, и скорее напоминает простые геометрические фигуры. Эти признаки таковы, что их комбинация позволяет создать форму любого узнаваемого объекта (так же как сочетанием линий и кривых можно получить любую букву). Кроме того, надо, чтобы признаки объектов были составлены из более простых признаков — линий и кривых, поскольку простые признаки — это единственная информация, изначально имеющаяся у перцептивной системы. Такие соображения направляли поиски возможного набора признаков предметной среды.
Одно из предположений заключалось в том, что в состав признаков объектов входят некоторые геометрические фигуры, например цилиндры, конусы, параллелепипеды и клиновидные фигуры, как показано на рис. 5.17а. Такие признаки называют геонами (неологизм от «геометрические ионы»); их разработал Бидерман (Biederman, 1987). Бидерман считает, что набора из 36 геонов, аналогичных показанным на рис. 5.17а, в сочетании с небольшим набором пространственных отношений будет достаточно для описания формы всех объектов, которые человек способен опознать. Чтобы оценить этот момент, заметьте, что всего из двух геонов можно составить 36x36 различных объектов (сформировать объект можно из любых двух геонов — см. рис. 5.17б), а из трех геонов — 36x36x36 объектов. Эти два числа дают в сумме уже около 30 000, а еще надо учесть возможные объекты из четырех и более геонов. Кроме того, геоны, показанные на рис. 5.17а, различаются только своими простейшими признаками. Например, геон 2 на рис. 5.17а, куб, отличается от геона 3, цилиндра, тем, что у куба прямые края, а у цилиндра — изогнутые; прямые и изогнутые линии являются простыми признаками.
Рис. 5.17. Возможный набор признаков (геонов) естественных объектов.
а) Клин, куб, цилиндр и конус могут быть признаками сложных объектов. б) Из комбинации признаков (геонов) получаются естественные объекты. Заметьте, что если дугу (геон 5) присоединить к цилиндру (геон 3), получается чашка; если же дугу присоединить к верху цилиндра, получится ведро (по: Biederman, 1990).
То, что геоны являются признаками объектов, подтвердилось в экспериментах, в которых испытуемым предлагалось распознать нарисованные объекты, предъявляемые на короткое время. Общий результат был таков, что объект распознается настолько хорошо, насколько хорошо воспринимаются его геоны. В одном эксперименте стиралась часть формы объекта; в одном случае стирание мешало восстановлению геонов (правая колонка на рис. 5.18), в другом — не мешало (средняя колонка на рис. 5.18). Объекты распознавались намного лучше, когда стирание не интерферировало с геонами.
Рис. 5.18. Распознавание объектов и восстановление геонов.
Элементы, использовавшиеся в эксперименте по распознаванию объектов. В левой колонке показаны исходные интактные варианты объектов. В средней колонке показаны варианты объектов, у которых некоторые участки стерты, но восстановить геоны все же можно. В правой колонке — варианты объектов, где участки стерты так, что геоны невосстановимы. Варианты объектов из средней колонки распознавались лучше, чем из правой (по: Biederman, 1987).
Обычно в описание объекта входят не только его признаки, но и отношения между ними. Это хорошо видно из рис. 5.17б. Если дуга присоединена сбоку цилиндра, получается чашка; если же она подсоединена сверху цилиндра, получается ведро. После того как описание формы объекта составлено, оно сравнивается с массивом геонных описаний, хранящихся в памяти, с тем чтобы найти наилучшее соответствие. Такое сопоставление описаний формы объектов с описаниями, хранящимися в памяти, похоже на ранее упоминавшийся процесс распознавания букв и слов (Hummel& Biederman, 1992).
Роль контекста.
В восприятии есть принципиальное различие между процессами обработки, протекающими или снизу вверх, или сверху вниз. Процессы «снизу вверх» управляются только входными сигналами, а процессы «сверху вниз» — знаниями и ожиданиями человека. Для иллюстрации скажем, что когда на основе только геонного описания объекта последний узнается как лампа, то здесь участвуют только процессы «снизу вверх»; все начинается с появления на входе простых признаков этого объекта, далее определяется геонная конфигурация входных данных, и затем это описание входа сравнивается с хранящимися в памяти описаниями форм. Наоборот, если мы узнаем в некотором объекте лампу отчасти потому, что она находится на ночном столике рядом с кроватью, то в этом участвуют некоторые процессы «сверху вниз»; здесь привлекается не только та информация, которая поступила на сенсорный вход. Хотя до сих пор мы в этой главе обсуждали в основном процессы типа «снизу вверх», процессы «сверху вниз» также играют важную роль в восприятии.
Именно принцип обработки «сверху вниз» стоит за сильным влиянием контекста на наше восприятие предметов и людей. Если вы ожидаете, что ваша сотрудница Сара во вторник появится в химической лаборатории, как всегда, в 15:00, то когда она в указанный момент входит в лабораторию, вам даже не обязательно смотреть, чтобы знать, что это она. Ваше прежнее знание обусловило сильное ожидание, и для распознания достаточно очень слабого входного сигнала. Но если бы Сара вдруг появилась в вашем родном городе на рождественские каникулы, возможно, вам в первый момент даже было бы трудно ее узнать. Она оказалась бы вне контекста — нарушила бы ваши ожидания, и вам пришлось бы прибегнуть к обширной обработке «снизу вверх», чтобы сказать, что это на самом деле она (такие вещи обычно ощущаются как бы «со второй попытки»). Из этого примера ясно видно, что при соответствующем контексте (т. е. когда он предвосхищает объект на входе), восприятие облегчается; при несоответствующем контексте восприятие затрудняется.
Влияние контекста особенно примечательно, когда стимульный объект неоднозначен, т. е. когда он может восприниматься по-разному. Пример двойственного изображения показан на рис. 5.19; его можно воспринимать как старуху или как молодую женщину (хотя в первый момент с большей вероятностью видна старуха). Если вы уже смотрели на обычные картинки, напоминающие молодую женщину на рис. 5.19 (т. е. если контекст составляют молодые женщины), то на этой двойственной картинке вы скорее всего увидите вначале молодую женщину.
Рис. 5.19. Двойственный стимул.
На этом неоднозначном рисунке можно видеть или молодую женщину, или старуху. Большинство видит сначала старуху. Молодая женщина отвернулась, и видна левая часть ее лица. Ее подбородок образует нос старухи, а цепочка у нее на шее — рот старухи (по: Boring, 1930).
Этот эффект временного контекста виден на другом наборе изображений на рис. 5.20. Смотрите на них, как при чтении рассказа в картинках — слева направо и сверху вниз. Картинки в середине этой последовательности неоднозначны. Если вы смотрели на эти изображения в предложенной последовательности, то скорее всего видели в них мужское лицо. Если вы посмотрите на них в обратном порядке, то в двойственных картинках скорее всего увидите молодую женщину.
Рис. 5.20. Эффект временного контекста.
То, что вы здесь увидите, зависит от порядка рассматривания картинок. Картинки в середине ряда — двойственные. Если вы вначале смотрите на картинку с мужским лицом, они будут казаться вам искаженными мужскими лицами. Если вы вначале смотрите на картинку с женщиной, они будут походить на женщину (по: Fisher, 1967).
Чтобы показать влияние контекста, стимульный объект не обязательно должен быть двойственным. Представьте, что человеку сначала показывают изображение какой-либо сцены, а затем на короткое время предъявляют для распознавания изображение однозначного объекта; в этом случае распознавание будет более точным, если этот объект соответствует сцене. Например, посмотрев на сцену кухни, испытуемый более часто дает верную идентификацию быстро предъявленного изображения буханки хлеба, чем такого же по времени изображения почтового ящика (Palmer, 1975).
Благодаря обработке по принципу «сверху вниз» мотивы и желания потенциально могут влиять на восприятие. При сильном чувстве голода, быстро взглянув на красный шарик на кухонном столе, можно распознать в нем помидор. Желание есть заставляет думать о еде, и эти ожидания комбинируются с входной информацией (красный круглый предмет), создавая в результате перцепт помидора. Возможно и отрицательное влияние мотивов на восприятие. Так мы покупаем еду в супермаркете – будучи голодными набираем много лишнего. Если мы считаем, например, что некто — соблазнитель, мы более вероятно расценим его невинное прикосновение как сексуальное.если же мы внутренне желаем быть соблазненными, то припишем человеку свойства, которых нет в его контексте.
Влияние контекста и обработка по принципу «сверху вниз» имеют место и в распознавании букв и слов, играя важную роль при чтении. Читая, мы не отслеживаем строчку текста плавным непрерывным движением. На самом деле глаза совсем недолго задерживаются на месте, а затем перепрыгивают в другую позицию на строчке, снова ненадолго останавливаются, затем снова прыгают и т. д. Периоды, в течение которых глаза остаются в покое, называются фиксациями, и именно во время фиксаций зрительная система извлекает информацию. На количество и длительность фиксаций очень сильно влияет то, что известно о данном тексте, и, следовательно, объем привлекаемой обработки «сверху вниз». Если материал незнакомый — скажем, незнакомый научный текст, — объем обработки «сверху вниз» минимален. В таких случаях мы останавливаемся на каждом слове, за исключением некоторых функциональных слов вроде «и», «о», «тот» и т. п. По мере ознакомления с материалом становится возможным привлекать полученное знание для обработки по принципу «сверху вниз», и тогда зрительные фиксации становятся реже и короче (Just & Carpenter, 1980; Rayner, 1978).
Процессы типа «сверху вниз» и недостаточность входного сигнала. Обработка по принципу «сверху вниз» происходит даже при отсутствии контекста, если входной сигнал очень скудный или ослаблен. Предположим, что, находясь у подружки в квартире, вы в темноте заходите на кухню и видите в углу небольшой черный предмет. Вы думаете, что это, наверное, ее кот, но воспринимаемый сигнал слишком слаб, чтобы быть уверенным, и тогда вы начинаете представлять какой-нибудь конкретный признак кота— скажем, его хвост — и затем избирательно направляете внимание на тот участок предмета, где этот признак может скорее всего быть, если это действительно кот (Kosslyn & Koenig, 1992). Это — процесс обработки по принципу «сверху вниз», поскольку вы использовали определенное конкретное знание (что у кота есть хвост), чтобы сгенерировать ожидание, которое затем комбинируется со зрительным входным сигналом. Подобные ситуации довольно обычны для повседневной жизни. Иногда, если входной сигнал очень слабый, формируемые ожидания могут оказаться несостоятельными, скажем, когда вы наконец разберетесь, что этот якобы кот на кухне — на самом деле сумочка вашей подружки.
В жизни для целей адекватного распознавания нужно тренировать себя в способности осуществлять его при минимальных стимулах. Нужно насыщаться специфическим контекстом, скажем, психологическим. Проводить быстрое распознавание в условиях исчезающей очевидности процессов и явлений или событий. Нужно быстро и адекватно распознать человека, его психотип, его намерения. Проводить эффективное распознавание сверху вниз. В подсознании, в долговременной памяти должен быть заложен достаточный материал для того, чтобы входные сигналы, при их слабости все же восстанавливали некий контекст и затем находили либо опровергали следующие признаки. Чтобы вы смогли и активационные и тормозящие связи оценить как можно ближе к актуальным свойствам человека. Это и называется, читать человека, как открытую книгу, быстро фиксируясь на необходимых моментах фиксации. И эта книга должна быть для вас все более знакомой.
Нарушения процесса распознавания
Распознавание объектов обычно осуществляется автоматически и без усилий с нашей стороны, так что мы относимся к этому процессу как к чему-то само собой разумеющемуся. Однако иногда процесс распознавания дает сбои в тех случаях, когда люди страдают от повреждений мозга (вызванных несчастными случаями или такими болезнями, как сердечные удары). Агнозия — общий термин для обозначения нарушений или расстройств процесса распознавания.
Особый интерес представляет тип агнозии, называемый ассоциативной агнозией. Это синдром, при котором пациенты, страдающие от повреждений теменных долей коры, испытывают трудности при распознавании объектов только в тех случаях, когда эти объекты представлены визуально. Например, пациент может быть не в состоянии сказать, как называется расческа, если ему показать ее изображение, но может сделать это, если ему дать ее потрогать. Примером данного нарушения является следующий случай:
«На протяжении первых трех недель, проведенных в больнице, пациент не мог идентифицировать самые обычные предметы, предъявляемые ему визуально, и не мог определить, какая еда находится в его тарелке, пока он ее не попробует. Он мог сразу распознать объекты, когда трогал их, но когда ему показывали стетоскоп, он описывал его как «длинный шнур с круглым предметом на конце» и спрашивал, может ли это быть часами. Когда ему показали открывашку для бутылок, он ответил: «Возможно, это ключ». Когда его попросили назвать зажигалку, он ответил: «Не знаю». Он сказал, что он «не уверен», когда ему показали зубную щетку. При виде расчески он также сказал: «Не знаю». При предъявлении курительной трубки он ответил: «Какой-то прибор, я не уверен». Когда ему показали ключ, он сказал «Я не знаю, что это; может быть, напильник или какой-то инструмент»» (Reubens& Benson, 1971).
Какие же аспекты распознавания нарушаются при ассоциативной агнозии? Поскольку страдающие этим нарушением пациенты часто хорошо справляются с другими визуальными заданиями, не требующими распознавания, — например, нарисовать предмет или сказать, совпадают ли друг с другом два изображения, — нарушение вряд ли происходит на поздних стадиях распознавания, во время которых стимульный объект сопоставляется с хранящимися в памяти описаниями объектов. Возможно, хранящиеся в памяти описания объектов каким-то образом утрачиваются или блокируются (Damasko, 1985).
Некоторые пациенты, страдающие ассоциативной агнозией, испытывают проблемы с распознаванием только определенных категорий, а не любых объектов. Эти категориально-специфические нарушения представляют значительный интерес, поскольку, изучая их, мы можем узнать нечто новое о том, как функционирует процесс распознавания. Наиболее распространенным категориально-специфическим нарушением является утрата способности к распознаванию лиц, называемая прозопагнозией. (Мы кратко касались этой проблемы в гл. 1.) Во всех случаях, когда происходит такое нарушение, имеет место повреждение правого полушария, а нередко также и повреждения гомологичных зон левого полушария. Примером данного нарушения является следующий случай.
«Он не мог узнать присматривающих за ним врачей и сестер. «Вы, должно быть, доктор, потому что у вас белый халат, но как вас зовут, я не помню. Если вы заговорите, я вас узнаю». Он не узнавал свою жену, приходящую в приемные часы.... не узнавал на фотографиях Черчилля, Гитлера и Мерилин Монро. Увидев такой портрет он начинал анализировать его дедуктивно, пытаясь найти «критические» признаки, которые помогли бы ему дать правильный ответ» (Pallis, 1955).
Ко второму типу категориальных нарушений относится утрата способности распознавать слова, называемая чистой алексией (как правило, сопровождающаяся повреждениями левой затылочной доли). Пациенты, страдающие этим нарушением, обычно не испытывают трудностей с узнаванием природных объектов и лиц. Они даже могут распознавать отдельные буквы. Однако эти пациенты оказываются не в состоянии распознавать зрительно предъявляемые слова. Увидев слово, они пытаются прочитать его по буквам. Распознавание самых распространенных слов может занимать у них до 10 секунд, при этом время распознавания растет с увеличением числа букв в слове (Bub, Blacks& Howell, 1989).
Другие типы категориально-специфических нарушений включают проблемы с узнаванием живых существ — таких как животные, растения и пищевые продукты. В редких случаях пациенты оказываются неспособными распознавать и неодушевленные предметы, как, например, хозяйственные инструменты (Warrington& Shallice, 1984).
Некоторые предположения, выдвигаемые с целью объяснения категориально-специфических нарушений, касаются и распознавания объектов в норме. Одна из таких гипотез состоит в том, что нормальная организация системы распознавания базируется на различных классах объектов: одна подсистема служит для распознавания лиц, другая — для слов, третья — для животных, и так далее, и что эти подсистемы локализованы в различных участках мозга. Если пациент получил лишь местное повреждение мозга, у него может проявляться потеря памяти, относящаяся только к одной подсистеме, но не к другим. Так, повреждения специфических участков правого полушария могут приводить к нарушениям в работе подсистемы, ответственной за узнавание лиц, при этом функционирование других подсистем остается незатронутым (Damacio, 1990; Farah, 1990).
|