Свойства восприятия — СтудИзба
3. Свойства восприятия: предметность, целостность, константность, структурность, осмысленность, избирательность
Говоря о свойствах восприятия, необходимо выделить среди них две группы: свойства, характеризующие продуктивность восприятия как психического познавательного процесса, и свойства, присущие в той или иной степени всем познавательным процессам и характеризующие сущность процесса восприятия. К первой группе относятся показатели производительности, качества и надежности перцептивной системы:
Объем восприятия — количество объектов, которое может воспринять человек в течение одной фиксации.
Точность восприятия — соответствие возникшего образа особенностям воспринимаемого объекта.
Полнота восприятия — степень соответствия возникшего образа особенностям воспринимаемого объекта.
Быстрота восприятия — время, необходимое для адекватного восприятия предмета или явления.
Среди основных “сущностных” свойств восприятия выделяются:
Константность восприятия — свойство воспринимать объекты и видеть их относительно постоянными по величине, форме и цвету в изменяющихся физических условиях восприятия.
Осмысленность восприятия — свойство человеческого восприятия приписывать воспринимаемому объекту или явлению определенный смысл, обозначать его словом, относить к определенной языковой категории в соответствии со знанием субъекта и его прошлым опытом.
Рекомендуемые файлы
Структурность восприятия — свойство восприятия человека объединять воздействующие стимулы в целостные и сравнительно простые структуры.
Целостность восприятия — сенсорная, мысленная достройка совокупности некоторых воспринимаемых элементов объекта до его целостного образа.
Предметность восприятия — отнесенность наглядного образа восприятия к определенным предметам внешнего мира.
Обобщенность восприятия — отражение единичных объектов как особого проявления общего, представляющего определенный класс объектов, однородных с данным по какому-либо признаку.
Избирательность восприятия — преимущественное выделение одних объектов по сравнению с другими, раскрывающее активность человеческого восприятия.
Остановимся более подробно на некоторых основных свойствах восприятия.
ПРЕДМЕТНОСТЬ ВОСПРИЯТИЯ. Выражается в так называемом акте объективации. Объективация — процесс и результат локализации образов восприятия во внешнем мире — там, где располагается источник воспринимаемой информации, т.е. отнесение сведений, получаемых из внешнего мира, к этому миру. Без такого отнесения восприятие не может выполнять свою ориентирующую и регулирующую функцию в практической деятельности человека. Предметность восприятия не врожденное качество: существует определенная система действий, которая обеспечивает субъекту открытие предметности мира. Решающую роль здесь играет осязание и движение. И. М. Сеченов подчеркивал, что предметность формируется на основе процессов, в конечном счете, всегда внешне двигательных, обеспечивающих контакт с самим предметом. Без участия движения наши восприятия не обладали бы качеством предметности, т. е. отнесенностью к объектам внешнего мира.
Предметность как качество восприятия играет особую роль в регуляции поведения. Мы обычно определяем предметы не по их виду, а в соответствии с тем, как мы их употребляем на практике или по их основным свойствам. И этому помогает предметность восприятия. Так, кирпич и блок взрывчатки могут выглядеть и восприниматься на ощупь как очень сходные, однако они будут “вести себя” самым различным образом.
Предметность играет большую роль и в дальнейшем формировании самих перцептивных процессов, т. е. процессов восприятия. Когда возникает расхождение между внешним миром и его отражением, субъект вынужден искать новые способы восприятия, обеспечивающие более правильное отражение.
ЦЕЛОСТНОСТЬ ВОСПРИЯТИЯ. Другая особенность восприятия — его целостность. В отличие от ощущения, отражающего отдельные свойства предмета, воздействующего на орган чувств, восприятие есть целостный образ предмета. Разумеется, этот целостный образ складывается на основе обобщения знаний об отдельных свойствах и качествах предмета, получаемых в виде различных ощущений.
При анализе целостности восприятия можно выделить два взаимосвязанных аспекта:
— тенденция к заполнению пробелов и объединение разных элементов в целое;
— независимость образованной целостности (в определенных границах, разумеется) от качества элементов. При этом восприятие целого влияет и на восприятие частей.
Указанные тенденции, характеризующие закономерности восприятия, были в свое время наиболее полно описаны представителями гештальтпсихологии. Среди основных закономерностей ими были, в частности, выделены:
1. Закон фигуры и фона — закон гештальтпсихологии, суть которого в том, что человек воспринимает фигуру как замкнутое целое, расположенное впереди фона, фон же кажется непрерывно простирающимся позади фигуры.
2. Закон транспозиции — закон гештальтпсихологии, суть которого заключается в том, что психика реагирует не на отдельные раздражители, а на их соотношение.
3. Закон константности (от лат. constans — постоянный) — один из законов гештальтпсихологии, суть которого заключается в том, что образ вещи стремится к постоянству, неизменности даже при изменении условий восприятия.
4. Закон близости — один из законов гештальтпсихологии, суть которого заключается в тенденции к объединению в целостный образ элементов, смежных во времени и пространстве.
5. Закон замыкания — один из законов гештальтпсихологии, суть которого заключается в тенденции к заполнению пробелов в воспринимаемой фигуре.
Принцип заполнения пробелов проявляется в том, что наш мозг всегда старается свести фрагментарное изображение в фигуру с простым и полным контуром. Поэтому, когда предмет, образ, мелодия, слово или фраза представлены лишь разрозненными элементами, мозг будет систематически пытаться собрать их воедино и добавить недостающие части. На рис. 1 (А) вы видите не группу отдельных линий, а контуры лица. А когда по радио вдруг прерывается исполнение известной песни или рекламное объявление, слышанное тысячу раз, наш мозг машинально восстанавливает недостающее.
Объединение (группировка) элементов — это еще один аспект организации восприятия. Элементы могут объединяться по разным признакам, например таким, как близость, сходство (подобие), непрерывность (воображаемая) или симметрия.
Так, по принципу близости наш мозг объединяет близкие или смежные элементы в единую форму. В любом поле, содержащем несколько объектов, те из них, которые расположены наиболее близко друг к другу, визуально могут восприниматься целостно, как один объект. На рис. 1 (Б) легче воспринять три группы квадратиков, чем девять квадратиков, не связанных друг с другом.
Принцип сходства состоит в том, что нам легче объединять схожие элементы. В качестве группирующихся свойств может выступать сходство по размеру, форме, по расположению частей. В единую целостную структуру объединяются также элементы с так называемой хорошей формой, т.е. обладающие симметрией или периодичностью. На рисунке 1 (В) цифры предстают перед нами скорее в форме столбиков, чем в форме строк. Что касается продолжения беседы в общем шуме голосов, то оно возможно только благодаря тому, что мы слышим слова, произносимые одним и тем же голосом и тоном.
Элементы будут также организовываться в единую форму, если они сохраняют одно направление. Это принцип непрерывности. На рисунке 1 (Г) слева мы воспринимаем плоский элемент, пересекающий прямоугольник, а не три несвязанных элемента вроде тех, что изображены рядом.
Рис. 1
Независимость целого от качества составляющих его элементов проявляется в доминировании единства структуры над ее составляющими. Выделяют три формы такого доминирования. Первая – выражается в том, что один и тот же элемент, будучи включенным в разные целостные структуры, воспринимается по-разному. Вторая – проявляется в том, что при замене отдельных элементов, но сохранении соотношения между ними общая структура остается неизменной. Как известно, можно изобразить профиль и штрихами, и пунктиром, и с помощью других элементов, сохраняя портретное сходство. И, наконец, третья форма получает свое выражение в хорошо известных фактах сохранения восприятия структуры как целого при выпадении отдельных ее частей. Так, для целостного восприятия человеческого лица (рис. 1, А) достаточно лишь нескольких элементов его контура. В этом смысле целостность есть индифферентность образа по отношению к замене составляющих его элементов, то есть может рассматриваться как структурная константность.
С целостностью восприятия связана его СТРУКТУРНОСТЬ. Восприятие в значительной мере не отвечает нашим мгновенным ощущениям и не является простой их суммой. Мы воспринимаем фактически абстрагированную из этих ощущений обобщенную структуру, которая формируется в течение некоторого времени. Если человек слушает какую-нибудь мелодию, то услышанные ранее ноты продолжают еще звучать у него в уме, когда поступает новая нота. Обычно слушающий понимает музыкальную вещь, т. е. воспринимает ее структуру в целом. Очевидно, что самая последняя из услышанных нот в отдельности не может быть основой для такого понимания: в уме слушающего продолжает звучать вся структура мелодии с разнообразными взаимосвязями входящих в нее элементов.
Аналогичный процесс наблюдается при восприятии ритма. В каждый момент можно услышать всего один удар, однако, ритм — это не одиночные удары, а продолжительное звучание всей системы ударов, причем удары находятся в определенной взаимосвязи между собой, и эта взаимосвязь определяет восприятие ритма.
Источники целостности и структурности восприятия лежат в особенностях самих отражаемых объектов, с одной стороны, и в предметной деятельности человека — с другой. И.М. Сеченов подчеркивал, что целостность и структурность восприятия — результат рефлекторной деятельности анализаторов.
КОНСТАНТНОСТЬ ВОСПРИЯТИЯ. Сигналы, поступающие от окружающих нас предметов, непрерывно меняются. При этом соответственно изменяются и перцептивные процессы. Однако благодаря свойству константности, состоящему в способности перцептивной системы компенсировать эти изменения, мы воспринимаем окружающие предметы как относительно постоянные по форме, величине, цвету и т. п. Перцептивная система — совокупность анализаторов, обеспечивающих данный акт восприятия.
Значение константности очень велико. Не будь этого свойства, при каждом нашем движении, при каждом изменении расстояния до предмета, при малейшем повороте головы или перемене освещения практически непрерывно изменялись бы и все основные признаки, по которым человек узнает мир. Мир перестал бы быть миром устойчивых вещей, и восприятие не могло бы служить средством познания объективной действительности.
Поясним это свойство восприятия на примере константности величины. Известно, что изображение предмета (в том числе и изображение его на сетчатке) увеличивается, когда расстояние до него сокращается, и наоборот. Однако, хотя при изменении дистанции наблюдения величина изображения объекта на сетчатке глаза изменяется, его воспринимаемая величина остается почти неизменной. Посмотрите на зрителей в театре: все лица кажутся нам почти одинаковыми по величине, несмотря на то, что изображения лиц, находящихся вдалеке, значительно меньше, чем расположенных близко от нас. Если мы, например, смотрим на свои руки, причем левая находится в 20 см от лица, а правая протянута далеко вперед, то нам все-таки кажется, что их кисти одинакового размера. В то же время изображение пальцев дальней руки на сетчатке глаза будет составлять только половину величины изображения пальцев ближней руки.
Каков же источник происхождения константности восприятия? Является ли этот механизм врожденным? Для проверки было проведено исследование восприятия людей, постоянно живущих в густом лесу. Восприятие этих людей представляет интерес, поскольку они не видели ранее предметов на большом расстоянии. Когда этим людям показали объекты, находящиеся на большом расстоянии от них, они восприняли эти объекты не как удаленные, а как маленькие. Подобные нарушения константности восприятия наблюдаются у жителей равнин, когда они смотрят вниз с высоты. Из окна верхнего этажа высотного дома объекты (люди, автомобили) также кажутся нам слишком маленькими. В то же время строители, работающие на лесах, сообщают, что они видят объекты, расположенные внизу, без искажения их размеров.
Наконец, еще один пример, свидетельствующий против тезиса о врожденности механизма константности восприятия — наблюдения над ослепшим в детстве человеком, у которого зрение было восстановлено операционным путем в зрелые годы. Вскоре после операции больной думал, что может выпрыгнуть из окна больницы на землю, не причинив себе вреда, хотя окно находилось на высоте 10 — 12 метров от земли. Очевидно, объекты, находящиеся внизу, воспринимались им не как удаленные, а как маленькие, что и вызвало ошибку при оценке высоты.
Действительным источником константности восприятия являются активные действия перцептивной системы. Из разнообразного и изменчивого потока движений рецепторных аппаратов и ответных ощущений субъект выделяет относительно постоянную, инвариантную структуру воспринимаемого объекта. Многократное восприятие одних и тех же объектов при разных условиях обеспечивает инвариантность перцептивного образа относительно этих изменчивых условий, а также движений самого рецепторного аппарата, следовательно, порождает константность этого образа. При этом вариации, вызванные изменением условий восприятия и активными движениями органов чувств наблюдателя, сами по себе сколько-нибудь не ощущаются; воспринимается лишь нечто относительно инвариантное, например форма какого-либо предмета, его размеры и т. п.
Способность нашей перцептивной системы корректировать (исправлять) неизбежные ошибки, вызванные бесконечным многообразием условий существования окружающего мира вещей, и создавать адекватные образы восприятия хорошо иллюстрируется опытами с очками, искажающими зрительное восприятие путем переворачивания изображений, искривления прямых линий и т.п. Когда человек надевает очки, искажающие предметы, и попадает в незнакомое помещение, он постепенно приучается корректировать искажения, вызванные очками, и, наконец, перестает замечать эти искажения, хотя они отражаются на сетчатке глаза.
Таким образом, свойство константности объясняется тем, что восприятие представляет собой своеобразное саморегулирующееся действие, обладающее механизмом обратной связи и подстраивающееся к особенностям воспринимаемого объекта и условиям его существования. Формирующаяся в процессе предметной деятельности константность восприятия — необходимое условие жизни и деятельности человека. Без этого человек не смог бы ориентироваться в бесконечно многообразном и изменчивом мире. Свойство константности обеспечивает относительную стабильность окружающего мира, отражая единство предмета и условий его существования.
ОСМЫСЛЕННОСТЬ ВОСПРИЯТИЯ. Хотя восприятие возникает в результате непосредственного воздействия раздражителя на рецепторы, перцептивные образы всегда имеют определенное смысловое значение. Восприятие у человека теснейшим образом связано с мышлением, с пониманием сущности предмета. Сознательно воспринять предмет — это значит мысленно назвать его, т.е. отнести воспринятый предмет к определенной группе, классу предметов, обобщить его в слове.
Даже при виде незнакомого предмета мы пытаемся уловить в нем сходство со знакомыми нам объектами, отнести его к некоторой категории. Восприятие не определяется просто набором раздражителей, воздействующих на органы чувств, а представляет динамический поиск наилучшего толкования, объяснения имеющихся данных. Показательны с этой точки зрения так называемые двусмысленные рисунки, в которых попеременно воспринимаются то фигура, то фон (см. рис. 2). На этом рисунке выделение объекта восприятия связано с его осмысливанием и называнием (два профиля и ваза). Фон может быть либо черным, либо белым. Это зависит от того, что человек воспринимает — вазу или два профиля. Фигура и фон взаимозаменяемы: фигура может превратиться в фон, а фон — в фигуру.
Любой образ или предмет воспринимается как фигура, выделяющаяся на каком-то фоне. Чередование фигуры и фона свидетельствует о том, что восприятие (зрительное) не выводится просто из паттернов возбуждения на сетчатке. Необходим еще какой-то тонкий процесс переработки (интерпретации) даже на таком элементарном уровне. Феномен чередования связан с именем датского психолога Эдгара Рубина. Он разработал простые, но остроумные штриховые рисунки, изображающие пару форм, разграниченных одной и той же линией. При этом происходит соперничество этих форм. Каждая из них поочередно “уходит” в фон, перестает восприниматься.
То, что человек воспринимает в данный момент, зависит от того, что вносится в этот процесс прошлым опытом, а также от того, чего он хочет в данный момент. Особенно заметна эта закономерность в процессе восприятия человеческого лица. Огромную роль играет внутренний шаблон, а также эмоциональное отношение к воспринимаемому: чем эмоционально ближе наблюдаемый человек, тем большие искажения в его облике корректируются воспринимающим.
Наш мозг действительно имеет тенденцию (по-видимому, врожденную) структурировать сигналы таким образом, что все, что меньше или имеет более правильную конфигурацию, а главное то, что имеет для нас какой-то смысл, воспринимается как фигура; она выступает на некотором фоне, а сам фон воспринимается гораздо менее структурированным.
Это относится, прежде всего, к зрению, но также и к другим чувствам. Так же обстоит дело, когда в общем шуме собрания кто-то произносит нашу фамилию. Она сразу выступает как “фигура” на звуковом фоне. Такое же явление мы наблюдаем, когда улавливаем запах розы, находясь среди группы курильщиков, или запах сигареты у клумбы с розами.
Однако вся картина восприятия перестраивается, как только другой элемент фона становится в свою очередь значимым. Тогда то, что за секунду до этого виделось как фигура, теряет свою ясность и смешивается с общим фоном.
ОБОБЩЕННОСТЬ ВОСПРИЯТИЯ тесно связана с личным опытом человека. По мере расширения личного опыта восприятия образ, сохраняя свою индивидуальность и отнесенность к предметному объекту, причисляется ко все большей совокупности предметов определенной категории, то есть все более надежно классифицируется. Для этого необходимо обобщение, обращение к хранящемуся в памяти классу сходных объектов, что означает переход от наличной ситуации к другой; к постижению реальности через призму индивидуально закрепленного образа мира, лично обобщенной схемы действительности.
Восприятие – это одновременно и упрощение воспринимаемой действительности, фиксация наблюдаемых признаков с точки зрения их значимости для человека, сведение этих признаков в устойчивые комплексы и классификация на их основе различных объектов окружающего мира. Обобщенность и классификация обеспечивают надежность правильного узнавания объекта независимо от его индивидуальных особенностей и искажений, не выводящих объект за пределы класса. Значение обобщенности проявляется в надежности узнавания, например, в способности человека свободно читать текст независимо от шрифта или почерка, которым он написан. Следует отметить, что обобщенность восприятия позволяет не только классифицировать и узнавать предметы и явления, но и предсказывать некоторые свойства, непосредственно не воспринимаемые.
В этом смысле интересен такой пример. Один из критиков Платона заметил как-то: “Я вижу лошадей, а не лошадность”. На что Платон ответил: “Это оттого, что у тебя есть глаза, но нет ума”. Возникает вопрос: о какой “лошадности” идет речь, и кто прав? Разумеется, Платону представлялось очевидным, что если множество предметов обладает одним и тем же свойством — как все люди “человекостью” или все белые камни “белостью”, — то свойство это не ограничивается частным явлением в мире материи, пространства и времени. Оно нематериально, не поддается пространственно-временным ограничениям и трансцендентно по отношению к множеству отдельных своих проявлений. Прекратить свое существование может только та или иная вещь, но не это всеобщее свойство, которое эта вещь воплощает. Для Платона архетипическая лошадь, дающая вид всем лошадям, — реальность, более основополагающая, нежели реальность конкретных лошадей, которые суть не более, чем частные проявления идеи “лошадности”, конкретные воплощения ее формы.
Подводя предварительный итог, можно заключить, что восприятие — активный процесс, в ходе которого человек производит множество перцептивных действий для того, чтобы сформировать адекватный образ предмета. Активность восприятия состоит, прежде всего, в участии эффекторных (двигательных) компонентов анализаторов в процессе восприятия (движения руки при осязании, движения глаза в зрительном восприятии и т. п.). Кроме того, необходима и активность на макроуровне, т. е. возможность в процессе восприятия активно перемещать свое тело.
Вам также может быть полезна лекция «Концептуальные основы принятия управленческих решений».
Восприятие рассматривается как процесс, связанный с активным поиском признаков, необходимых и достаточных для формирования образа и принятия решений. Последовательность актов, включенных в этот процесс, можно представить себе следующим образом:
1) первичное выделение комплекса стимулов из потока информации и принятие решения о том, что они относятся к одному и тому же определенному объекту;
2) поиск в памяти аналогичного или близкого по составу ощущений комплекса признаков, сравнение с которым воспринятого позволяет судить о том, что это за объект;
3) отнесение воспринятого объекта к определенной категории с последующим поиском дополнительных признаков, подтверждающих или опровергающих правильность принятого гипотетического решения;
4) окончательный вывод о том, что это за объект, с приписыванием ему еще не воспринятых свойств, характерных для объектов одного с ним класса.
Между всеми перечисленными характеристиками восприятия есть некоторое функциональное сходство. И константность, и предметность, и целостность, и осмысленность, и обобщенность придают образу важную черту – независимость (в некоторых пределах) от условий восприятия и искажений. В этом смысле константность – это независимость от физических условий восприятия, предметность и осмысленность – от того фона, на котором объект воспринимается, целостность – независимость целого от искажения и замены компонентов, составляющих это целое, обобщенность – это независимость восприятия от таких искажений и изменений, которые не выводят объект за границы класса.
Назовите четыре свойства образов восприятия и конкретизируйте их пояснениями (сначала назовите свойство, затем приведите пояснение).
Ощущение — это отражение отдельных, элементарных свойств (признаков) предмета и явлений окружающего мира при их непосредственном воздействии в данный момент на органы чувств человека. В реальной жизни ощущения отдельно, сами по себе, как правило, не существуют: они входят в сложные процессы восприятия, лежат в основе представления, воображения. Но именно с них начинаются эти сложные психические процессы. Поэтому ощущения выделяют из психической деятельности человека, рассматривают и изучают как относительно самостоятельный простейший психический процесс.
Из разных ощущений складываются целостные психические образы, к ним относятся образы восприятия и образы представления. Восприятие — это наглядно-образное отражение действующих в данный момент на органы чувств вещей, предметов, а не отдельных их свойств и признаков. Образы восприятия обладают рядом важных свойств. Образ восприятия — это целостное, осознанное отражение познаваемого предмета или явления психики. В образе восприятия отражается объект познания, а не процессы, происходящие в нервной системе человека, которые приводят к созданию этого образа. Создаваемый у человека образ восприятия недоступен постороннему наблюдателю и имеет существенные различия у разных людей. Они зависят от особенностей человека, от его убеждений и установок, от его жизненного опыта и знаний, обученности и способностей, от его интересов и того смысла, который имеет для него познание данного предмета или явления; наконец, от его настроения в данный момент.
Образы представления — психические образы не воспринимаемых в данный момент предметов или явлений, которые основаны на прошлом их восприятии. Иными словами, образы представления — это образы памяти. Образы представления существенно отличаются от соответствующих им образов восприятия, на основе которых они возникли. Если образы восприятия — результат одномоментного процесса и при исчезновении предмета восприятия исчезает образ восприятия (он или забывается, или же переходит в образ представления), то образы представления сохраняются долгое время. При этом они не остаются неизменными: с течением времени они приобретают более абстрактный, обобщённый характер.
(Т.С. Назарова, Е.М. Тихомирова, И.Ю. Кудина и др.)
Общее определение восприятия. Основные свойства образов восприятия.
Общее определение восприятия.
Восприятие – это процесс порождения чувственных образов, возникающих при условии воздействия внешнего мира на органы чувств.
JДостоинства этого определения:
Восприятие – это процесс
Указывается продукт – чувственный образ
условие восприятия – наличие внешнего воздействия
LГлавный недостаток: это определение чересчур общё и расплывчато (до конца не понятно, что такое чувственный образ, воздействие и т.д.). См. ниже.
2. Феномены восприятия. Основные свойства перцептивного образа.
Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы.
ФЕНОМЕНЫ ВОСПРИЯТИЯ (по Оллпорту):
Сенсорное качество. Специфика ощущений зависит от устройства органа чувств. Свойства сенсорных качеств (по Титченеру):
Интенсивность
Протяженность во времени
Протяженность в пространстве
Конфигурация. Мы воспринимаем некую целостную структуру как фигуру на фоне. Свойства, отличающие восприятие фигуры и фона:
Фигура – субстанция, объект; фон – нечто аморфное, субстрат.
Фигура воспринимается выступающей перед фоном.
Контур воспринимается как граница фигуры, хотя на самом деле – граница у них общая.
Фигура воспринимается локализованной в пространстве.
Константность – это свойство перцептивного образа сохранять относительное постоянство своих характеристик при изменении условий восприятия. Пр.: какой палец длиннее? (по Леонтьеву)
Системы отсчета (субъективные шкалы). Человек способен непосредственно количественно оценивать свои ощущения. Пр.: показывают несколько дисков, различных по яркости; задача – определить какой из них яркий, какой тусклый, какой средний. Хотя эталона для оценки нет, человек может построить субъективное мнение о яркости.
Предметность
Наши образы реально соотносятся с реально существующими предметами.
Наши образы реально соотносятся со значениями (значение – это опыт в отношении этого объекта), присущим данным предметам.
6). Установка. Избирательность и пристрастность. Примеры: 1. Потеряли дорогую брошь, теперь ищем (избирательность). 2. Плита на кладбище – призрак! 3. Тест Роршаха. 4. Влияние установки в эксперименте «жена или тёща» и «пират и кролик» (по Липеру). 5. Влияние установочной инструкции на восприятие слов (одна группа воспринимает бессмысленные слова как названия птиц, другая – как транспорт).
Поможем написать любую работу на аналогичную тему
Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Узнать стоимостьОбщая психология. Общее понятие овосприятии. Основные свойства образов восприятия
Общее понятие о восприятии. Основные свойства образов восприятия.
Восприятие – отражение в сознании человека предметов, ситуаций и явлений, воздействующих на рецепторы органов чувств. Восприятие делает возможным целостное отражение мира, создание интегральной картины действительности. Восприятие как более сложный активный психический процесс, связанный с деятельностью человека, включает в себя ощущение и основывается на нем. Для восприятия достаточна только работа наших органов чувств.
Свойства восприятия:
- Константность – относительная постоянность образа, свойств предметов при изменении условий их восприятия. Человек воспринимает качества объектов (их величину, форму, цвет) относительно постоянными, вне зависимости от расстояния до воспринимаемого предмета, угла восприятия, степени освещенности и т.д. Если вытянуть одну руку, а вторую оставить на небольшом расстоянии от глаз, то ладони будут восприниматься как равные, несмотря на разницу в расстоянии до них.
- Предметность– способность отражать объекты не в виде набора отдельных ощущений, а виде определенных предметов. Предметность восприятия не является врожденным качеством, а формируется на основе двигательных процессов, обеспечивающих контакт с предметом. Человеку сложно охарактеризовать предмет без участия движений, без соотнесения его с тем, как он используется или какую функцию несет (его свойства).
- Целостность – внутренняя мысленная достройка некоторых частей объекта до целостного образа. Человек в состоянии завершать образ предмета до нужной формы, объединяя отдельные, разрозненные части объекта в знакомый ему образ. Например, мы достраиваем образ товара, находящегося в непрозрачной упаковке; читая книгу, мы воспринимаем не набор отдельных букв, а предложения, связанные в текст.
- Обобщенность – отнесение образа к некоторому определенному классу объектов, имеющих сходство по какому-либо признаку. Собирание предметов в классы, группы.
- Осмысленность – свойство приписывать объекту восприятия какой-либо смысл, обозначать его термином или понятием. Наиболее простой формой осмысливания предметов и явлений является узнавание. (Квази-пространство понятий)
- Активностьгештальт, не состыковки приводят к переделки
- Управляемостьзависит от мотивации субъекта
- Избирательная направленностьмы не можем воспринимать все сразу
Существует еще одна разновидность классификации, в которой выделяют три основных вида восприятия:
- Восприятие пространства включает в себя восприятие формы, величины предметов, их взаимного расположения, а также расстояния до предметов и между ними.
- Закон фигуры и фона. Воспринимаемые человеком предметы всегда осознаются им как некоторые фигуры, выделяющиеся на том или ином фоне.
- Принцип близости. Чем ближе друг к другу располагаются те или иные элементы, тем больше вероятность воспринять их как единый образ.
- Принцип схожести. Имеют тенденцию восприниматься вместе однородные стимулы, схожие по размеру, очертаниям, цвету или форме.
- Принцип замкнутости. Отражает тенденцию завершать фигуру, так что она приобретает полную форму.
- Восприятие движения позволяет отразить изменения в том положении, которое объекты занимают в пространстве. Направление движения оценивается по перемещению изображения объекта на сетчатке, а также исходя из того, каким образом работают мышцы глаз при наблюдении за движением объекта.
- Механизм восприятия времени часто связывают с так называемыми «биологическими часами» – определенной последовательностью биологических обменных процессов, происходящих в организме человека.
Субъективная продолжительность времени зависит от того, чем оно заполнено, и от эмоционального состояния человека. Обычно также несколько преувеличивается длительность небольших промежутков времени, а большие интервалы времени уменьшаются.
Исходным пунктом анализа максимально адекватных образов восприятия, заведомо относящихся к собственно перцептивной стороне сенсорно-перцептивной границы, как и при рассмотрении всех более элементарных процессов, является составление перечня их основных эмпирических характеристик. Из-за отсутствия единой теории перцептивных процессов свойства и параметры восприятия до недавнего времени исследовались в экспериментальной психологии под углом зрения самых разных теоретических и прикладных задач. Поэтому имеющийся в этой области обширный фактический материал очень фрагментарен и разрознен. Систематизировать этот материал и выделить в нём фундаментальные, определяющие характеристики очень трудно, так как нет чётких критериев отбора искомых основных феноменов и параметров. В контексте настоящего исследования образы восприятия, относящиеся к диапазону максимальной полноты и адекватности, рассматриваются как завершающий этап актуального генеза и онтогенеза сенсорно-перцептивных актов. Составление исходного перечня основных свойств и параметров образов, относящихся к этому диапазону, целесообразно произвести на основе сопоставления с характеристиками элементарных сенсорных образов, которые в силу их расположения у границы, разделяющей нервные и элементарные психические (сенсорные) процессы, обладают достаточной структурной определённостью. Такое сопоставление, опускающее все промежуточные формы, именно в силу расположения сравниваемых форм у противоположных краёв сенсорноперцептивного диапазона, обещает, по-видимому, выделение чётких критериев в различении структурных характеристик исходных сенсорных и собственно перцептивных форм первичных образов. Выше был приведён перечень основных эмпирических характеристик простейших психических процессов — ощущений (см. схему 4). Поскольку элементарные ощущения входят как компоненты в структуру интегральных перцептивных образов, описанные пространственно-временные, модальные и интенсивностные характеристики сохраняются в качестве базальных и в наборе основных свойств образов восприятия. Составляя перечень основных эмпирических характеристик перцептивного образа, нужно выяснить, какими характеристиками необходимо дополнить исходный перечень, чтобы получить набор свойств, достаточно полно описывающих перцептивные образы в диапазоне их максимальной адекватности объекту. Решение этого вопроса отчётливо разбивается на два этапа. Первый из них — необходимые уточнения и дополнения тех характеристик, которые уже содержатся в списке основных свойств ощущений. Второй — выяснение тех свойств и параметров, которые не входили в список основных характеристик ощущения, но, будучи исследованными именно в связи со спецификой перцептивных образов, должны быть введены в составляемый перечень на данном этапе анализа. Пространственно-временная структура восприятияПервой суммарной характеристикой ощущения, как было показано, является его пространственно-временная структура, которая, будучи наиболее общим свойством любого психического процесса, сохраняет своё исходное место и в настоящем перечне. На уровне ощущений эта структура включает в качестве своего корневого единого пространственно-временного компонента воспроизведение перемещения (изменения координаты объекта с течением времени). В её собственно пространственную ветку входит отображение стабильной координаты, расстояния и направления (проекция), а в её собственно временную ветку входит отображение одновременности, последовательности и длительности (см. схему 3). При анализе характеристик элементарного ощущения было показано, что адекватное воспроизведение меняющейся во времени и, в частном случае, стабильной координаты воспринимаемого объекта представляет собой инвариантное отображение его внешней метрики, то есть метрики того трёхмерного пространственного фона или поля, в котором данный объект занимает определённое положение. На уровне элементарного, лишь выступающего над порогом сенсорного сигнала его объект-источник представлен в адекватно воспроизведённом трёхмерном пространстве по существу как материальная точка, имеющая в этом поле в пределе одну общую координату. Тем самым на простейшем сенсорном уровне «пространственность» ощущения, как её называл И. Мюллер, не затрагивает внутренней метрики объекта и не воспроизводит его собственной трёхмерности. Весь процесс стадиального перехода от сенсорного образа к перцептивному представляет собой поэтапное развёртывание образа внутренней структуры объекта, которое на собственно перцептивном уровне доводится, по-видимому, до максимальной адекватности. Исходя из этого, естественно ожидать, что экспериментальный материал исследований максимально адекватных перцептивных образов содержит факты, характеризующие воспроизведение собственной пространственной трёхмерности воспринимаемого объекта. Такие факты в экспериментальной психологии обоих основных видов собственно перцепции — зрения и осязания — действительно имеются. Поскольку отображение трёхмерной внутренней структуры воспринимаемого объекта непосредственно примыкает к воспроизведению трёхмерности внешнего пространства, представляя его продолжение и более частную форму, целесообразно привести её характеристики как первое дополнение к приведённому перечню компонентов пространственно-временной структуры в качестве второго параметра его пространственной ветви. В области зрительной перцепции таким хорошо известным феноменом, воплощающим в себе воспроизведение в образе трёхмерной пространственной структуры видимого объекта или его рельефа, является стереоэффект. Обобщая большой экспериментальный материал исследований пространственных характеристик зрения, А. И. Коган прямо указывает, что, кроме восприятия удалённости данного объекта относительно других, «стереоэффект включает ощущение объёмности предмета» (Коган, 1971). В экспериментальной психофизиологии описаны как монокулярный (менее известный), так и широко известный бинокулярный стереоэффекты. При анализе пространственной структуры ощущений мы пытались показать, что пространственная схема сенсорного поля, отображающая внешнюю метрику объекта, является производной по отношению к отражению движения, воспроизведение траектории которого неизбежно включает и образ пространства. Поскольку образ рельефа, или трёхмерности самого объекта, представляет собой частную форму трёхмерности всего пространственного поля, естественно ожидать, что и эмпирическая феноменология стереоэффекта содержит факты, характеризующие эту первичную роль отображения движения. Действительно, при монокулярном стереоэффекте «основным фактором восприятия относительной удалённости считается параллакс движения (монокулярный параллакс в отличие от диспарантности — бинокулярного параллакса)» (там же). Феномен этот состоит в том, что при перемещении объектов относительно наблюдателя воспринимаемые смещения точек, расположенных ближе и дальше фиксируемой, противоположны по направлениям. Тем самым относительная удалённость разных точек, формирующая образ объёмности, оказывается производной по отношению к образу направления перемещения. Такая же исходная роль восприятия движения в формировании монокулярного стереообраза отчётливо проявляется в так называемом кинетическом эффекте глубины, который после Метцнера воспроизведён Г. Уоллахом и Д. О’Коннелом (Wallach, O’Connel, 1953). Поскольку феномен этот состоит в переходе двухмерного восприятия теневых фигур при их мгновенном изображении к отображению их трехмерности при их вращении с определённой скоростью, в данном случае мы явно имеем дело с тем частным случаем стереоэффекта, который относится к восприятию трёхмерности не общей структуры пространственного фона, а именно внутренней структуры объекта, относительной удалённости разных его компонентов. Бинокулярный стереоэффект определяется диспаратностью, или пространственным рассогласованием, обоих сетчаточных изображений. Определяющая роль бинокулярной диспарантности в стереоскопическом зрении привела классическую психофизиологию зрения к выводу о первичности этого фактора и замаскировала исходную роль двигательных и временных компонентов в построении образа объёмности или рельефности объекта. Между тем, как показывают данные П. Колерса (1970), эффект глубины или рельефности объекта формируется и при замене бинокулярного пространственного рассогласования сетчаточных изображений их монокулярным временным рассогласованием. Последовательная смена временных компонентов раздражения приводит здесь к структурированию такого заведомо пространственного компонента образа, как отображение рельефности. Этот эффект по существу аналогичен кинетическому эффекту глубины Г. Уоллаха и Д. О’Коннела, поскольку в обоих случаях имеет место последовательная смена изображений. Здесь кинетический эффект глубины и эффект временной диспарантности, взаимно подкрепляя друг друга, ясно свидетельствуют о факте преобразования двигательновременных компонентов образа в его собственно пространственную характеристику, воспроизводящую трёхмерную структуру воспринимаемого объекта. Если к этому добавить, что, по данным К. Огле (Ogle, 1950), в восприятии движения главную роль играют монокулярные факторы, а в них, как об этом свидетельствуют приведённые выше феномены, определяющее значение имеют двигательные и временные компоненты, то производный характер рассматриваемой собственно пространственной характеристики образа-отражения трёхмерной внутренней метрики объекта, как и внешней метрики трёхмерного фона, приобретает серьёзную эмпирическую обоснованность. Восприятие формыПриведённые выше факты непосредственно подводят к следующему наиболее важному пространственному компоненту перцептивного образа — к воспроизведению формы. Если самый факт объёмности воспринимаемого объекта может быть отображен и в относительно грубом образе, находящемся вне пределов диапазона адекватного восприятия, то точное воспроизведение рельефа предмета в пределе влечёт за собой и отображение его формы.
На рисунке 3 представлен образ пассивного осязания, в котором имеет место стереоэффект, охватывающий уже структуру самого объекта (эксперименты Л. М. Веккера). Здесь в образе охвачен рельеф всей поверхности предмета. В общем случае, однако, можно полагать, что если рельеф тела превышает определённую меру сложности, соответствующую возможностям пассивного осязания, то стереогаптический (то есть стереоскопический эффект, полученный с помощью осязания. — Прим. ред.) образ данного тела остаётся за пределами диапазона максимальной адекватности воспроизведения рельефа. Если пассивное осязание не всегда может дать адекватное отражение рельефа, поскольку здесь охват контура осуществляется за счёт движения объекта и отсутствуют средства фиксации начала отсчёта, то эти ограничения снимаются в естественном ходе процесса активного осязания. Результаты его исследований (эксперименты Л. М. Веккера) показывают, что уже в актах мономануального ощупывания стереогаптический эффект восприятия более сложных фигур (например, шестигранной призмы) достигает максимальной адекватности (рис. 4).
Поскольку это расширение возможностей достигается за счёт функционирующей в активном осязании координатной системы воспринимающего аппарата с её расчленёнными опорными, собственно сенсорными и сенсорноперцептивными функциями, ясно, что в системе бимануального осязания, где эта дифференцированность функций ещё более широка и тонка, в пределы диапазона адекватного восприятия рельефа попадают объекты ещё большей структурной сложности. Эта связь полноты и точности воспроизведения рельефа с отображением формы обусловлена особым положением формы среди пространственных свойств объекта. Именно форма воплощает в себе полноту пространственной структуры объекта. Поэтому восприятие формы есть наиболее важный признак собственно перцептивного образа как образа целостно-предметного. Целостная форма объекта не совпадает с формой его элементов, что и составляет одно из главных объективных оснований примата интегральной структуры «гештальта» над её элементами. Но именно в силу целостного характера формы полнота воспроизведения рельефа поверхности объекта автоматически влечёт за собой и адекватное отображение его формы. Приведённые в связи с вопросом о восприятии рельефа факты и рисунки испытуемых (относящиеся, правда, только к осязательному восприятию) отчётливо свидетельствуют о том, что объёмная форма также может адекватно воспроизводиться в перцептивном образе, причём независимо от масштаба отображения величины. При всей особой роли воспроизведения формы в построении интегрального перцептивного образа объекта необходимо всё же подчеркнуть, что сам по себе феномен адекватного воспроизведения формы не является специфичным для пространственной структуры психических процессов. Хорошо известно, что копирование формы легко достигается в фотографических и других видах технических сигналов-изображений. Парадоксальная эмпирическая специфичность именно психического изображения формы была экспериментально выявлена прежде всего с установлением того факта, что адекватность перцептивного зрительного образа формы сохраняется в определённом диапазоне изменений формы сетчаточного изображения, что и составляет существо феномена так называемой константности формы. Этот феномен сразу же разводит психическое изображение формы и её оптическое сетчаточное изображение аналогично тому, как дифференцируются перцептивный образ трёхмерного рельефа воспринимаемого объекта и его двухмерное сетчаточное изображение. Поэтому восприятие формы подвергалось интенсивному исследованию прежде всего в контексте константности образа. Так, ещё исследования Таулесса (см. Стивенс, 1963) показали, что квадраты и круги, плоскости которых наклонены к линии взора и сетчаточные изображения которых имеют соответственно форму ромбов и эллипсов, в определённом диапазоне наклона воспринимаются всё же как квадраты и круги, о чём свидетельствовали рисунки испытуемых. Поскольку, однако, в данном пункте восприятие формы описывается не как проявление общего свойства константности, а как компонент суммарной пространственно-временной структуры, в этом описании прежде всего нужно сделать экспериментально обоснованное заключение о том, что имеет место адекватное перцептивное воспроизведение формы и существует определённый диапазон, где эта адекватность сохраняется, несмотря на изменения исходных физических условий построения образа. Произведённое эмпирическое описание продвигается от наиболее общих характеристик единой пространственно-временной организации сенсорноперцептивного поля ко всё более частным параметрам внутренней структуры образа отдельного объекта. Так, анализ отображения общего свойства рельефности в частном случае максимальной полноты этого отражения привёл к воспроизведению формы, а рассмотрение разных вариантов отображения формы, в свою очередь, ведёт через взаимосвязь восприятия формы с восприятием размера к вопросу о восприятии такого наиболее важного пространственного параметра, как величина. Восприятие величиныВосприятие величины, как и восприятие формы, исследовалось в экспериментальной психологии преимущественно в контексте фазовой динамики восприятия и общей проблемы константности образа. При первом же обращении к фактическому материалу исследований обнаруживается особое, двойственное положение этого параметра. С одной стороны, отображение величины как всеобщей характеристики протяжённости объекта есть самый общий, исходный и раньше всего поддающийся вычленению пространственный компонент образа. С другой стороны, экспериментальные факты указывают на значительно меньшую стабильность и точность восприятия размера по сравнению с отображением формы. Напрашивается эмпирическое заключение о том, что за этой двойственностью и противоречивостью стоят два разных уровня отражения пространственной величины. Первый из них действительно является исходным и универсальным. Ещё до вычленения конкретной внутренней структуры воспринимаемого объекта грубо отображаются его общие размеры по длине, ширине и высоте. Такая общая усреднённая оценка величины может иметь разную степень точности, которая растёт по мере продвижения по фазам перцептогенеза. Но эта оценка может, по-видимому, достигать и значительной точности ещё до вхождения образа в диапазон полной адекватности отображения всей внутренней структуры объекта. Второй уровень представлен адекватным отражением величины как совокупности всех расстояний между точками объекта, то есть воспроизведением всей его метрики в масштабе один к одному или отображением его натуральной величины. Этот высший уровень адекватного воспроизведения метрики является самым частным, наименее помехоустойчивым и даёт большие значения ошибок и их разброс, чем воспроизведение формы (Ананьев, Дворяшина, Кудрявцева, 1968). Только этот уровень воспроизведения натуральной величины вводит образ в диапазон максимальной адекватности объекту. Временные характеристики перцептаОбратимся к рассмотрению компонентов, входящих во временную подгруппу единой пространственно-временной структуры перцепта. При анализе элементарных сенсорных образов было в общих чертах показано, что, поскольку собственно временная, как и собственно пространственная, ветвь суммарной пространственно-временной организации ощущения коренится в восприятии движения, а последнее по самой своей сути включает параметры последовательности и длительности, эти компоненты с необходимостью представлены уже на элементарном сенсорном уровне. Здесь, рассматривая структуру собственно перцептивных образов, важно ещё раз подчеркнуть необоснованность того традиционного подхода к той проблеме, согласно которому ощущение лишается исходных компонентов воспроизведения движения и необходимо связанной с ним временной последовательности, а отображение времени, как и пространства, переносится лишь в состав психологии восприятия. Тем самым совершается тройное искусственное обособление: во-первых, ощущений от отображения движения, во-вторых, восприятия времени и пространства от их сенсорных корней и, в-третьих, восприятия времени и пространства от восприятия предмета. Эмпирическое описание перцепта внутри диапазона его максимальной адекватности оказывается достаточно емким, чтобы охватить все ранее разрозненно изучавшиеся компоненты пространственной и временной структуры образа, суммарно представленные на схеме 5.
Модальность восприятияКак и исходные компоненты пространственно-временной структуры, модальность относится к подгруппе характеристик перцептивного образа, представленных уже на сенсорном уровне, а здесь претерпевает лишь некоторые изменения, относительно которых в данном описании должно быть сделано лишь краткое добавление. В рамках собственно перцептивных образов, двумя основными видами которых являются физические, базовые, или осязательные, и кинематико-геометрические, зрительные, модальные характеристики подверглись многостороннему и детальному исследованию преимущественно в области зрения. Наиболее специфическим модальным параметром зрительных сенсорно-перцептивных процессов является, как известно, цветотоновой образ в его хроматических и ахроматических компонентах. Экспериментальные исследования вскрыли высокую лабильность цветовосприятия и зависимость его специфического качества от различных пространственных, временных и энергетических факторов. Поскольку эти факторы преобразуются с изменением фаз и уровней перцептогенеза, с ними меняются и особенности цветовосприятия. Здесь же необходимо лишь указать на тот экспериментально полученный факт, что, несмотря на непосредственную зависимость цветовосприятия от изменений спектрального состава излучения, раздражающего сетчатку, существует часть диапазона этих изменений, в которой не только происходит, но и достигает максимальной адекватности так называемая трансформация цвета. Суть этого феномена заключается в том, что глаз нивелирует изменения спектрального состава отраженного объектом света, подравнивая тем самым воспринимаемый цвет объекта к его перцепции в условиях среднего дневного освещения. Та часть диапазона этих изменений, где нивелирующая трансформация является предельной, как раз и составляет загадочный интервал максимальной адекватности или так называемой полной константности восприятия цвета объекта вопреки изменениям освещения. Д. Джадд (1961) пишет: «При изучении цветовой трансформации, а также при изучении эффектов местных изменений яркости и спектрального состава освещения (например, когда объект в тени сравнивается с освещённым объектом), наиболее поражает тенденция цветовых объектов восприниматься с тем же самым цветовым тоном, светлостью и насыщенностью независимо от освещения». И далее Д. Джадд, ссылаясь на ранние исследования А. Гельба и Р. Б. Мак-Леода, указывает, что при некоторых условиях константность воспринимаемого цвета объекта «является действительно совершенной». В переводе на язык чисел это означает, что коэффициент константности цветовосприятия равен единице, то есть цветотоновое восприятие, определяясь именно оптическими свойствами поверхности данного объекта, а не меняющимся составом освещения, является максимально адекватным. Очень показателен приводимый тем же автором факт, что такая «совершенная» константность, или максимальная адекватность цветотоновой модальной характеристики перцепта, имеет место именно в условиях, когда цвет воспринимается как свойство поверхности конкретного объекта, которая для этого сама должна адекватно восприниматься. Если наблюдатель «рассматривает какой-то элемент объекта только как пятно цвета, то его реакция может проявить лишь слабую тенденцию к константности и будет изменяться по мере изменения освещённости рабочего плана» (там же). На такое же различие в восприятии цвета плохо локализуемых плоских пятен (Fleckenfarbe) и цвета поверхностей (Oberflachenfarbe) указывал ещё Д. Кац (Katz, 1930). Эти факты свидетельствуют о том, что адекватность цветовой модальной характеристики зрительного перцепта сочетается с адекватностью отображения структуры той поверхности конкретного объекта, которая является носителем цветового качества. Иными словами, адекватность модальных компонентов перцепта органически связана с адекватностью его пространственно-временных компонентов, как об этом уже упоминалось при анализе организации элементарных сенсорных сигналов в связи с различиями модального воспроизведения «первичных» и «вторичных» качеств. Интенсивность восприятияЕсли модальная характеристика, будучи преимущественно монополией исследования ощущений, входит всё же в область психологии восприятия (главным образом именно в контексте проблемы константности цвета), то с характеристикой интенсивности дело обстоит существенно иначе. Традиционно составляя содержание целого самостоятельного направления, связанного с изучением именно элементарных, пороговых сенсорных процессов, — психофизики, интенсивностная характеристика фактически оказалась вообще за пределами изучения собственно перцептивных процессов. Лишь экспериментальнотеоретические исследования последнего времени, идущие как со стороны психофизики (школа С. Стивенса), так и со стороны психологии восприятия (работы Ф. Кликса), все отчётливее указывают на искусственность такого разобщения. Этот вопрос связан с движением анализа «сверху вниз», то есть от перцепции к сенсорике. Здесь необходимо внести некоторые дополнения, относящиеся к особенностям интенсивностной характеристики перцепции внутри диапазона её максимальной адекватности. Это должно дать возможность последующего продвижения «сверху вниз». Сделать это представляется возможным на примере восприятия светлоты зрительного образа. Светлотная характеристика имеет двойственную природу. Будучи свойством как ахроматических, так и хроматических цветов и выражая степень отличия данного цвета от чёрного, светлотный компонент образа тем самым заключает в себе модальный аспект, относящийся к мере качественной специфичности данного цвета. С другой стороны, за «чернотой» стоит поглощение световых лучей видимой поверхностью, а светлота как степень отличия цвета данной поверхности от чёрного определяется её коэффициентом отражения. Последний же воплощает количество отраженных от данной поверхности световых лучей. Этот количественный аспект, выраженный числовой величиной коэффициента отражения, изменяющейся между нулем и единицей, явно относится уже не к модальной, а к интенсивностной характеристике светлоты, отличающей данную видимую поверхность от другой, поскольку большее количество отраженных лучей данного цвета неизбежно и сильнее воздействует на рецептор. Поэтому имеющиеся в экспериментальной психофизиологии зрения данные, характеризующие светлотные компоненты зрительного образа, заключают в себе именно интенсивностный аспект. Экспериментальные факты, относящиеся к интенсивностному компоненту светлоты, содержатся прежде всего в показателях её константности при изменяющихся условиях освещения. Поскольку здесь анализируется диапазон максимальной адекватности, то искомые интенсивностные характеристики светлоты, по-видимому, должны быть заключены в показателях её максимальной, то есть так называемой полной, константности. Исследования П. А. Шеварева (1948), специально посвящённые изучению светлотных компонентов зрительного образа, показали, что при восприятии двух поверхностей с расстояния ясного видения при равенстве коэффициентов отражения обеих поверхностей равны друг другу и их видимые светлоты. При этом равенство видимых светлот «наблюдается и в том случае, когда освещённости поверхностей одинаковы, и в том случае, когда эти освещённости неодинаковы» (Шеварев, 1948). Эта неизменность видимой светлоты поверхности при изменениях освещённости, являющаяся, как показывает исследование, весьма частой в условиях повседневной практики, и представляет диапазон полной константности светлоты. В свою очередь, эта полная константность светлоты на приведённых выше основаниях является полной константностью, или максимальной адекватностью, интенсивностной характеристики зрительного образа поверхности. Максимальная адекватность выражается в том, что в результате процессов трансформации нивелируется роль изменений освещённости и в Бездействующем на глаз световом потоке выделяется и соответственно сохраняется постоянным в образе только тот интенсивностный компонент, который детерминируется собственными отражательными свойствами видимой поверхности. Аналогичное сочетание модального и интенсивностного аспектов заключено внутри единства и такой специфической характеристики зрительного образа, как насыщенность. Выражая степень отличия данного цвета от серого, одинакового с ним по светлоте, насыщенность тем самым содержит дополнительный параметр модальной, качественной специфичности, заключающий ещё одно измерение и воплощающий меру этой качественной специфики (степень отличия от серого цвета). Поскольку же эта мера специфичности определяется отношением количества световых лучей, характеризующих цвет данной поверхности, к общему световому потоку, ей отражаемому, насыщенность содержит в себе интенсивностный аспект. Наличие здесь именно интенсивностного аспекта получает своё прямое выражение в том, что единицей светового потока, отношением к которому определяется насыщенность, является люмен, равный потоку от точечного источника в одну свечу; свеча же представляет собой единицу световой интенсивности. Поскольку в отношении насыщенности, как и в отношении светлоты, стоит вопрос о характеристиках её отражения внутри диапазона максимальной адекватности, такого рода данные могли бы быть получены, как и в предшествующих вариантах, в контексте исследований меры постоянства параметра насыщенности в применяющихся условиях восприятия. Однако экспериментальная психология содержит очень мало данных по константе насыщенности. Поэтому здесь можно лишь в принципе указать на наличие интенсивностного компонента насыщенности и на стоящую в связи с этим специальную задачу изучения этой характеристики как во всем сенсорно-перцептивном диапазоне, так и, в частности, внутри диапазона максимальной адекватности перцепта своему объекту. На этом заканчивается та часть перечня основных эмпирических характеристик, которые, будучи исходными и поэтому представленными уже в элементарных сенсорных процессах — простейших ощущениях, здесь нуждаются в соответствующих дополнениях и уточнениях применительно к диапазону максимальной адекватности. Далее следуют эмпирические характеристики образа, полученные в экспериментальной психологии именно в контексте исследований перцептивных процессов. Константность восприятияПо ходу рассмотрения пространственно-временных, модальных и интенсивностных характеристик перцептивного образа описание каждой из них неизбежно связывалось с показателями константности, поскольку диапазон максимальной адекватности всех этих характеристик связан с их устойчивостью и сохранностью в условиях изменяющегося воздействия непосредственных раздражителей. Но именно потому, что такая сохранность является сквозным свойством образа, присущим всем его первичным характеристикам, в предшествующем анализе по необходимости были использованы соответствующие факты каждой из форм константности, выделить последнюю в качестве общей характеристики, охватывающей все предыдущие, представляется целесообразным после рассмотрения пространственно-временной структуры, модальности и интенсивности. |
Свойства образов восприятия — Студопедия
Переходим к описанию существенных характеристик образов восприятия или основных перцептивных феноменов. Это очень важно потому, что именно эти характерные особенности отличают перцептивные образы от других видов образных явлений (образов памяти, гипногогических образов и т.д.). При изложении данного вопроса мы будем опираться на работы двух известных американских психологов Флойда Оллпорта.
Описание природы образов восприятия имеет преимущественно феноменологический характер, т. е. определяет специфику наших непосредственных чувственных переживаний и отвечает на вопрос: каким мы воспринимаем окружающий мир? Ф.Оллпорт выделял шесть классов перцептивных феноменов.
1. Сенсорное качество и его количественная представленность в образе восприятия. Это свойство перцептивного образа самое непосредственное и содержательное, поскольку оно характеризует саму фактуру или живую чувственную ткань образа.
Касание кожи руки холодным предметом или острый укол, вкус лимона или сахара запах ландыша или полыни, напряжение усталой мышцы шеи или согнутой в локте руки, свет от лампы-вспышки или КраСНОватый отблеск вечерней зари на горизонте все это те сенсорные качества, которые наполняют чувством реальности наши образы восприятия.
Как уже было указано выше, представленные в образе сенсорные качества имеют свои количественные измерения интенсивность, длительность во времени и протяженность в пространстве, делая звуки громкими или тихими, запахи насыщенными или едва уловимыми. Но вариации количества определенного сенсорного качества не изменяют самого основного представленности во вне некоторой чувственной реальности, отображающей определенные предметы. Таким образом, прямое,
непосредственное переживание Некоторого сенсорного качества или сеНсорных качеств и есть основа нашего восприятия.
2. Фигура и фон как обязательные атрибуты перцептивного образа образуют структуру нашего восприятия. Это означает, что воспринимаемый мир всегда структурирован на фигуры и фон.
Мы рассматриваем стоящее дерево, оно представлено в нашем еоприятии как фигура на фоне неба и окружающих деревьев, подходя ближе к дереву, мы различаем отдельные листья, оцениваем их форму, расположение на ветке и цвет, и тогда само дерево становится фоном в пространстве нашего образа, а листья фигурой. Таким образом, содержание нашего восприятия всегда целостно, а не представляет собой набор разрозненных сенсорных элементов. Эта фундаментальная особенность нашего восприятия может быть выражена простой формулой: мы воспринимаем объект всегда целостно, как отдельную фигуру, или Вообще никак не воспринимаем. Форма объекта, замкнутость его контуров, группировка нескольких объектов относительно друг друга так называемые конфигурационные аспекты восприятия в значительной степени определяют его содержание.
3. Константность восприятия одно из свойств образов воеприятия, явно отличающих их от сенсорных образов. Оно проявляется в относительной неизменности воспринимаемых признаков предметов при значительном изменении условий их восприятия, Т. е. при изменении проксимальной стимуляции.
Представим, например, что мы смотрим на человека с расстояния 5, 10 и 20 м. Мы даже Не задумываемся над тем, что, несмотря на различия в расстоянии, видимый размер человека один и тот же, потому, что мы это явно видим. Однако легко показать, что исходя из законов геометрии , размер проксимального стимула, т. е. сетчаточной проекции человека, уменьшился обратно пропорционально увеличению расстояния. Но
тогда мы должны признать, что изменение размеров раздражителя, действующего на рецепторную поверхность сетчатку, почти никак не Отразилось на величине воспринимаемого объекта, т. е. физический параметр стимуляции не повлиял на изменение соответствующего феноменального параметра. То же самое происходит при восприятии нами листа белой бумаги в комнате, когда в широких пределах изменяется уровень освещения. Например, вы закрываете окна плотными шторами и видите тот же лист белой бумаги, выключаете верхний свет и видите опять лист белой бумаги, наконец, вы выключаете настольную лампу, и только небольшая часть света проникает через шторы, но вы опять видите все тот же белый лист 2 . В реальной жизни мы никогда не задумываемся над тем, почему при изменении на несколько порядков интенсивности Света, отраженного от листа белой бумаги и попадающего на сетчатку (проксимальный стимул), соответствующий феноменальный параметр стимуляции воспринимаемая белизна практически не меняется. Феномены константности восприятия обнаружены также и в других модальностях, например относительная неизменность восприятия громкости звука при удалении от его источника.
Таким образом, мы приходим К чрезвычайно важному заключению: способность нашего восприятия обеспечивать относительную неизменность характеристик отражаемой действительности при значительных изменениях физических параметров стимуляции позволяет нам воспринимать окружающий мир стабильно, сохраняя существенные характеристики предметного образа и адекватно соотнося их с меняющимися параметрами проксимальной стимуляции. Константность восприятия характеризует его как активный психический процесс, процесс построения перцептивного образа, а не пассивного отображения отдельных сенсорных качеств раздражителя. На важное биологическое значение Константности восприятия обращал внимание Лев Семенович Выготский (1896 1934), отмечая, что, если бы не было константности Величины, животному, которое опасается хищника, последний должен казаться на расстоянии ста шагов уменьшившимся во Много раз.
4. Следующий феномен восприятия связан с субъективным xарактером оценки величиныили интенсивности какого-либо объекта и получил название системы отсчета в восприятии. Мы обычно не задумываемся, говоря, что этот звук «громкий», а тот предмет «тяжелый». Тем не менее, очевидно, что наши оценочные суждения должны быть субъективны и относительны и зависеть от сформированной ранее системы эталонов. Такая система эталонных оценок зависит от прошлого опыта восприятия подобных объектов, обучения, социокультурных норм. Как и любая другая высшая психическая функция, восприятие культурно и исторически детерминировано. Кроме Того, диапазон и характер наших оценок степени выраженности какого-либо сенсорного качества зависит от Того стимульного контекста, в котором даются эти оценки.
5. Предметный характер восприятия фундаментальное свойство перцептивного образа, тесно связанное со всеми другими феноменальными свойствами и поэтому наиболее универсальное и всеобъемлющее. Оно заключается в том, что мы воспринимаем не набор отдельных сенсорных качеств, а предмет, представленный вне нас, обладающий этими качествами и поэтому реально существующий. Чувство реальности объективно существующего предмета характерная особенность образа восприятия, отличающая его от других видов образов. Мы редко задумываемся над этой характеристикой перцептивного образа, поскольку чувство реальности воспринимаемого предмета редко покидает нас. Мы верим, мы убеждены в том, что представленный в образе предмет реален и объективен. Однако, в случае потери этого чувства, мы сразу же понимаем, что с нами произошло что-то необычное. Это случается как в специально организованных экспериментальных условиях (например, при сенсорной изоляции), так и при особых состояниях сознания, вызванных высокой температурой, действием наркотических веществ и т. п. Симптом дереализаиии характерен для некоторых психических заболеваний.
Интересные при меры потери чувства реальности предметного мира приводили А. Н.Леонтьев и А. В. Запорожец, описывая специфические переживания раненых минеров, ослепших после взрыва и перенесших ампутацию кистей рук. Ввиду потери привычных для них зрительных и осязательных ощущений, пациенты восстановительного госпиталя сообщали о появлении характерного чувства нереальности или иллюзорности окружающего их мира, мира, который, несмотря на полное понимание объективности его существования, не переживался как реальность, поскольку его образ был лишен большей части своего чувственного содержания [64].
Предметность восприятия выражается и через понятие обьективированности, т. е. чувства вынесенности содержания образа восприятия вне самого субъекта.
Предметное восприятие определяется также через означенность его содержания, т. е. мы всегда переживаем образ предмета в виде вещи, имеющей определенное значение. Означенность перцептивного образа можно проиллюстрировать известным примером из «Маленького принца» С. Экзюпери, где герои дают различное толкование воспринимаемому рисунку. Чаще Всего говорят, что нарисована шляпа, но Маленький принц увидел другое содержание это удав проглотил слона! И действительно, многозначность чувственной основы образа и отсутствие определенного контекста позволяют по-разному означивать этот объект.
Специфика перцептивного образа в том, что мы переживаем значение предмета одномоментно мы просто чувствуем, что перед нами та или иная вещь. И лишь в специально организованном психологическом эксперименте, где испытуемому предъявляются зрительные стимулы на очень короткое время, можно этот процесс означивания «развернуть» во времени. Будем увеличивать время экспозиции и спрашивать испытуемого, что он увидел в очередной пробе. Сначала он скажет, что на экране мелькнуло что-то темное, затем (при увеличении времени предъявления) он сообщит, что увидел нечто прямоугольное и синее, и вдруг (после очередного увеличения времени) он уверенно скажет, что это книга в тёмно-синей обложке.
Значение образа всегда опосредствованно не только и не столько индивидуальным опытом субъекта, но в большей степени культурно историческим опытом Всего человечества, особенностями воспитания и обучения. Это так называемое сверхчувственное свойство образа, оно лежит вне наших органов чувств, его нельзя понять исходя из особенностей стимуляции.
Означенность перцептивного образа может пропадать в случаях локального поражения коры головного мозга, когда у больных наблюдается так называемая зрительная предметная агнозия. Такие больные Могут подробно описать детали изображенного на
картинке предмета, но не способны его опознать и воспринять целостно.
Предметность восприятия означает и его полимодальность, т. е. слияние в перцептивном образе всех чувственных впечатлений. Например, когда мы держим в руках новый предмет, мы его активно ощупываем, рассматриваем, слышим шорох от движения пальцев по неровной поверхности, ощущаем вес, теплоту и упругость.
6. Еще одно базовое свойство восприятия, объединяющее его с другими психическими процессами, связано с его избирательным характером. Избирательность восприятия проявляется во влиянии индивидуальных различий людей и эффектах доминирующей установки. Под перцептивной установкой в психологии понимается готовность субъекта к восприятию чего-либо. Феноменально влияние установки выражается в большей ясности восприятия объекта. Например, если с очень коротким временем экспозиции (т. е. в ситуации сенсорной неопределенности) на экране монитора равновероятно предъявлять буквы и цифры, то испытуемые приблизительно с одинаковой вероятностью будут опознавать изображение «13» как букву В и число 13. Но если в предыдущем опыте испытуемому предъявлялись буквы, то он воспринимал это изображение как букву, если ранее предъявлялись цифры, то как цифру.
Сходным образом на ясность и содержание перцептивного образа влияют и особенности текущего состояния человека. Состояние нужды в чемто, т. е. то, что в психологии называют мотивационным состоянием, может существенно повлиять на характер
восприятия.
Одним из важнейших свойств восприятия, выделяемым различными авторами и тесно связанным со всеми остальными, является его активный характер. Это свойство может быть коротко определено так: нормальное восприятие в принципе не может быть статичным. Особенно ярко оно проявляется как принципиальная изменчивость перцептивного образа при константной сенсорной стимуляции.
Общие закономерности и свойства восприятия
Различные виды восприятия имеют свои специфические свойства. Но кроме внутривидовых свойств восприятия существуют и его общие свойства: предметность, избирательность, целостность, константность, структурность, категориальность (осмысленность и обобщенность), апперцепция.
Предметность восприятия заключается в том, что психические образы предметов человек осознает не как образы, а как реальные предметы, объективируя их. Предметность восприятия означает адекватность, соответствие образов восприятия реальным объектам действительности.
Избирательность означает преимущественное выделение объекта из общего фона, при этом фон выполняет функцию системы отсчета, относительно которой оцениваются другие качества воспринимаемого предмета как фигуры. Избирательность восприятия сопровождается его центрацией — субъективным расширением зоны фокуса внимания и сжатием периферийной зоны.
При равнозначности объектов испытуемые преимущественно выделяют центральный объект и объект большей величины. Имеет значение и то, какие объекты признаются базовыми: если объект и фон равнозначны, то они могут переходить друг в друга. Целостность восприятия – это отражение предмета в качестве устойчивой совокупности элементов, даже если отдельные ее части в данных условиях не наблюдаются.
Константность восприятия – это независимость отражения объективных качеств предметов (величины, формы, цвета) от изменения условий их восприятия – освещенности, расстояния, угла зрения.
Константность восприятия размеров означает то, что мы правильно воспринимаем размеры наблюдаемого объекта независимо от того, близко он находится от нас или далеко. Дом в конце улицы воспринимается нами большим, чем почтовый ящик, находящийся поблизости, хотя первый создает намного меньший образ на сетчатке, чем последний.
Аналогичный феномен – константность восприятия формы: мы воспринимаем форму объекта более или менее независимо от угла, под которым мы его рассматриваем. Прямоугольная дверь будет выглядеть прямоугольной, даже несмотря на то, что под большинством углов рассмотрения она будет создавать на сетчатке трапециевидный образ.
Структурность восприятия является следствием его целостности и отражает устойчивое соотношение отдельных компонентов перцептивного образа. Структурность наглядно демонстрирует, что восприятие не сводится к простой сумме ощущений. Например, мы слышим мелодию, а не сумбурное, хаотическое нагромождение звуков.
Категориальность (осмысленность и обобщенность) восприятия предполагает, что объект воспринимается и мыслится не как непосредственная данность, а как представитель некоторого класса объектов. В осмысленности проявляется связь восприятия с мышлением, а в обобщенности – с мышлением и памятью.
Апперцепция — это зависимость восприятия от прошлого опыта человека, от имеющихся у него знаний, его интересов, потребностей и склонностей (устойчивая апперцепция), а также от его эмоционального состояния и предшествующих восприятию действий (временная апперцепция).
границ | Статистика изображений и представление свойств материалов в Visual Cortex
Введение
Восприятие материала и свойств поверхности имеет решающее значение для многих аспектов нашего взаимодействия с окружающей средой, но до сих пор у нас есть лишь ограниченное представление о том, как это достигается. Например, еще не совсем понятно, как мозг может быстро и успешно различать гладкий, скользкий предмет и грубый, который обеспечит хороший захват.Поскольку нейронные процессы, лежащие в основе таких суждений, в значительной степени неизвестны, мы решили исследовать вопрос, как материальные свойства представлены в зрительной системе мозга. В частности, мы исследовали, на какие функции изображения мозг может полагаться при обработке свойств материала и где в мозге можно декодировать информацию о свойствах материала.
В психофизических исследованиях материальное восприятие привлекает все большее внимание в последние годы. Было указано, что визуальная система, вероятно, полагается на наборы статистических данных инвариантного изображения или реплики для оценки свойств объекта и материала вместо выполнения дорогостоящих вычислений для разработки физики визуальной сцены (Нисида и Шинья, 1998; Motoyoshi et al., 2007; Флеминг и др., 2011; Марлоу и др., 2011, 2012; Гизель и Заиди, 2013; обзор см. в Fleming, 2014). Например, было показано, что информация о пространственной частоте (Giesel and Zaidi, 2013) или асимметрия гистограммы яркости (Motoyoshi et al., 2007) влияют на восприятие свойств материала. Однако неясно, как эта статистика изображений действует на нейрональную основу. Предыдущие исследования с помощью фМРТ по восприятию текстуры и материала показали, что задачи, связанные с восприятием визуального материала, такие как различение текстуры или категоризация материала, приводят к усилению активации в медиальных областях вентральной экстрастриарной коры у людей-наблюдателей (Newman et al., 2005; Кант и Гудейл, 2007, 2011; Cant et al., 2009; Jacobs et al., 2014). Было проведено очень мало работ по нейронной обработке отдельных свойств материала, за исключением блеска (обезьяны: Nishio et al., 2012, люди: Sun et al., 2015). Совсем недавно Sun et al., 2016) показали, что зрительные стимулы с разными поверхностными свойствами (например, грубая или глянцевая) приводят к разной активности как в соматосенсорной коре, так и в ранних зрительных областях.
Hiramatsu et al. (2011) провели эксперимент фМРТ, чтобы исследовать категориальное представление визуально представленных материалов в человеческом мозге.Посредством анализа мультивоксельного паттерна они смогли показать, что во всем вентральном потоке можно декодировать информацию о категориях материалов. Важно отметить, что они могут показать, что представление материалов в ранних областях сильно основано на статистике изображения низкого уровня, такой как контраст, пространственная частота и информация о цвете. В более высоких визуальных областях представление материалов, как было замечено, основано на перцептивном сходстве, то есть отражает суждения участников о свойствах материала.Эти результаты были недавно воспроизведены на макаках (Goda et al., 2014). Несмотря на то, что информация о категории уже присутствует в V1, они пришли к выводу, что семантическое или категориальное различие между материалами не возникает перед веретенообразной извилиной / боковой бороздой. Несколько исследований продемонстрировали, что перцептивные представления материалов организованы осмысленным и последовательным образом (Rao and Lohse, 1996; Baumgartner et al., 2013; Fleming et al., 2013). Fleming et al. (2013), например, показали, что свойства визуального материала четко определены и тесно связаны с членством в категории, а Baumgartner et al.(2013) смогли показать, что визуальное и тактильное восприятие материала устойчиво и тесно связано.
В то время как исследование Hiramatsu et al. (2011) убедительно продемонстрировало существование различных уровней репрезентации в материальном восприятии, остается неясным, как восприятие различных материальных свойств возникает и распространяется в зрительной коре головного мозга человека и на какой информации основано это восприятие. на. Нас интересовало, где и как рано в визуальной системе представлены свойства материалов, и, что немаловажно, какие статистические данные изображения используются визуальной системой во время восприятия материалов.Мы провели это исследование, чтобы ответить на эти фундаментальные вопросы о восприятии материальных свойств. Наша цель состояла в том, чтобы связать воспринимаемые материальные свойства изображений, их статистические свойства и вызванную ими активацию мозга. Эти три неразрывно связаны друг с другом, поэтому мы применили хорошо зарекомендовавшие себя методы, которые использовались для решения нескольких схожих проблем в науке о зрении (Britten et al., 1996; Stone and Krauzlis, 2003), чтобы исследовать, как они соотносятся с друг с другом.
Материалы и методы
Участников
Пятнадцать участников завершили эксперимент со свойствами материала, 11 из них дополнительно завершили сканирование ретинотопии. Однако только 9 из этих 11 участников смогли получить надежные карты. Девять из наших участников были женщинами, шесть мужчин. Средний возраст составил 24,1 года. Все были студентами Гиссенского университета и были правшами, согласно Эдинбургской инвентаризации рук (Oldfield, 1971). Исследование было одобрено местным этическим комитетом, и все участники подписали форму согласия в соответствии с Хельсинкской декларацией.
Стимулы
В нашем эксперименте мы использовали набор из 84 изображений материальных поверхностей в качестве стимулов. Эти материальные поверхности были собраны для психофизических исследований визуального и тактильного восприятия материала слепыми и зрячими наблюдателями (Baumgartner et al., 2013, 2015). Фактические образцы были собраны из разных источников, закреплены на плитках и сфотографированы с помощью зеркальной фотокамеры Nikon D70 (Nikon, Токио, Япония). В качестве стимулов использовались плоские участки размером 14 см × 14 см из различных образцов следующих категорий материалов: пластик, бумага, ткань, кожа, мех, камень, металл и дерево.Для получения дополнительной информации мы обращаемся к Baumgartner et al. (2013), где подробно описана база данных стимулов. Мы сфотографировали стимулы в условиях экспериментальной установки нашего предыдущего исследования с точки зрения участника, с окном позади участника / фотографа и точечным источником света над установкой. Часть фотографий была также использована в исследовании статистики изображений Wiebel et al. (2015). Затем фотографии были обрезаны до размера 768 × 768 пикселей, так что осталась только поверхность материала (см. Рисунок 1).Яркость фона, когда стимулы подавались на проектор в экспериментальной установке, составляла 176 кд / м 2 , средняя яркость стимула составляла 189 кд / м 2 . Изображения доступны для скачивания
РИСУНОК 1. Фотографии материалов, использованных в эксперименте фМРТ.
Рейтинг и свойства материала
Процедура
Мы попросили 6 из 15 участников указать свои оценки трех свойств материала — шероховатости, текстуры и твердости по 7-балльной шкале Лайкерта для каждого стимула.В отличие от восприятия формы, материальное восприятие по своей сути мультимодально, поэтому мы хотели использовать визуальное, тактильное и бимодальное свойство материала. Баумгартнер и др. (2013) обнаружили, что визуальные и тактильные представления тесно связаны. Скорее всего, это результат процесса обучения (Goda et al., 2016). Поэтому трудно приписать определенные свойства одному из органов чувств, но из наших более ранних работ кажется, что текстуру можно более надежно оценить в визуальном смысле, в то время как шероховатость — это свойство, которое легко и надежно доступно для обоих органов чувств из материала объекта. поверхность.Жесткость, напротив, даже если она может быть получена в некоторой степени с использованием визуальной информации (Baumgartner et al., 2013), в основном воспринимается через осязание и, следовательно, служит аналогом визуально доступных свойств. Фотографии были представлены на экране компьютера в полностью рандомизированном порядке. Участники оценивали каждое свойство по очереди, т. Е. Оценивали одно свойство по всем стимулам, делали небольшой перерыв, а затем оценивали следующее свойство по всем стимулам. Порядок свойств также был рандомизирован.Участникам разрешалось смотреть на каждый стимул столько, сколько они хотели. В начале каждого имущественного блока участнику давалось письменное определение собственности:
ШероховатостьНасколько грубым или гладким кажется вам материал? Низкие значения указывают на то, что поверхность кажется гладкой; высокие значения указывают на грубость.
ТекстураНасколько текстурированной / узорчатой или однородной / однородной является поверхность материала? Низкие значения указывают на то, что поверхность однородна, высокие значения указывают на то, что материал имеет узор или текстуру.
ТвердостьНасколько твердым или мягким кажется материал? Какое усилие потребуется, чтобы изменить форму материала? Низкие значения указывают на то, что поверхность кажется мягкой; требуется небольшое усилие, чтобы изменить форму материала. Высокие значения указывают на то, что он твердый и не поддается деформации.
Группы изображений
Для каждого свойства материала мы сформировали группы изображений с высоким и низким рейтингом. Мы сделали это, упорядочив изображения в соответствии с рейтингами, а затем выбрав 25% процентов изображений с наивысшими рейтингами свойств для группы с высокими рейтингами и 25% процентов изображений с самыми низкими рейтингами свойств для группы с низким рейтингом. (21 изображение в каждой группе).Это привело к созданию двух групп изображений для каждого свойства материала с относительно низким и относительно высоким значениями соответствующего свойства, например, группа грубых изображений по сравнению с группой гладких изображений (для шероховатости).
Статистика изображения
Чтобы получить информацию о наших материальных изображениях, мы проанализировали их в соответствии со статистикой изображений Simoncelli и Portilla (1998) и Portilla и Simoncelli (1999, 2000). Хотя алгоритм был расширен для работы с цветными изображениями, мы работали с первоначальной версией, в которой используются изображения в градациях серого, чтобы количество статистических данных изображения оставалось на управляемом уровне.Изображения были преобразованы в яркость путем умножения R, G и B на относительную яркость соответствующего канала устройства отображения. Модель текстуры, созданная Портиллой и Симончелли, представляет собой сложную модель, разработанную в первую очередь для синтеза текстуры. Сначала алгоритм извлекает из фотографий большой набор статистических данных. Эти статистические данные изображений позже используются для итеративной процедуры синтеза изображений. Однако здесь мы использовали параметры, вычисленные моделью, для описания наших материальных образов.Мы проанализировали три типа статистики, которые алгоритм предоставляет отдельно.
Статистика пикселей
Первоначально алгоритм анализа текстуры вычисляет предельную статистику распределения уровней серого текстуры (количество пикселей на уровень серого). Эти статистические данные представляют собой среднее значение, дисперсию, перекос, эксцесс и диапазон (минимум и максимум) распределения. Эту статистику мы впоследствии будем называть «пиксельной статистикой».
Статистика фильтра
Затем алгоритм разбивает изображение на ориентированные линейные фильтры в разных масштабах с помощью управляемой пирамиды (Simoncelli et al., 1992) и вычисляет статистику для описания этих выходных данных фильтра, а также отношений между ними. Несмотря на то, что модель основана на ответах фильтра в V1, параметры не обязательно соответствуют конкретной статистике ответов нейронов V1 и V2. Непространственная сводная статистика этих ответов, реализованная в модели, может быть вычислена на более позднем этапе, предположительно в V2 (Freeman and Simoncelli, 2011; Freeman et al., 2013).
В нашем случае мы использовали управляемую пирамиду с четырьмя масштабами и четырьмя ориентациями.Сначала алгоритм вычисляет локальную автокорреляцию низкочастотных изображений, которую управляемая пирамида вычисляет на каждом уровне. Эти автокорреляции фиксируют регулярность (периодические особенности) текстур и характерных пространственных частот. Во-вторых, вычисляется совместная статистика коэффициентов амплитуды поддиапазонов. В частности, на этом этапе используются соотношения соседей в пространстве, ориентации и масштабе. Эти захватывающие структуры (например, края) в изображениях, а также «текстуры второго порядка». В-третьих, алгоритм вычисляет кросс-масштабную фазовую статистику.Таким образом, вычисляется локальная относительная фаза между коэффициентами поддиапазона и их соседями в следующем более крупном масштабе. Эти коэффициенты улавливают градиенты в текстурах и могут различать края и линии. В нашем случае анализ изображения дал 877 параметров изображения.
Параметры пространственной частоты
Ранее было описано, что пространственная частота напрямую влияет на воспринимаемые свойства материала (Giesel and Zaidi, 2013). Управляемая пирамида модели Портиллы и Симончелли уже в определенной степени улавливает содержание пространственной частоты.Однако для того, чтобы исчерпывающе исследовать пространственно-частотный состав наших изображений, мы изменили управляемую пирамиду с большим количеством фильтров, то есть построили другую управляемую пирамиду с двенадцатью ориентациями и шестью масштабами. 74 коэффициента (12 × 6 + невязки верхних и нижних частот), полученные в результате разложения с помощью управляемой пирамиды, составляют нашу третью группу статистических данных изображения.
Эксперимент FMRI
Мы показали каждому участнику 84 стимула в случайном порядке. Между испытаниями (т.например, изображения), у нас были интервалы не менее 14 с (плюс джиттер 0–2,5 с), чтобы поддерживать ЖИВОЕ загрязнение соседних во времени изображений на минимальном уровне. Каждый стимул предъявлялся в течение 5 с. После 25% процентов испытаний участнику был задан рейтинговый вопрос. Участника попросили оценить одно из трех свойств материала для стимула, который он или она только что увидел. Испытания, после которых был представлен рейтинговый вопрос, были рандомизированы таким образом, что участники не могли предсказать, придется ли им отвечать на вопрос позже, просматривая каждое материальное изображение.Для каждого рейтинга мы случайным образом выбирали материальное свойство, которое мы просили участника оценить, чтобы участники не имели в виду определенное материальное свойство, глядя на стимулы. Мы сделали это для того, чтобы участники обратили пристальное внимание на каждый стимул. Участники должны были оценить свойство стимула по 3-балльной шкале Лайкерта. Они указали свои ответы, нажав одну из трех кнопок ответа. Экспериментальные данные были собраны за один функциональный цикл, который длился примерно 35 минут.Обратите внимание, что каждое изображение материала было просмотрено каждым участником только один раз.
Презентация стимула
стимулов проецировали с помощью проекционного экрана XGA-Projector (Epson, модель 7250, разрешение: 1024 × 768) (460 × 350 мм) за отверстием сканера. Зрительную стимуляцию можно было увидеть с помощью двойного зеркала, прикрепленного к катушке для головы (поле зрения 18 ° по горизонтали и 16 ° по вертикали, прямоугольная апертура). Наши стимулы охватывали примерно 14 ° × 14 ° экрана.Мы использовали программное обеспечение Presentation (версия 16, Neurobehavioral Systems TM, Олбани, Калифорния, США) для представления стимулов и регистрации ответов.
Параметры сканирования
Данные были собраны с помощью системы визуализации SIEMENS Symphony 1.5 Tesla MR с системой квантовых градиентов. Анатомическое сканирование было собрано на 160 T1-взвешенных сагиттальных изображениях с помощью последовательности MP-RAGE. Толщина среза составляла 1 мм. После этого была сделана сканированная карта поля для измерения неоднородностей магнитного поля.Функциональные данные были собраны с использованием однократной последовательности T2 * -взвешенной градиентно-эхо-планарной визуализации (EPI) с 25 срезами, покрывающими весь мозг, полученными в порядке убывания (толщина срезов 5 мм; промежуток 1 мм; TA = 2,4 с; TR = 2,5 с; TE = 55 мс; угол поворота 90 °; поле зрения 192 мм × 192 мм; размер матрицы 64 × 64; размер вокселя 3 мм × 3 мм × 5 мм.) .
Предварительная обработка и анализ данных
DICOM-файла были преобразованы в NIFTI-файлы с помощью MRI Convert (версия 2.0; Центр нейровизуализации Льюиса, Орегон). SPM8 (Статистическое параметрическое картирование; Wellcome Department of Cognitive Neurology, Лондон, Великобритания) использовался для предварительной обработки данных. Предварительная обработка состояла из устранения деформации, выравнивания, совмещения и сглаживания (FWHM 6 мм). Перед процедурой анализа с помощью прожектора анатомические и функциональные данные были дополнительно нормализованы по шаблону мозга MNI.
Ретинотопия
Ретинотопические стимулы состояли из вращающегося клина и расширяющегося круга с высококонтрастным (черно-белым) шахматным рисунком, который менял фазу с частотой 4 Гц.И клин, и круг были представлены одновременно, при этом стимул клина завершил 5 циклов за цикл (80 с / цикл), а кольцо завершило восемь циклов за цикл (50 с / цикл). Участники должны были зафиксировать серую точку фиксации в центре экрана, и их попросили нажимать кнопку всякий раз, когда они замечали изменение цвета точки фиксации. Участники выполнили 3 или 4 цикла ретинотопии.
Данные ретинотопии были собраны в отдельном (втором) сеансе. Параметры предъявления стимула и сканирования были идентичны параметрам основного эксперимента.Данные ретинотопии не искажались, совместно регистрировались и сглаживались (6 мм FWHM). Мы очертили ретинотопные области V1-V3 с помощью подхода ретинотопного картирования с фазовым кодированием. К временным рядам каждого вокселя применялось быстрое преобразование Фурье, чтобы идентифицировать активацию, соответствующую частотам клинья и кольцевого стимула. Фазовые лагы (т.е. полученные карты полярного угла и эксцентриситета) затем накладывались на реконструированную, раздутую кортикальную поверхность (полученную через FreeSurfer, Центр биомедицинской визуализации Мартиноса, Бостон, Массачусетс, США).Затем мы определили границы V1 – V3 как развороты на карте полярных углов. Полученные маски служили областями интереса (ROI) в дальнейшем анализе.
Классификация
Классификатор статистики изображений
Для оценки того, сколько информации о рассматриваемом свойстве материала содержится в статистике изображения, мы применили классификатор к статистике изображения. Для каждого наблюдения (т. Е. Изображения) мы построили вектор признаков (т. Е. z- оцененных статистических параметров изображения).Затем мы обучили классификатор на нашем наборе изображений и попытались предсказать для каждого изображения, принадлежит ли оно к группе с высоким или низким рейтингом, т. Е. Имеет ли оно высокий или низкий балл по рассматриваемому свойству. Обратите внимание, что мы делали это для каждого свойства отдельно, поэтому мы всегда проводили двухстороннюю классификацию изображений с высоким и низким рейтингом свойств, например «гладкие» и «грубые». Поскольку мы создали группы из одного пула из 84 изображений материалов, несколько изображений оказались в нескольких группах.Все анализы классификации были выполнены с использованием кода, который использовал линейный дискриминантный анализ, реализованный в функции классификации набора статистических инструментов для MATLAB (версии R2012a и R2013a). Функция использовалась с опцией «диаглинеарная», которая подбирает многомерную нормальную плотность для каждой группы и оценивает ковариационную матрицу на основе диагонали. Ради интереса мы также провели анализ классификации с помощью машины опорных векторов (SVM), реализованной в MATLAB (Statistics Toolbox).Это дало результаты, очень похожие на результаты, полученные с помощью дискриминантного анализа. Поэтому в этой рукописи мы остановимся только на результатах дискриминантного анализа.
Анализ структуры мультивокселей (MVPA)
Мультивоксельный анализ паттернов, в отличие от «традиционных» методов анализа фМРТ, позволяет анализировать, сколько информации об определенной функции содержится в определенной области мозга, даже если эта функция не приводит к средней разнице в активациях, например потому что нейроны, кодирующие два разных состояния, перемешаны.В MVPA классификатор применяется к шаблонам вокселей так же, как мы это делали с нашими наборами статистики изображений.
Для расшифровки оценок свойств на основе паттернов активности мозга мы сначала настраиваем общую линейную модель (GLM) в SPM для каждого участника. В GLM мы включили отдельный регрессор для каждого из 84 стимулов. Затем мы замаскировали полученные карты β – (по одной для каждого изображения) с нашими областями интереса. Значения вокселей в каждой области интереса были векторизованы и использованы в качестве векторов признаков в процедуре классификации.И снова мы создали двусторонний классификатор для каждого свойства материала, чтобы различать изображения с высокими и низкими оценками.
Тесты перекрестной проверки и перестановки без исключения
Точность выполнения классификации может быть сильно переоценена, если классификатор тестируется на том же наборе данных, на котором он обучается. Поэтому мы использовали перекрестную проверку с исключением по одному. В этой процедуре классификатор итеративно обучается по всем наблюдениям, кроме одного, а затем проверяется по оставшимся наблюдениям.В частности, каждый классификатор запускался 42 раза, каждое изображение использовалось один раз в качестве тестового наблюдения. Это гарантирует, что наборы для обучения и тестирования остаются независимыми на протяжении всей процедуры классификации.
Односторонние тесты t- были использованы для сравнения средней точности по предметам со случайной эффективностью (50%). Для более строгой проверки значимости классификатора статистики изображений и MVPA мы дополнительно использовали процедуру начальной загрузки. Мы запускали каждый классификатор несколько раз, каждый раз меняя метки групп наблюдений случайным образом.На основе этих переставленных классификаций мы оценили вероятностные распределения наших классификаторов.
Анализ прожектором
Для того, чтобы исчерпывающе исследовать мозг в поисках информации о материальных свойствах, мы применили исследовательский анализ прожектором в дополнение к анализу ROI (Kriegeskorte et al., 2006). В этом анализе сферический прожектор помещается во все возможные места в мозге. Затем в каждой сфере прожектора был проведен MVPA, чтобы выяснить, где в мозгу содержится информация о свойствах материала.Для этого мы замаскировали β-карты каждого участника маской серого вещества участника. На каждом вокселе по очереди центрировали прожектор в форме сферы с радиусом 4 вокселя (например, Bannert and Bartels, 2013; de Haas et al., 2013). Этот прожектор действовал как маска. Мы построили вектор признаков из значений вокселей в маске и использовали классификатор с исключением по одному, чтобы различать изображения с высоким и низким рейтингом. Для каждого прожектора точность классификатора записывалась обратно в центральный воксель.Следовательно, для каждого участника и материальной собственности мы получили карту точности прожектора. Из них мы вычли уровень вероятности классификаторов (50%) и объединили карты точности отдельных участников в анализе второго уровня в SPM для обнаружения групповых эффектов.
Результаты
Рейтинг изображений
Группы с высоким и низким рейтингом основывались на рейтингах участников. На рисунке 2 показано распределение рейтингов для каждого объекта недвижимости.
РИСУНОК 2. Распределения оценок (средние оценки шести наблюдателей) для всех 84 изображений для каждого из трех свойств материала (A) и изображений в качестве примера (B) . Вертикальные красные линии обозначают 25-й и 75-й процентиль оценок. Изображения с рейтингом ниже 25-го процентиля составляли изображения с низким рейтингом для этого свойства, а изображения с рейтингом выше 75-го процентиля составляли изображения с высоким рейтингом. Отсечка составляла 2,3 и 4,2 для шероховатости, 2,5 и 4,7 для текстуры и 2.5 и 5,7 по твердости.
Чтобы оценить объем информации о группах материальных свойств, содержащихся в моделях активности мозга наших участников, когда они наблюдали за нашими материальными стимулами, мы запустили классификатор по β-весам, извлеченным из областей V1, V2 и V3 в подмножестве участников, завершивших ретинотопию (рис. 3). Картина результатов очень похожа на ту, которая наблюдается с визуально реагирующими вокселями, с лучшими характеристиками классификации для шероховатости и текстуры.
РИСУНОК 3. Точность классификации дискриминантного анализа в ретинотопически определенных визуальных областях V1-V3 (девять участников). Опять же, горизонтальная линия указывает уровень вероятности (0,5). Заштрихованная область указывает порог p , полученный в результате теста перестановки ( p <0,05, односторонний тест). Пороговое значение было усреднено по всем участникам.
Статистика изображения
Чтобы увидеть, сколько информации о наших группах изображений содержится в различных наборах статистики изображений, мы применили классификатор к статистике, полученной с помощью алгоритма Портиллы и Симончелли.На рисунке 4 показаны результаты классификатора статистики изображений. Результаты представлены для следующих групп статистики изображений: (1) предельная статистика пиксельного распределения яркости, (2) параметры пространственной частоты, (3) параметры фильтра. Вся статистика Portilla и Simoncelli показала хорошие результаты при классификации высокой и низкой шероховатости и текстуры. Интересно, что даже «простая» пространственная частота и статистика пикселей также приводят к относительно хорошей классификации; они превосходят фильтры Портилья и Симончелли и статистику пикселей.
РИСУНОК 4. Точность классификатора статистики изображений. Заштрихованная область указывает порог p , полученный в результате теста на перестановку ( p <0,05, односторонний тест, 500 перестановок).
Шероховатость может быть хорошо классифицирована по параметрам Портилья и Симончелли, которые, конечно, отражают важные низкоуровневые аспекты (например, контраст), а также критический внешний вид текстуры (например, зернистость, отсутствие направленности).Однако информация о пространственной частоте работает даже лучше при прогнозировании высокой и низкой шероховатости.
Что касается текстуры, то все статистические данные изображения работают так же, как и для шероховатости, что указывает на то, что аналогичные функции могут использоваться для различения высокой и низкой текстуры и шероховатости. Это может быть связано с тем фактом, что хотя шероховатость и фактура являются разными понятиями, по крайней мере изображения, получившие низкую оценку по обоим свойствам, очень похожи, а именно гладкие поверхности без текстуры.
Твердость не была выше случайной. Это имеет смысл, потому что твердость сама по себе не имеет надлежащего визуального соотношения. Вместо этого факторы более высокого уровня, такие как восприятие категорий и обучение, вступают в игру в визуальном восприятии твердости.
Увидев, что одна пространственная частота достаточно хорошо влияет на свойства визуального материала, мы хотели исследовать, какие ориентированные поддиапазоны пространственной частоты лучше всего различают изображения с высоким и низким рейтингом. Поэтому мы провели t -тесты для сравнения групп с высоким и низким рейтингом в отношении энергии, содержащейся в каждом поддиапазоне управляемой пирамиды.Результаты этого анализа показаны на рисунке 5. Очевидно, что для шероховатости и текстуры элементы разрешения от средних до высоких частот содержат больше энергии, чем элементы с низким уровнем частот.
РИСУНОК 5. Сравнение поддиапазонов управляемой пирамиды между изображениями с высоким и низким рейтингом. Управляемая пирамида — это набор многомасштабных полосовых фильтров с разной ориентацией, охватывающих примерно одну октаву в полосе пропускания на каждой шкале. Пространственная частота увеличивается снизу вверх. Пространственная частота увеличивается снизу вверх, примерно от 0.От 07 до 4,6 циклов в сутки с логарифмическим шагом. Ориентация представляет собой ориентацию компонентов в спектре Фурье. Положительные значения t означают, что изображения с высоким рейтингом имеют больше энергии в этом поддиапазоне. Слева и справа от графика показаны примеры изображений, которые были правильно отнесены к группам с низким и высоким рейтингом соответственно. В качестве примеров мы выбрали изображения с наибольшей вероятностью принадлежности к соответствующей группе по оценке классификатора. Поскольку классификатор работает случайно для изображений с высоким и низким рейтингом твердости, изображения материалов здесь не отображаются.
Чтобы поверхности выглядели шероховатыми, они должны иметь более высокую мощность на средних и высоких пространственных частотах, в то время как появление текстуры требует энергии на низких и средних пространственных частотах. Однако, за исключением очень низких пространственных частот, изображения с высокими уровнями обоих свойств показывают более высокую мощность почти на всех частотах, кроме очень низких. Это имеет смысл, учитывая, что для обоих свойств изображения, получившие низкие оценки, были изображениями гладких однородных поверхностей, как показано в примерах изображений.
Очевидно, что различия в твердости очень малы и поэтому не могут быть учтены нашим классификатором.
Согласованность между MVPA и классификатором статистики изображений
Показав, что мы можем классифицировать свойства материала, используя статистику изображений и паттерны активации мозга, главный вопрос, конечно, заключается в том, действительно ли особенности, извлеченные нами при анализе изображений, используются зрительной корой головного мозга. Поэтому мы сравнили согласованность между классификатором статистики изображений и классификатором фМРТ с степенью согласованности, которую мы ожидаем от случайности на основе точности двух классификаторов.В частности, мы проверили, совпадают ли метки, которые два классификатора дали каждому отдельному изображению (высокий или низкий) чаще, чем ожидалось, и в предположении независимости между двумя классификаторами. Эта процедура похожа на подход вероятности выбора (Britten et al., 1996), который использовался для изучения взаимосвязи между активностью клеток и поведением, и вдохновлен им. Его, например, также применили Стоун и Краузлис (2003) для изучения того, управляются ли восприятие движения и глазодвигательные сигналы общими нейрональными субстратами.Оба этих подхода ищут общую дисперсию двух показателей, чтобы определить степень связи этих двух показателей. Мы использовали его, потому что нас интересовала связь между статистикой изображения и нейронным откликом.
Согласие между статистикой изображений и активацией мозга, конечно же, объясняется тем фактом, что и то, и другое нацелено на классификацию перцептивного суждения. Чтобы избежать этой проблемы, мы рассмотрели два полюса каждого свойства отдельно. Мы взяли, например, 21 изображение, на котором были обнаружены шероховатые поверхности, и подсчитали, сколько из них были классифицированы как грубые, используя статистику фильтров Портиллы и Симончелли или активацию мозга, в данном случае 14 и 16.2 (усредненных по 15 участникам) изображения. Основываясь на этих числах, мы затем вычислили (для каждого участника) согласованность, которую мы ожидали бы, если бы два классификатора были независимыми (в среднем по 15 участникам: 59%), и сравнили это с фактической согласованностью двух классификаторов (в среднем по участникам: 67%). %). Мы проделали такой же анализ для изображений с низким рейтингом, в данном случае сглаженных изображений. По сути, мы сравнили фактическое согласие с вероятностью, рассчитанной на основе точности классификации.Если согласие значительно выше, чем рассчитанный нами уровень вероятности, это указывает на то, что и то и другое может быть обусловлено одними и теми же основными факторами.
Обобщенные совпадения для каждой группы статистических данных изображений (столбцы показывают средние результаты для изображений с высоким и низким рейтингом) показаны на рисунке 6. Статистика фильтров Портиллы и Симончелли, а также статистика пространственной частоты показывают большую согласованность с MVPA, чем мы. ожидал бы от случая. Это указывает на то, что статистика изображения тесно связана с различиями в активации мозга, которые могут быть обнаружены MVPA.Оба показывают значительную согласованность шероховатости и текстуры, но не твердости. Это, однако, ожидаемо, поскольку MVPA показала случайную жесткость. Что касается текстуры, классификатор со статистикой пикселей показывает большее совпадение с метками, заданными MVPA, чем мы могли бы ожидать от случая. Это предполагает, что информация о пространственной частоте и статистика фильтров, а также статистика пикселей в градациях серого частично управляют паттернами дифференциального отклика для изображений с высоким и низким рейтингом в ранней зрительной коре.Мы проанализировали всю статистику пикселей по отдельности и обнаружили, что минимум и максимум влияют на классификацию.
РИСУНОК 6. Сводка фактического и ожидаемого совпадения двух классификаторов (статистика изображений и MVPA) для трех различных групп статистики изображений. Планки погрешностей указывают стандартные отклонения; звездочки указывают на статистическую значимость ( p <0,05).
Анализ прожектором
Поскольку классификация паттернов в визуально реагирующих вокселях и V1, V2 и V3 показала довольно похожие результаты, мы хотели более детально изучить, где информация о свойствах материала содержится в ЖИРНЫХ паттернах по всему мозгу.Результаты, полученные с помощью прожектора, приведены на Рисунке 7 и в Таблице 1. Результаты анализа с помощью прожектора подтверждают результаты анализа маски, показывая, что наилучшее различение может быть достигнуто по шероховатости и текстуре, особенно в областях раннего зрения. За пределами раннего вентрального потока мы не могли наблюдать значительную выше случайную точность классификации в пределах зрительной системы. Очевидно, что высокие и низкие оценки собственности лучше всего можно расшифровать из первых визуальных областей. Что касается твердости, мы не обнаружили значительной точности классификации в ранних визуальных областях.Вместо этого мы обнаружили вышеупомянутую случайную точность классификации в правой язычной извилине (полный список результатов маркировки см. В Таблице 1).
РИСУНОК 7. Результаты процедуры классификации прожектора целиком для различных свойств [ t (14) = 3,79, p <0,001]. Поперечные срезы на z = 7, 0, -7 и -14.
ТАБЛИЦА 1. Обзор значимых кластеров ( k > 5), идентифицированных с помощью прожектора.
Обсуждение
Наши результаты показывают, что информация о свойствах материала в значительной степени содержится в статистике изображений низкого уровня, и что эта статистика изображений может также отражаться в моделях активности мозга, вызванных изображениями материалов.
Статистика изображения
Анализ классификации статистики изображений показал, что высокие и низкие уровни шероховатости и текстуры могут быть очень хорошо декодированы с помощью функций модели текстуры Портилья и Симончелли.Модель дает впечатляющие результаты синтеза и, по-видимому, содержит набор функций, важных для восприятия (Balas, 2006). Он нацелен на описание текстур с точки зрения непространственной сводной статистики и, как было показано, имитирует ответы фильтра в V1 и вычисления, выполненные с этими ответами фильтра на более позднем этапе в ранней визуальной системе, предположительно в V2 (Freeman and Simoncelli , 2011; Freeman et al., 2013). Поэтому неудивительно, что он может улавливать аспекты восприятия свойств материала, даже если это ранее не было показано.
Что еще более удивительно, шероховатость и текстуру можно еще лучше классифицировать с помощью параметров пространственной частоты. Нойман и Гегенфуртнер (2006) смогли показать в своем исследовании, что статистика пространственной частоты может довольно хорошо предсказать воспринимаемое сходство естественных изображений, а Балас (2008) смог показать, что группировку естественных текстур участников можно даже лучше предсказать с помощью простого модель частотного спектра мощности, чем с моделью Портиллы и Симончелли. Это явно соответствует нашим результатам и особенно впечатляет, если учесть, что большинство изображений в наших группах с высоким и низким рейтингом не были крайними примерами соответствующего спектра свойств.Очевидно, пространственно-частотным характеристикам недостает сложности, чтобы исчерпывающе объяснить вычисления, выполняемые визуальной системой при извлечении материальной информации. Однако тот факт, что эти функции работают достаточно хорошо, указывает на то, что визуальная система может в некоторой степени полагаться на них, чтобы получить информацию о свойствах материала.
В последние годы было отмечено, что визуальная система, вероятно, полагается на наборы статистических данных инвариантного изображения или реплики, чтобы оценить свойства объекта и материала, вместо выполнения дорогостоящих вычислений для разработки физики визуальной сцены. (обзор см. в Fleming, 2014).Например, Ho et al. (2006, 2007) обнаружили, что угол освещения поверхности влияет на воспринимаемую шероховатость. Они объяснили это моделью, согласно которой угол освещения поверхности влияет на яркость и контраст, что затем приводит к изменению восприятия шероховатости, даже если участники смотрели на стимулы стереоскопически и, следовательно, имели доступную истинную трехмерную информацию. В рамках своей модели они определили признаки яркости и шероховатости, которые наблюдатели могли использовать для оценки шероховатости.Они пришли к выводу, что визуальная система в принципе может полагаться на такую простую статистику, как контраст, для оценки шероховатости материала. Точно так же пространственная частота была предложена в качестве еще одного возможного сигнала для восприятия свойств материала. Гизель и Заиди (2013) обнаружили, что восприятие волнистости, толщины и шероховатости трехмерных свойств материала можно систематически изменять, увеличивая или уменьшая энергию определенных пространственных частотных диапазонов на фотографии материала. Точные сигналы, основанные на изображениях, используемые зрительной системой, неизвестны, но из более ранних результатов и из результатов, представленных в этом исследовании, ясно, что мозг может полагаться на статистику, такую как моменты яркости и цветового распределения или пространственное распределение. частотная информация.Это похоже на эффективную эвристику.
Жесткость не может быть надежно декодирована с помощью нашей статистики изображений. В предыдущем исследовании мы могли показать, что наблюдатели могут делать точные суждения о твердости на основе визуальной информации (Baumgartner et al., 2013). Однако нет простой и понятной статистики, которая могла бы это объяснить. Оценка твердости без прикосновения может зависеть от сочетания восприятия, памяти и познания. Поэтому описанная статистика изображений мало помогает при расшифровке жесткости.
Представление свойств материала в головном мозге
В настоящем исследовании мы решили представить каждое изображение стимула только один раз. Мы сделали это из-за того, что у нас относительно большой пул изображений, а также потому, что мы хотели обеспечить, чтобы ЖИРНЫЙ ответ на предыдущее испытание существенно уменьшился до начала нового испытания. Kay et al. (2008) показали, что идентификация изображения возможна на основе единичных испытаний. Поэтому мы считаем наш подход верным. Мы даже считаем сильной стороной настоящего исследования то, что нам удалось расшифровать информацию об изображении в результате единичных испытаний.
Результаты ретинотопически определенных масок, а также те, которые получены при использовании прожекторного подхода, предполагают, что существует много информации о свойствах материала в ранних визуальных областях. Как показывают результаты анализа классификации статистики изображений, очень простая статистика изображений, в частности информация о яркости и пространственной частоте, а также параметры фильтра, определенные Портиллой и Симончелли, могут быть весьма информативными для определенных типов свойств материала.Их участие может быть движущей силой результатов классификатора в ранних визуальных областях. Это мнение подтверждается сравнением меток, присвоенных классификатором статистики изображений и MVPA. Эффект от этого анализа кажется умеренным, что, однако, ожидаемо, учитывая зашумленность данных фМРТ и тот факт, что каждое материальное изображение было видно только один раз каждым участником. В целом, наши результаты свидетельствуют в пользу участия низкоуровневой статистики изображений в восприятии материала.Это хорошо согласуется с Hiramatsu et al. (2011), которые обнаружили самую высокую точность классификации категорий материалов в V1 и V2. Несколько исследований, в которых изучалась нейронная основа восприятия поверхности / материала, показали, что задачи, связанные с восприятием зрительного материала, приводят к усилению активации в медиальных областях вентральной экстрастриарной коры, особенно в коллатеральной борозде и парагиппокампальной извилине (Newman et al. , 2005; Cant, Goodale, 2007, 2011; Cant et al., 2009; Cavina-Pratesi et al., 2010). Напротив, восприятие формы, как известно, связано с боковыми частями вентрального потока (Malach et al., 1995). Хотя эти исследования внесли существенный вклад в наше понимание корковых процессов во время восприятия различных визуальных характеристик, также совершенно очевидно, что задача понимания восприятия свойств материала является сложной и требует детального рассмотрения. Nishio et al. (2012) в исследовании одноклеточной записи могли показать, что воспринимаемый уровень глянца, независимо от формы, материала или источника света, кодируется нейронами в нижней височной доле — другими словами, в области относительно высоко в иерархия визуальной обработки.Однако в недавнем исследовании с помощью фМРТ, которое также изучало восприятие блеска у обезьян, Okazawa et al. (2012) обнаружили более высокие BOLD-сигналы во всем вентральном потоке (от V1 до нижней височной доли) в ответ на глянцевые объекты (по сравнению с матовыми или зашифрованными объектами).
Это расхождение в результатах двух исследований еще раз демонстрирует, что важно не только смотреть на восприятие материалов, но и принимать во внимание информацию, основанную на изображениях, и ее распространение через зрительную систему.Однако до сих пор ни одно исследование мозга не рассматривало дифференцированную обработку отдельных свойств материала и особенно основанных на изображениях функций, на которые опирается мозг. В настоящем исследовании мы смогли показать тесное соответствие между статистикой изображений низкого уровня, активностью мозга в ранних визуальных областях и восприятием. Наши результаты показывают, что статистика изображений низкого уровня отражается в моделях активности мозга, вызванных изображениями материалов. Это подтверждает и расширяет результаты Hiramatsu et al. (2011), которые умно продемонстрировали, что представление визуализированных поверхностей материала меняется от представления, основанного на статистике изображений в ранних визуальных областях, до такого, которое подчеркивает сходство восприятия между материалами в более высоких областях вентральный путь.
Кроме того, высокая точность классификации, которая может быть достигнута с помощью некоторых наших низкоуровневых статистических данных по изображениям, предполагает, что они могут напрямую влиять на восприятие материалов. В принципе, визуальная система могла бы полагаться на эту статистику изображений, чтобы получить первое представление о визуальном входе, аналогично «сути», которая была предложена для управления обработкой сцены (Oliva and Schyns, 2000; Torralba and Oliva, 2003). Например, было показано, что статистика изображений влияет на восприятие глянца (Motoyoshi et al., 2007; Wiebel et al., 2015), но в то же время они по-прежнему оставляют открытые вклады аспектов стимулов более высокого уровня (Kim and Anderson, 2010; Kim et al., 2011; Marlow et al., 2011).
Результаты для наших двух «визуальных» свойств, шероховатости и текстуры, очень похожи как с точки зрения классификатора статистики изображений, так и классификатора MVPA. Когда мы обучили классификатор MVPA по шероховатости, он также мог декодировать текстуру выше случайности, и наоборот. Очевидно, что на этом низком уровне невозможно различить два свойства.Учитывая результаты классификатора статистики изображений, который работал одинаково для двух свойств, это неудивительно. Очевидно, должны быть более сложные вычисления, которые позже могут более детально оценивать материалы, выполняемые в более высоких визуальных областях. Такие вычисления могут, например, учитывать трехмерную информацию для определения шероховатости поверхности или доступа к тактильным представлениям поверхности (Goda et al., 2016). Таким образом, даже несмотря на то, что статистика низкого уровня, а именно статистика пикселей, параметры фильтра и информация о пространственной частоте, кажется, играют роль в восприятии материала, области среднего и высокого уровня визуальной системы должны участвовать в восприятии свойств материала.Так почему же мы наблюдаем вышеупомянутую точность классификации в ранних визуальных областях? Все более сложная обработка и большие размеры рецептивного поля и, следовательно, размытая ретинотопия в областях выше вентрального потока может сделать эти узоры менее надежными для декодирования свойств материала. Несмотря на то, что Hiramatsu et al. (2011) обнаружили, что представление материалов лучше соответствует воспринимаемому сходству изображений, они также обнаружили наивысшую точность классификации в самых ранних областях.Кроме того, в нашем случае довольно сложно сказать, что участники на самом деле делали в сканере при просмотре материалов, поэтому обработка выше в визуальном потоке могла быть предметом некоторых различий между участниками и испытаниями. Но обратите внимание, что анализ твердости с помощью прожектора дал выше случайной точности в передней язычной извилине. Было высказано предположение, что вентромедиальные области зрительной системы имеют решающее значение для восприятия текстуры и материала (Cant and Goodale, 2007, 2011; Jacobs et al., 2014), поэтому мы считаем вероятным, что этот результат отражает более сложные вычисления, связанные с материалами.
Ограничения и перспективы
Мы осознаем, что с нынешними корреляционными данными мы не можем в конечном итоге сделать вывод, что наша статистика изображений вызывает восприятие свойств материала или что восприятие определенных свойств материала является причиной исключительной точности классификации. Однако наши данные обеспечивают прочную связь между простой статистикой изображений и активностью мозга в ответ на материальные изображения.Низкоуровневые аспекты изображений содержат информацию, которая зависит от оценок свойств материала.
Есть также несколько дополнительных ограничений нашего исследования, которые вызваны его исследовательским характером. И набор стимулов, и набор свойств, конечно, ограничены. Наш выбор был в основном мотивирован идеей связать эти эксперименты с нашими предыдущими исследованиями с использованием тех же стимулов. Первоначально мы выбрали свойство «текстура», потому что стремились к чисто визуальному свойству.Однако есть различие между визуальной текстурой и текстурой поверхности (Bergen and Landy, 1991), которое наши участники, похоже, не заметили в своих оценках. Об этом также свидетельствует общая высокая корреляция между результатами по текстуре и шероховатости. Вероятно, это также вызвано нашим ограниченным набором стимулов, который не содержал много текстурированных, то есть узорчатых поверхностей.
Наш набор стимулов также ограничен в отношении плоского монтажа наших материалов. Мы специально выбрали плоские стимулы, потому что хотели устранить вариативность из-за формы и ограничиться поверхностными сигналами.В будущих исследованиях с этим можно было бы справиться по-другому.
Кроме того, рейтинговая задача, которую мы выбрали для наших участников в сканере, немного проблематична в отношении вариаций, которые она, вероятно, вызвала у наших участников. Им было поручено обратить внимание на материалы и их свойства. Мы не применяли задачу фиксации, потому что мы также хотели изучить возможные эффекты высокоуровневой обработки материала.
В будущем эту работу следует продолжить с параметрически модулированными стимулами, чтобы преодолеть ограничения нашего корреляционного подхода и найти доказательства причинной связи между статистикой изображения низкого уровня и восприятием материала.
Заключение
Чтобы мы могли воспринимать материалы со всеми их свойствами, в мозгу должно происходить взаимодействие различных сложных вычислений. Как мы могли показать здесь, довольно простая статистика изображения и низкоуровневые функции изображения содержат много информации о различных свойствах материала и, кажется, способствуют их нейронной обработке.
Авторские взносы
EB и KG разработали эксперимент и написали рукопись, EB собрал и проанализировал данные.
Заявление о конфликте интересов
Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.
Благодарности
Работа поддержана грантом КГ DFG 879/9. Мы благодарны Кате Дёршнер и Хусейну Боячи за комментарии к более ранней версии этой рукописи и Бенджамину де Хаасу за советы по ретинотопии.
Сноски
- http: // www.allpsych.uni-giessen.de/MID/.
- http://www.cns.nyu.edu/∼lcv/texture/
- http://www.mathworks.com
Список литературы
Балас Б. (2008). Внимательное сходство текстур как задача категоризации: сравнение моделей синтеза текстур. Распознавание образов. 41, 972–982. DOI: 10.1016 / j.patcog.2007.08.007
CrossRef Полный текст | Google Scholar
Балас, Б. Дж. (2006). Синтез и восприятие текстуры: использование вычислительных моделей для изучения представления текстуры в зрительной системе человека. Vision Res. 46, 299–309. DOI: 10.1016 / j.visres.2005.04.013
CrossRef Полный текст | Google Scholar
Баннерт М. М., Бартельс А. (2013). Расшифровка желтого цвета серого банана. Curr. Биол. 23, 2268–2272. DOI: 10.1016 / j.cub.2013.09.016
CrossRef Полный текст | Google Scholar
Баумгартнер, Э., Вибель, К. Б., и Гегенфуртнер, К. Р. (2013). Визуальное и тактильное представление свойств материала. Мультисенс. Res. 26, 429–455.DOI: 10.1163 / 22134808-00002429
CrossRef Полный текст | Google Scholar
Баумгартнер, Э., Вибель, К. Б., и Гегенфуртнер, К. Р. (2015). Сравнение тактильного восприятия материала слепыми и зрячими. Vision Res. 115 (Pt B), 157–162. DOI: 10.1016 / j.visres.2015.02.006
CrossRef Полный текст | Google Scholar
Берген, Дж. Р., и Лэнди, М. С. (1991). «Вычислительное моделирование разделения визуальной текстуры», в Computational Models of Visual Processing , eds M.С. Лэнди и Дж. А. Мовшон (Бостон, Массачусетс, Массачусетский технологический институт), 253.
Google Scholar
Бриттен К. Х., Ньюсом У. Т., Шадлен М. Н., Келебрини С. и Мовшон Дж. А. (1996). Связь между поведенческим выбором и зрительными реакциями нейронов в МТ макака. Vis. Neurosci. 13, 87–100. DOI: 10.1017 / S095252380000715X
CrossRef Полный текст | Google Scholar
Кант, Дж. С., Арнотт, С. Р., Гудейл, М. А. (2009). ФМР-адаптация выявляет отдельные области обработки визуальной формы и текстуры в вентральном потоке человека. Exp. Brain Res. 192, 391–405. DOI: 10.1007 / s00221-008-1573-8
CrossRef Полный текст | Google Scholar
Кант, Дж. С., Гудейл, М. А. (2007). Внимание к форме или свойствам поверхности модулирует различные области затылочно-височной коры человека. Cereb. Cortex 17, 713–731. DOI: 10.1093 / cercor / bhk022
CrossRef Полный текст | Google Scholar
Кант, Дж. С., Гудейл, М. А. (2011). Царапины под поверхностью: новое понимание функциональных свойств латеральной затылочной области и парагиппокампа. J. Neurosci. 31, 8248–8258. DOI: 10.1523 / JNEUROSCI.6113-10.2011
CrossRef Полный текст | Google Scholar
Кавина-Пратеси, К., Кентридж, Р. В., Хейвуд, К. А., и Милнер, А. Д. (2010). Отдельные каналы для обработки формы, текстуры и цвета: свидетельства адаптации фМРТ и агнозии визуальных объектов. Cereb. Cortex 20, 2319–2332. DOI: 10.1093 / cercor / л.с. 298
CrossRef Полный текст | Google Scholar
де Хаас, Б., Шварцкопф, Д.С., Урнер М., Риз Г. (2013). Слуховая модуляция кодирования зрительных стимулов в ретинотопной коре головного мозга человека. Neuroimage 70, 258–267. DOI: 10.1016 / j.neuroimage.2012.12.061
CrossRef Полный текст | Google Scholar
Флеминг, Р. У. (2014). Визуальное восприятие материалов и их свойств. Vision Res. 94, 62–75. DOI: 10.1016 / j.visres.2013.11.004
CrossRef Полный текст | Google Scholar
Флеминг Р. В., Якель Ф. и Мэлони Л.Т. (2011). Визуальное восприятие толстых прозрачных материалов. Psychol. Sci. 22, 812–820. DOI: 10.1177 / 0956797611408734
CrossRef Полный текст | Google Scholar
Флеминг, Р. В., Вибель, К. Б., и Гегенфурнер, К. Р. (2013). Перцептивные качества и материальные классы. J. Vis. 13: 9. DOI: 10.1167 / 13.8.9
CrossRef Полный текст | Google Scholar
Фриман, Дж., И Симончелли, Э. П. (2011). Метамеры брюшного потока. Nat.Neurosci. 14, 1195–1201. DOI: 10.1038 / nn.2889
CrossRef Полный текст | Google Scholar
Фриман, Дж., Зиемба, К. М., Хигер, Д. Дж., Симончелли, Э. П., и Мовшон, Дж. А. (2013). Функциональная и перцепционная подпись второй зрительной области у приматов. Nat. Neurosci. 16, 974–981. DOI: 10.1038 / nn.3402
CrossRef Полный текст | Google Scholar
Года, Н., Татибана, А., Окадзава, Г., и Комацу, Х. (2014). Представление материальных свойств объектов в зрительной коре головного мозга нечеловеческих приматов. J. Neurosci. 34, 2660–2673. DOI: 10.1523 / JNEUROSCI.2593-13.2014
CrossRef Полный текст | Google Scholar
Года, Н., Ёкои, И., Татибана, А., Минамимото, Т., и Комацу, Х. (2016). Кроссмодальная ассоциация визуальных и тактильных материальных свойств объектов вентральной зрительной коры головного мозга обезьян. Curr. Биол. 26, 928–934. DOI: 10.1016 / j.cub.2016.02.003
CrossRef Полный текст | Google Scholar
Хирамацу, К., Года, Н., и Комацу, Х.(2011). Преобразование от визуального к перцептивному представлению материалов вдоль вентрального зрительного пути человека. Neuroimage 57, 482–494. DOI: 10.1016 / j.neuroimage.2011.04.056
CrossRef Полный текст | Google Scholar
Хо, Ю. X., Лэнди, М. С., и Мэлони, Л. Т. (2006). Как направление освещения влияет на визуально воспринимаемую шероховатость поверхности. J. Vis. 6, 634–648. DOI: 10.1167 / 6.5.8
CrossRef Полный текст | Google Scholar
Хо, Ю.X., Мэлони, Л. Т., и Лэнди, М. С. (2007). Влияние точки зрения на воспринимаемую визуальную грубость. J. Vis. 7: 1. DOI: 10.1167 / 7.1.1
CrossRef Полный текст | Google Scholar
Джейкобс, Р. Х. А., Баумгартнер, Э., Гегенфуртнер, К. Р. (2014). Представление материальных категорий в мозгу. Фронт. Psychol. 5: 146. DOI: 10.3389 / fpsyg.2014.00146
CrossRef Полный текст | Google Scholar
Кей, К. Н., Населарис, Т., Пренгер, Р.Дж. И Галлант Дж. Л. (2008). Выявление естественных изображений по активности человеческого мозга. Природа 452, 352–355. DOI: 10.1038 / nature06713
CrossRef Полный текст | Google Scholar
Ким, Дж., И Андерсон, Б. Л. (2010). Статистика изображения и восприятие блеска и легкости поверхности. J. Vis. 10: 3. DOI: 10.1167 / 10.9.3
CrossRef Полный текст | Google Scholar
Ким, Дж., Марлоу, П. Дж., И Андерсон, Б. Л. (2011). Восприятие блеска зависит от соответствия светового пятна оттенку поверхности. J. Vis. 11: 4. DOI: 10.1167 / 11.9.4
CrossRef Полный текст | Google Scholar
Kriegeskorte, N., Goebel, R., and Bandettini, P. (2006). Функциональное картирование мозга на основе информации. Proc. Natl. Акад. Sci. США 103, 3863–3868. DOI: 10.1073 / pnas.0600244103
CrossRef Полный текст | Google Scholar
Малах Р., Реппас Дж. Б., Бенсон Р. Р., Квонг К. К., Цзян Х., Кеннеди В. А. и др. (1995). Объектная активность, выявленная с помощью функциональной магнитно-резонансной томографии в затылочной коре головного мозга человека. Proc. Natl. Акад. Sci. США 92, 8135–8139. DOI: 10.1073 / pnas.92.18.8135
CrossRef Полный текст | Google Scholar
Марлоу, П. Дж., Ким, Дж., И Андерсон, Б. Л. (2011). Роль яркости и ориентации в восприятии блеска поверхности. J. Vis. 11, 1–12. DOI: 10.1167 / 11.9.16
CrossRef Полный текст | Google Scholar
Марлоу, П. Дж., Ким, Дж., И Андерсон, Б. Л. (2012). Восприятие и неправильное восприятие зеркального отражения. Curr. Биол. 22, 1909–1913. DOI: 10.1016 / j.cub.2012.08.009
CrossRef Полный текст | Google Scholar
Мотоёси И., Нисида С., Шаран Л. и Адельсон Э. Х. (2007). Статистика изображения и восприятие качества поверхности. Природа 447, 206–209. DOI: 10.1038 / nature05724
CrossRef Полный текст | Google Scholar
Нойманн, Д., Гегенфуртнер, К. Р. (2006). Поиск изображения и перцептивное сходство. ACM Trans. Прил.Восприятие. 3, 31–47. DOI: 10.1145 / 1119766.1119769
CrossRef Полный текст | Google Scholar
Ньюман, С. Д., Клацки, Р. Л., Ледерман, С. Дж., И Джаст, М. А. (2005). Воображение материала против геометрических свойств объектов: исследование фМРТ. Cogn. Brain Res. 23, 235–246. DOI: 10.1016 / j.cogbrainres.2004.10.020
CrossRef Полный текст | Google Scholar
Нисида, С., Шинья, М. (1998). Использование информации, основанной на изображении, при оценке свойств отражательной способности поверхности. J. Opt. Soc. Являюсь. Опт. Image Sci. Vis. 15, 2951–2965. DOI: 10.1364 / JOSAA.15.002951
CrossRef Полный текст | Google Scholar
Нишио А., Года Н. и Комацу Х. (2012). Нейронная селективность и представление блеска в нижней височной коре обезьяны. J. Neurosci. 32, 10780–10793. DOI: 10.1523 / JNEUROSCI.1095-12.2012
CrossRef Полный текст | Google Scholar
Окадзава Г., Года Н. и Комацу Х. (2012). Селективные ответы на зеркальные поверхности в зрительной коре макака, выявленные с помощью фМРТ. Neuroimage 63, 1321–1333. DOI: 10.1016 / j.neuroimage.2012.07.052
CrossRef Полный текст | Google Scholar
Олдфилд, Р. К. (1971). Оценка и анализ руки: Эдинбургская описи. Neuropsychologia 9, 97–113. DOI: 10.1016 / 0028-3932 (71)
-4CrossRef Полный текст | Google Scholar
Олива А. и Шинс П. Г. (2000). Диагностические цвета опосредуют распознавание сцены. Cogn. Psychol. 41, 176–210.DOI: 10.1006 / cogp.1999.0728
CrossRef Полный текст | Google Scholar
Портилла, Дж., И Симончелли, Э. П. (1999). «Моделирование и синтез текстур с использованием совместной статистики комплексных вейвлет-коэффициентов», в материалах Proceedings of the IEEE Workshop on Statistical and Computational Theories of Vision , Fort Collins, CO.
Google Scholar
Портилла, Дж., И Симончелли, Э. П. (2000). Параметрическая модель текстуры, основанная на совместной статистике комплексных вейвлет-коэффициентов. Внутр. J. Comput. Vis. 40, 49–71. DOI: 10.1023 / A: 1026553619983
CrossRef Полный текст | Google Scholar
Рао А. Р. и Лозе Г. Л. (1996). На пути к системе именования текстур: определение соответствующих размеров текстуры. Видение. Res. 36, 1649–1669. DOI: 10.1016 / 0042-6989 (95) 00202-2
CrossRef Полный текст | Google Scholar
Simoncelli, E. P., Freeman, W. T., Adelson, E. H., and Heeger, D. J. (1992). Изменяемые многомасштабные преобразования. IEEE Trans. Инф. Теория 38, 587–607. DOI: 10.1109 / 18.119725
CrossRef Полный текст | Google Scholar
Simoncelli, E. P., and Portilla, J. (1998). «Характеристика текстуры посредством совместной статистики величин вейвлет-коэффициентов», в материалах Труды 5-й Международной конференции IEEE по обработке изображений , Чикаго, Иллинойс. DOI: 10.1109 / icip.1998.723417
CrossRef Полный текст | Google Scholar
Стоун, Л. С., Краузлис, Р. Дж.(2003). Общие сигналы движения для человеческих решений восприятия и глазодвигательных действий. J. Vis. 3, 725–736. DOI: 10.1167 / 3.11.7
CrossRef Полный текст | Google Scholar
Сан, Х. К., Бан, Х., Ди Лука, М., Уэлчман, А. Э. (2015). Данные фМРТ для областей, которые обрабатывают поверхностный блеск в зрительной коре головного мозга человека. Видение. Res. 109, 149–157. DOI: 10.1016 / j.visres.2014.11.012
CrossRef Полный текст | Google Scholar
Сан, Х. К., Велчман, А.Э., Чанг, Д. Х., и Ди Лука, М. (2016). Смотри, но не трогай: визуальные подсказки к структуре поверхности управляют соматосенсорной корой. Нейроизображение 128, 353–361. DOI: 10.1016 / j.neuroimage.2015.12.054
CrossRef Полный текст | Google Scholar
Торральба А. и Олива А. (2003). Статистика категорий натуральных изображений. Сеть 14, 391–412. DOI: 10.1088 / 0954-898X_14_3_302
CrossRef Полный текст | Google Scholar
Вибель, К., Тоскани, М., и Гегенфуртнер, К. Р. (2015). Статистические корреляты воспринимаемого блеска на естественных изображениях. Видение. Res. 115 (Pt B), 175–187. DOI: 10.1016 / j.visres.2015.04.010
CrossRef Полный текст | Google Scholar
Статистика изображения для восприятия материала
https://doi.org/10.1016/j.cobeha.2019.07.003Получение прав и контентаОсновные моменты
- •
В статистику изображений включены полезные подсказки для восприятия материала.
- •
Повышенная насыщенность цвета является характеристикой восприятия влажности поверхности.
- •
Уменьшенные яркостные контрасты формируют перцептивную особенность тонкости субразрешения.
- •
Восприятие материала и формы зависит от независимых характеристик изображения.
Для оценки свойств материала решение обратной оптики обычно слишком сложно. Человеческое восприятие материала, по-видимому, полагается на характеристики изображения, которые коррелируют со свойствами материала в естественной среде просмотра. Критические характеристики часто принимают форму статистики изображения, потому что многие свойства материалов могут быть охарактеризованы тем, как они оптически модулируют статистику естественного изображения.Например, критически важной статистикой изображения для восприятия влажности поверхности является улучшенная насыщенность цвета, а для восприятия тонкости субразрешения — уменьшение яркостных контрастов. Существуют оптические причины, по которым эти характеристики изображения различаются в зависимости от физических свойств материала, а также психофизические доказательства того, что человеческое восприятие материала действительно реагирует на эти особенности. То, что форма (асимметрия) гистограммы яркости сильно влияет на восприятие материала поверхности (блеска), но не на восприятие формы поверхности, предполагает, что восприятие материала и формы может зависеть от независимых характеристик изображения — восприятие материала (отражения поверхности) зависит от величины яркости. градиент, в то время как восприятие формы зависит от порядка градиента яркости.Я также обсуждаю достоинства и недостатки статистики изображений по отношению к характеристикам восприятия среднего уровня и функциям глубоких нейронных сетей.
Рекомендуемые статьиЦитирующие статьи (0)
© 2019 Автор. Опубликовано Elsevier Ltd.
Рекомендуемые статьи
Цитирующие статьи
Визуальные свойства и запоминание сцен: эффекты разреженности и однородности пространства изображений
Андерман, Н., и Бауэрс, Дж. С. (2015). Подробные и содержательные визуальные воспоминания забываются с одинаковой скоростью в течение недели. Psychonomic Bulletin & Review, 22 (5), 1358–1363. DOI: 10.3758 / s13423-015-0800-0
Артикул Google ученый
Бейнбридж У. А., Изола П. и Олива А. (2013). Внутренняя запоминаемость фотографий лиц. Журнал экспериментальной психологии: Общие, 142 (4), 1323–1334. DOI: 10.1037 / a0033872
Артикул Google ученый
Барр, Д.Дж., Леви, Р., Шиперс, К., и Тили, Х. Дж. (2013). Структура случайных эффектов для подтверждающей проверки гипотез: Держите максимум. Журнал памяти и языка, 68 (3), 255–278. DOI: 10.1016 / j.jml.2012.11.001
Артикул Google ученый
Бейтс Д., Мехлер М., Болкер Б. и Уокер С. (2015). Подгонка линейных моделей смешанных эффектов с использованием lme4. Журнал статистического программного обеспечения, 67 (1), 1–48.DOI: 10.18637 / jss.v067.i01
Брэди, Т. Ф., Конкл, Т., Альварес, Г. А., и Олива, А. (2008). Зрительная долговременная память имеет огромную емкость для хранения деталей объекта. Proceedings of the National Academy of Sciences, 105 (38), 14325–14329. DOI: 10.1073 / pnas.08033
Артикул Google ученый
Брэди, Т. Ф., Конкл, Т., Гилл, Дж., Олива, А., & Альварес, Г.А. (2013). Долговременная зрительная память имеет тот же предел точности, что и зрительная рабочая память. Психологическая наука, 24 (6), 981–990.
Былнский, З., Изола, П., Бейнбридж, К., Торральба, А., & Олива, А. (2015). Внутренние и внешние эффекты на запоминаемость изображения. Vision Research, 116, 165–178. DOI: 10.1016 / j.visres.2015.03.005
Артикул PubMed Google ученый
Cichy, R.М., Хосла А., Пантазис Д., Торральба А. и Олива А. (2016). Сравнение глубоких нейронных сетей с пространственно-временной корковой динамикой распознавания визуальных объектов человека выявляет иерархическое соответствие. Научные отчеты , 6 (27755). 10.1038 / srep27755
Cichy, R.M, Khosla, A., Pantazis, D., & Oliva, A. (2017). Динамика представлений сцен в мозгу человека, выявленная с помощью магнитоэнцефалографии и глубоких нейронных сетей. NeuroImage, 153, 346–358. DOI: 10.1016 / j.neuroimage.2016.03.063
Артикул Google ученый
Кортер, Дж. Э. и Глюк, М. А. (1992). Объяснение основных категорий: предсказуемость характеристик и информация. Психологический бюллетень, 111 (2), 291–303. DOI: 10.1037 / 0033-2909.111.2.291
Артикул Google ученый
Айзенк, М.W. (1979). Глубина, проработка и самобытность. В Л. С. Чермак и Ф. И. М. Крейк (ред.), Уровни обработки в человеческой памяти (стр. 89–118). Хиллсдейл: Эрлбаум.
Google ученый
Грин М. Р., Ботрос А. П., Бек Д. М. и Фей-Фей Л. (2015). Вы видите то, что ожидаете: быстрое понимание сцены выигрывает от предыдущего опыта. Внимание, восприятие и психофизика, 77 (4), 1239–1251.DOI: 10.3758 / s13414-015-0859-8
Артикул Google ученый
Изола П., Сяо Дж., Торральба А. и Олива А. (2011). Что делает изображение запоминающимся? Конференция IEEE по компьютерному зрению и распознаванию образов , 145–152. 10.1109 / CVPR.2011.5995721
Хосла А., Раджу А. С., Торральба А. и Олива А. (2015). Понимание и прогнозирование запоминаемости изображений в больших масштабах.В материалах Труды Международной конференции IEEE по компьютерному зрению (стр. 2390–2398).
Конкл Т., Брэди Т. Ф., Альварес Г. А. и Олива А. (2010a). Концептуальная различимость поддерживает детальную визуальную долговременную память о реальных объектах. Журнал экспериментальной психологии: Общие, 139 (3), 558–578. DOI: 10.1037 / a0019165
Артикул Google ученый
Конкле, Т., Брэди, Т. Ф., Альварес, Г. А., и Олива, А. (2010b). Память сцен более детализирована, чем вы думаете: роль категорий в долговременной зрительной памяти. Психологическая наука, 21 (11), 1551–1556. DOI: 10.1177 / 0956797610385359
Крижевский А., Суцкевер И., & Хинтон Г. Э. (2012). Классификация ImageNet с глубокими сверточными нейронными сетями. В Ф. Перейре, К. Дж. С. Берджесе, Л. Ботту и К. К. Вайнбергере (ред.), Advances in Neural Information Processing Systems (стр.1097–1105). Curran Associates, Inc.
Кузнецова А., Брокхофф П. Б. и Кристенсен Р. Х. Б. (2014). lmerTest: Тесты в линейных моделях со смешанными эффектами. Получено с https://CRAN.R-project.org/package=lmerTest.
Максфилд, Дж. Т., Сталдер, В. Д., & Зелинский, Г. Дж. (2014). Влияние типичности цели на категориальный поиск. Журнал видения , 14 (1). 10.1167 / 14.12.1
Менг, М., И Поттер, М.С. (2008). Обнаружение и запоминание изображений с визуальным шумом и без него. Journal of Vision, 8 (9), 7–7. DOI: 10.1167 / 8.9.7
Артикул PubMed PubMed Central Google ученый
Нэрн, Дж. С. (2006). Особенности моделирования: последствия для общей теории памяти. В Р. Р. Хант и Дж. Уортен (ред.), Самобытность и память (стр. 27–46).Нью-Йорк: Издательство Оксфордского университета.
Google ученый
Nijboer, T. C. W., Kanai, R., de Haan, E. H. F., & van der Smagt, M. J. (2008). Узнавать лес, но не деревья: влияние цвета на восприятие и узнавание сцены. Сознание и познание, 17 (3), 741–752. DOI: 10.1016 / j.concog.2007.07.008
Артикул PubMed Google ученый
Олива, А., И Шинс, П. Г. (2000). Диагностические цвета опосредуют распознавание сцены. Когнитивная психология, 41 (2), 176–210. DOI: 10.1006 / cogp.1999.0728
Артикул PubMed Google ученый
Олива, А., и Торральба, А. (2001). Моделирование формы сцены: целостное представление пространственной оболочки. Международный журнал компьютерного зрения, 42 (3), 145–175. DOI: 10.1023 / A: 1011139631724
R Основная команда.(2016). R: Язык и среда для статистических вычислений . Вена, Австрия: Фонд R для статистических вычислений.
Разавиан, А.С., Азизпур, Х., Салливан, Дж., И Карлссон, С. (2014). Стандартные возможности CNN: потрясающая база для признания. В Протоколе Труды I.E. Конференция по компьютерному зрению и распознаванию образов, семинары (стр. 512–519). Вашингтон, округ Колумбия, США: Компьютерное общество IEEE. 10.1109 / CVPRW.2014.131
Рош, Э.(1978). Принципы категоризации. В Е. Рош и Б. Б. Ллойд (ред.), Познание и категоризация (стр. 189–206). Хиллсдейл: Эрлбаум.
Google ученый
Рош, Э., Мервис, К. Б., Грей, В. Д., Джонсон, Д. М., и Бойс-Брем, П. (1976). Основные объекты в природных категориях. Когнитивная психология, 8 (3), 382–439. DOI: 10.1016 / 0010-0285 (76)-X
Артикул Google ученый
Стоячий, Л.(1973). Выучить 10 000 картинок. Ежеквартальный журнал экспериментальной психологии, 25 (2), 207–222. DOI: 10.1080 / 14640747308400340
Артикул PubMed Google ученый
Стэндинг, Л., Конезио, Дж., И Хабер, Р. Н. (1970). Восприятие и память на картинки: однократное обучение 2500 визуальных стимулов. Психономическая наука, 19 (2), 73–74. DOI: 10.3758 / BF03337426
Артикул Google ученый
Станислав, Х., & Тодоров, Н. (1999). Расчет мер теории обнаружения сигналов. Методы исследования поведения, приборы и компьютеры, 31 (1), 137–149. DOI: 10.3758 / BF03207704
Артикул Google ученый
Валентайн Т. (1991). Единый отчет о влиянии различения, инверсии и расы при распознавании лиц. Ежеквартальный журнал экспериментальной психологии, раздел A, 43 (2), 161–204.DOI: 10.1080 / 1464074
00966Артикул Google ученый
Ван Руллен Р. (2017). Наука о восприятии в эпоху глубоких нейронных сетей. Границы психологии , 8 . 10.3389 / fpsyg.2017.00142
Фогт, С., и Магнуссен, С. (2007). Долговременная память на 400 картинок на общую тему. Экспериментальная психология, 54 (4), 298–303.DOI: 10.1027 / 1618-3169.54.4.298
Восс, Дж. Л. (2009). Объем долговременной ассоциативной памяти человека. Psychonomic Bulletin & Review, 16 (6), 1076–1081. DOI: 10.3758 / PBR.16.6.1076
Артикул Google ученый
Уотьер, Н., и Коллин, К. (2012). Влияние различимости на память и метапамять для ассоциаций имени и лица. Память, 20 (1), 73–88.DOI: 10.1080 / 09658211.2011.637935
Артикул PubMed Google ученый
Чжоу, Б., Лапедриса, А., Сяо, Дж., Торральба, А., и Олива, А. (2014). Изучение глубоких функций для распознавания сцен с использованием базы данных PLACES. Достижения в системах обработки нейронной информации, 27, 487–495.
Статистика изображения и представление свойств материала в Visual Cortex
Abstract
Мы исследовали воспринимаемые свойства материала (шероховатость, текстуру и твердость) с помощью нового подхода, который сравнивает восприятие, статистику изображения и активацию мозга, измеренную с помощью фМРТ.Сначала мы попросили участников оценить 84 изображения материала в соответствии с вышеупомянутыми свойствами, а затем отсканировали 15 участников с помощью фМРТ, пока они просматривали изображения материалов. Изображения были проанализированы с помощью набора статистики изображений, фиксирующего их пространственную частоту и свойства текстуры. Затем линейные классификаторы были применены к статистике изображений, а также к воксельным моделям визуально чувствительных вокселей и ранних визуальных областей, чтобы различать изображения с высокими и низкими оценками восприятия.Шероховатость и текстуру можно классифицировать выше вероятностного уровня на основе статистики изображения. Шероховатость и текстуру также можно было классифицировать на основе паттернов активации мозга в зрительной коре, тогда как твердость — нет. Важно отметить, что согласие в классификации, основанной на статистике изображений и активации мозга, также было выше случайного. Наши результаты показывают, что информация о свойствах визуального материала в значительной степени содержится в статистике изображений низкого уровня, и что эта статистика изображений также частично отражается в моделях активности мозга, вызванных восприятием материальных изображений.
Ключевые слова: фМРТ, восприятие материала, свойства материала, статистика изображения, MVPA
Введение
Восприятие свойств материала и поверхности имеет решающее значение для многих аспектов нашего взаимодействия с окружающей средой, но до сих пор у нас есть только ограниченные возможности. понимание того, как это достигается. Например, еще не совсем понятно, как мозг может быстро и успешно различать гладкий, скользкий предмет и грубый, который обеспечит хороший захват.Поскольку нейронные процессы, лежащие в основе таких суждений, в значительной степени неизвестны, мы решили исследовать вопрос, как материальные свойства представлены в зрительной системе мозга. В частности, мы исследовали, на какие функции изображения мозг может полагаться при обработке свойств материала и где в мозге можно декодировать информацию о свойствах материала.
В психофизических исследованиях материальное восприятие привлекает все большее внимание в последние годы. Было указано, что визуальная система, вероятно, полагается на наборы статистических данных инвариантного изображения или реплики для оценки свойств объекта и материала вместо выполнения дорогостоящих вычислений для разработки физики визуальной сцены (Нисида и Шинья, 1998; Motoyoshi et al., 2007; Флеминг и др., 2011; Марлоу и др., 2011, 2012; Гизель и Заиди, 2013; обзор см. в Fleming, 2014). Например, было показано, что информация о пространственной частоте (Giesel and Zaidi, 2013) или асимметрия гистограммы яркости (Motoyoshi et al., 2007) влияют на восприятие свойств материала. Однако неясно, как эта статистика изображений действует на нейрональную основу. Предыдущие исследования с помощью фМРТ по восприятию текстуры и материала показали, что задачи, связанные с восприятием визуального материала, такие как различение текстуры или категоризация материала, приводят к усилению активации в медиальных областях вентральной экстрастриарной коры у людей-наблюдателей (Newman et al., 2005; Кант и Гудейл, 2007, 2011; Cant et al., 2009; Jacobs et al., 2014). Было проведено очень мало работ по нейронной обработке отдельных свойств материала, за исключением блеска (обезьяны: Nishio et al., 2012, люди: Sun et al., 2015). Совсем недавно Sun et al., 2016) показали, что зрительные стимулы с разными поверхностными свойствами (например, грубая или глянцевая) приводят к разной активности как в соматосенсорной коре, так и в ранних зрительных областях.
Hiramatsu et al. (2011) провели эксперимент фМРТ, чтобы исследовать категориальное представление визуально представленных материалов в человеческом мозге.Посредством анализа мультивоксельного паттерна они смогли показать, что во всем вентральном потоке можно декодировать информацию о категориях материалов. Важно отметить, что они могут показать, что представление материалов в ранних областях сильно основано на статистике изображения низкого уровня, такой как контраст, пространственная частота и информация о цвете. В более высоких визуальных областях представление материалов, как было замечено, основано на перцептивном сходстве, то есть отражает суждения участников о свойствах материала.Эти результаты были недавно воспроизведены на макаках (Goda et al., 2014). Несмотря на то, что информация о категории уже присутствует в V1, они пришли к выводу, что семантическое или категориальное различие между материалами не возникает перед веретенообразной извилиной / боковой бороздой. Несколько исследований продемонстрировали, что перцептивные представления материалов организованы осмысленным и последовательным образом (Rao and Lohse, 1996; Baumgartner et al., 2013; Fleming et al., 2013). Fleming et al. (2013), например, показали, что свойства визуального материала четко определены и тесно связаны с членством в категории, а Baumgartner et al.(2013) смогли показать, что визуальное и тактильное восприятие материала устойчиво и тесно связано.
В то время как исследование Hiramatsu et al. (2011) убедительно продемонстрировало существование различных уровней репрезентации в материальном восприятии, остается неясным, как восприятие различных материальных свойств возникает и распространяется в зрительной коре головного мозга человека и какой информацией являются эти восприятия. на основе. Нас интересовало, где и как рано в визуальной системе представлены свойства материалов, и, что немаловажно, какие статистические данные изображения используются визуальной системой во время восприятия материалов.Мы провели это исследование, чтобы ответить на эти фундаментальные вопросы о восприятии материальных свойств. Наша цель состояла в том, чтобы связать воспринимаемые материальные свойства изображений, их статистические свойства и вызванную ими активацию мозга. Эти три неразрывно связаны друг с другом, поэтому мы применили хорошо зарекомендовавшие себя методы, которые использовались для решения нескольких схожих проблем в науке о зрении (Britten et al., 1996; Stone and Krauzlis, 2003), чтобы исследовать, как они соотносятся с друг с другом.
Материалы и методы
Участники
Пятнадцать участников завершили эксперимент со свойствами материала, 11 из них дополнительно завершили сканирование ретинотопии. Однако только 9 из этих 11 участников смогли получить надежные карты. Девять из наших участников были женщинами, шесть мужчин. Средний возраст составил 24,1 года. Все были студентами Гиссенского университета и были правшами, согласно Эдинбургской инвентаризации рук (Oldfield, 1971). Исследование было одобрено местным этическим комитетом, и все участники подписали форму согласия в соответствии с Хельсинкской декларацией.
Стимулы
В нашем эксперименте мы использовали набор из 84 изображений материальных поверхностей в качестве стимулов. Эти материальные поверхности были собраны для психофизических исследований визуального и тактильного восприятия материала слепыми и зрячими наблюдателями (Baumgartner et al., 2013, 2015). Фактические образцы были собраны из разных источников, закреплены на плитках и сфотографированы с помощью зеркальной фотокамеры Nikon D70 (Nikon, Токио, Япония). В качестве стимулов использовались плоские участки размером 14 см × 14 см из различных образцов следующих категорий материалов: пластик, бумага, ткань, кожа, мех, камень, металл и дерево.Для получения дополнительной информации мы обращаемся к Baumgartner et al. (2013), где подробно описана база данных стимулов. Мы сфотографировали стимулы в условиях экспериментальной установки нашего предыдущего исследования с точки зрения участника, с окном позади участника / фотографа и точечным источником света над установкой. Часть фотографий была также использована в исследовании статистики изображений Wiebel et al. (2015). Затем фотографии были обрезаны до размера 768 × 768 пикселей, так что оставалась только поверхность материала (см. Рисунок ).Яркость фона, когда стимулы подавались на проектор в экспериментальной установке, составляла 176 кд / м 2 , средняя яркость стимула составляла 189 кд / м 2 . Изображения доступны для загрузки. 1
Фотографии материала, использованные в эксперименте фМРТ.
Оценка и свойства материала
Процедура
Мы попросили 6 из наших 15 участников указать свои оценки трех свойств материала — шероховатости, текстуры и твердости по 7-балльной шкале Лайкерта для каждого стимула.В отличие от восприятия формы, материальное восприятие по своей сути мультимодально, поэтому мы хотели использовать визуальное, тактильное и бимодальное свойство материала. Баумгартнер и др. (2013) обнаружили, что визуальные и тактильные представления тесно связаны. Скорее всего, это результат процесса обучения (Goda et al., 2016). Поэтому трудно приписать определенные свойства одному из органов чувств, но из наших более ранних работ кажется, что текстуру можно более надежно оценить в визуальном смысле, в то время как шероховатость — это свойство, которое легко и надежно доступно для обоих органов чувств из материала объекта. поверхность.Жесткость, напротив, даже если она может быть получена в некоторой степени с использованием визуальной информации (Baumgartner et al., 2013), в основном воспринимается через осязание и, следовательно, служит аналогом визуально доступных свойств. Фотографии были представлены на экране компьютера в полностью рандомизированном порядке. Участники оценивали каждое свойство по очереди, т. Е. Оценивали одно свойство по всем стимулам, делали небольшой перерыв, а затем оценивали следующее свойство по всем стимулам. Порядок свойств также был рандомизирован.Участникам разрешалось смотреть на каждый стимул столько, сколько они хотели. В начале каждого блока свойств участнику давалось письменное определение свойства:
Шероховатость
Насколько грубым или гладким вам кажется материал? Низкие значения указывают на то, что поверхность кажется гладкой; высокие значения указывают на грубость.
Фактурность
Насколько текстурированной / узорчатой или однородной / однородной является поверхность материала? Низкие значения указывают на то, что поверхность однородна, высокие значения указывают на то, что материал имеет узор или текстуру.
Твердость
Насколько твердым или мягким кажется материал? Какое усилие потребуется, чтобы изменить форму материала? Низкие значения указывают на то, что поверхность кажется мягкой; требуется небольшое усилие, чтобы изменить форму материала. Высокие значения указывают на то, что он твердый и не поддается деформации.
Группы изображений
Для каждого свойства материала мы сформировали группы изображений с высоким и низким рейтингом. Мы сделали это, упорядочив изображения в соответствии с рейтингами, а затем выбрав 25% процентов изображений с наивысшими рейтингами свойств для группы с высокими рейтингами и 25% процентов изображений с самыми низкими рейтингами свойств для группы с низким рейтингом. (21 изображение в каждой группе).Это привело к созданию двух групп изображений для каждого свойства материала с относительно низким и относительно высоким значениями соответствующего свойства, например, группа грубых изображений по сравнению с группой гладких изображений (для шероховатости).
Статистика изображений
Чтобы получить информацию о наших материальных изображениях, мы проанализировали их в соответствии со статистикой изображений Симончелли и Портилла (1998) и Портилла и Симончелли (1999, 2000). Хотя алгоритм был расширен для работы с цветными изображениями 2 , мы работали с начальной версией, в которой используются изображения в градациях серого, чтобы сохранить количество статистических данных изображения на управляемом уровне.Изображения были преобразованы в яркость путем умножения R, G и B на относительную яркость соответствующего канала устройства отображения. Модель текстуры, созданная Портиллой и Симончелли, представляет собой сложную модель, разработанную в первую очередь для синтеза текстуры. Сначала алгоритм извлекает из фотографий большой набор статистических данных. Эти статистические данные изображений позже используются для итеративной процедуры синтеза изображений. Однако здесь мы использовали параметры, вычисленные моделью, для описания наших материальных образов.Мы проанализировали три типа статистики, которые алгоритм предоставляет отдельно.
Статистика пикселей
Первоначально алгоритм анализа текстуры вычисляет предельную статистику распределения уровней серого текстуры (количество пикселей на уровень серого). Эти статистические данные представляют собой среднее значение, дисперсию, перекос, эксцесс и диапазон (минимум и максимум) распределения. Эту статистику мы впоследствии будем называть «статистикой пикселей».
Статистика фильтра
Затем алгоритм разбивает изображение на ориентированные линейные фильтры в различных масштабах с помощью управляемой пирамиды (Simoncelli et al., 1992) и вычисляет статистику для описания этих выходных данных фильтра, а также отношений между ними. Несмотря на то, что модель основана на ответах фильтра в V1, параметры не обязательно соответствуют конкретной статистике ответов нейронов V1 и V2. Непространственная сводная статистика этих ответов, реализованная в модели, может быть вычислена на более позднем этапе, предположительно в V2 (Freeman and Simoncelli, 2011; Freeman et al., 2013).
В нашем случае мы использовали управляемую пирамиду с четырьмя масштабами и четырьмя ориентациями.Сначала алгоритм вычисляет локальную автокорреляцию низкочастотных изображений, которую управляемая пирамида вычисляет на каждом уровне. Эти автокорреляции фиксируют регулярность (периодические особенности) текстур и характерных пространственных частот. Во-вторых, вычисляется совместная статистика коэффициентов амплитуды поддиапазонов. В частности, на этом этапе используются соотношения соседей в пространстве, ориентации и масштабе. Эти захватывающие структуры (например, края) в изображениях, а также «текстуры второго порядка». В-третьих, алгоритм вычисляет кросс-масштабную фазовую статистику.Таким образом, вычисляется локальная относительная фаза между коэффициентами поддиапазона и их соседями в следующем более крупном масштабе. Эти коэффициенты улавливают градиенты в текстурах и могут различать края и линии. В нашем случае анализ изображения дал 877 параметров изображения.
Параметры пространственной частоты
Ранее было описано, что пространственная частота напрямую влияет на воспринимаемые свойства материала (Giesel and Zaidi, 2013). Управляемая пирамида модели Портиллы и Симончелли уже в определенной степени улавливает содержание пространственной частоты.Однако для того, чтобы исчерпывающе исследовать пространственно-частотный состав наших изображений, мы изменили управляемую пирамиду с большим количеством фильтров, то есть построили другую управляемую пирамиду с двенадцатью ориентациями и шестью масштабами. 74 коэффициента (12 × 6 + невязки верхних и нижних частот), полученные в результате разложения с помощью управляемой пирамиды, составляют нашу третью группу статистических данных изображения.
Эксперимент FMRI
Мы показали каждому участнику 84 стимула в случайном порядке. Между испытаниями (т.например, изображения), у нас были интервалы не менее 14 с (плюс джиттер 0–2,5 с), чтобы поддерживать ЖИВОЕ загрязнение соседних во времени изображений на минимальном уровне. Каждый стимул предъявлялся в течение 5 с. После 25% процентов испытаний участнику был задан рейтинговый вопрос. Участника попросили оценить одно из трех свойств материала для стимула, который он или она только что увидел. Испытания, после которых был представлен рейтинговый вопрос, были рандомизированы таким образом, что участники не могли предсказать, придется ли им отвечать на вопрос позже, просматривая каждое материальное изображение.Для каждого рейтинга мы случайным образом выбирали материальное свойство, которое мы просили участника оценить, чтобы участники не имели в виду определенное материальное свойство, глядя на стимулы. Мы сделали это для того, чтобы участники обратили пристальное внимание на каждый стимул. Участники должны были оценить свойство стимула по 3-балльной шкале Лайкерта. Они указали свои ответы, нажав одну из трех кнопок ответа. Экспериментальные данные были собраны за один функциональный цикл, который длился примерно 35 минут.Обратите внимание, что каждое изображение материала было просмотрено каждым участником только один раз.
Презентация стимула
Стимулы проецировались с помощью проекционного экрана XGA-Projector (Epson, модель 7250, разрешение: 1024 × 768) (460 × 350 мм) за отверстием сканера. Зрительную стимуляцию можно было увидеть с помощью двойного зеркала, прикрепленного к катушке для головы (поле зрения 18 ° по горизонтали и 16 ° по вертикали, прямоугольная апертура). Наши стимулы охватывали примерно 14 ° × 14 ° экрана.Мы использовали программное обеспечение Presentation (версия 16, Neurobehavioral Systems TM, Олбани, Калифорния, США) для представления стимулов и регистрации ответов.
Параметры сканирования
Данные были собраны с помощью системы визуализации SIEMENS Symphony 1.5 Tesla MR с системой квантовых градиентов. Анатомическое сканирование было собрано на 160 T1-взвешенных сагиттальных изображениях с помощью последовательности MP-RAGE. Толщина среза составляла 1 мм. После этого была сделана сканированная карта поля для измерения неоднородностей магнитного поля.Функциональные данные были собраны с использованием одноразовой последовательности T2 * -взвешенного градиент-эхо-планарного изображения (EPI) с 25 срезами, покрывающими весь мозг, полученными в порядке убывания (толщина срезов 5 мм; промежуток 1 мм; TA = 2,4 с; TR = 2,5 с; TE = 55 мс; угол поворота 90 °; поле зрения 192 мм × 192 мм; размер матрицы 64 × 64; размер вокселя 3 мм × 3 мм × 5 мм.) .
Предварительная обработка и анализ данных
DICOM-файлы были преобразованы в NIFTI-файлы с помощью MRI Convert (версия 2.0; Центр нейровизуализации Льюиса, Орегон). SPM8 (Статистическое параметрическое картирование; Wellcome Department of Cognitive Neurology, Лондон, Великобритания) использовался для предварительной обработки данных. Предварительная обработка состояла из устранения деформации, выравнивания, совмещения и сглаживания (FWHM 6 мм). Перед процедурой анализа с помощью прожектора анатомические и функциональные данные были дополнительно нормализованы по шаблону мозга MNI.
Ретинотопия
Ретинотопические стимулы состояли из вращающегося клина и расширяющегося круга с высококонтрастным (черно-белым) шахматным рисунком, который изменял фазу с частотой 4 Гц.И клин, и круг были представлены одновременно, при этом стимул клина завершил 5 циклов за цикл (80 с / цикл), а кольцо завершило восемь циклов за цикл (50 с / цикл). Участники должны были зафиксировать серую точку фиксации в центре экрана, и их попросили нажимать кнопку всякий раз, когда они замечали изменение цвета точки фиксации. Участники выполнили 3 или 4 цикла ретинотопии.
Данные ретинотопии были собраны в отдельном (втором) сеансе. Параметры предъявления стимула и сканирования были идентичны параметрам основного эксперимента.Данные ретинотопии не искажались, совместно регистрировались и сглаживались (6 мм FWHM). Мы очертили ретинотопные области V1-V3 с помощью подхода ретинотопного картирования с фазовым кодированием. К временным рядам каждого вокселя применялось быстрое преобразование Фурье, чтобы идентифицировать активацию, соответствующую частотам клинья и кольцевого стимула. Фазовые лагы (т.е. полученные карты полярного угла и эксцентриситета) затем накладывались на реконструированную, раздутую кортикальную поверхность (полученную через FreeSurfer, Центр биомедицинской визуализации Мартиноса, Бостон, Массачусетс, США).Затем мы определили границы V1 – V3 как развороты на карте полярных углов. Полученные маски служили областями интереса (ROI) в дальнейшем анализе.
Классификация
Классификатор статистики изображения
Для оценки того, сколько информации о рассматриваемом свойстве материала содержится в статистике изображения, мы применили классификатор к статистике изображения. Для каждого наблюдения (т. Е. Изображения) мы построили вектор признаков (т. Е. z- оцененных статистических параметров изображения).Затем мы обучили классификатор на нашем наборе изображений и попытались предсказать для каждого изображения, принадлежит ли оно к группе с высоким или низким рейтингом, т. Е. Имеет ли оно высокий или низкий балл по рассматриваемому свойству. Обратите внимание, что мы делали это для каждого свойства отдельно, поэтому мы всегда проводили двухстороннюю классификацию изображений с высоким и низким рейтингом свойств, например «гладкие» и «грубые». Поскольку мы создали группы из одного пула из 84 изображений материалов, несколько изображений оказались в нескольких группах.Все анализы классификации были выполнены с использованием кода, который использовал линейный дискриминантный анализ, реализованный в функции классификации набора статистических инструментов для MATLAB (версии R2012a и R2013a 3 ). Функция использовалась с опцией «диаглинеарная», которая подбирает многомерную нормальную плотность для каждой группы и оценивает ковариационную матрицу на основе диагонали. Ради интереса мы также провели анализ классификации с помощью машины опорных векторов (SVM), реализованной в MATLAB (Statistics Toolbox).Это дало результаты, очень похожие на результаты, полученные с помощью дискриминантного анализа. Поэтому в этой рукописи мы остановимся только на результатах дискриминантного анализа.
Анализ мультивоксельного паттерна (MVPA)
Анализ мультивоксельного паттерна, в отличие от «традиционных» методов анализа фМРТ, позволяет анализировать, сколько информации об определенной функции содержится в определенной области мозга, даже если эта функция не приводят к средней разнице в активациях, например, потому что нейроны, кодирующие два разных состояния, перемешаны.В MVPA классификатор применяется к шаблонам вокселей так же, как мы это делали с нашими наборами статистики изображений.
Для расшифровки оценок свойств на основе паттернов активности мозга мы сначала создали общую линейную модель (GLM) в SPM для каждого участника. В GLM мы включили отдельный регрессор для каждого из 84 стимулов. Затем мы замаскировали полученные карты β — (по одной для каждого изображения) с нашими областями интереса. Значения вокселей в каждой области интереса были векторизованы и использованы в качестве векторов признаков в процедуре классификации.И снова мы создали двусторонний классификатор для каждого свойства материала, чтобы различать изображения с высокими и низкими оценками.
Тесты перекрестной проверки и перестановки с исключением одного-одного
Точность классификации может быть сильно переоценена, если классификатор тестируется на том же наборе данных, на котором он обучается. Поэтому мы использовали перекрестную проверку с исключением по одному. В этой процедуре классификатор итеративно обучается по всем наблюдениям, кроме одного, а затем проверяется по оставшимся наблюдениям.В частности, каждый классификатор запускался 42 раза, каждое изображение использовалось один раз в качестве тестового наблюдения. Это гарантирует, что наборы для обучения и тестирования остаются независимыми на протяжении всей процедуры классификации.
Односторонние тесты t- были использованы для сравнения средней точности по каждому предмету со случайным выполнением (50%). Для более строгой проверки значимости классификатора статистики изображений и MVPA мы дополнительно использовали процедуру начальной загрузки. Мы запускали каждый классификатор несколько раз, каждый раз меняя метки групп наблюдений случайным образом.На основе этих переставленных классификаций мы оценили вероятностные распределения наших классификаторов.
Анализ прожектором
Для того, чтобы исчерпывающе исследовать мозг в поисках информации о свойствах материала, мы применили исследовательский анализ прожектором в дополнение к анализу рентабельности инвестиций (Kriegeskorte et al., 2006). В этом анализе сферический прожектор помещается во все возможные места в мозге. Затем в каждой сфере прожектора был проведен MVPA, чтобы выяснить, где в мозгу содержится информация о свойствах материала.Для этого мы замаскировали β-карты каждого участника маской серого вещества участника. На каждом вокселе по очереди центрировали прожектор в форме сферы с радиусом 4 вокселя (например, Bannert and Bartels, 2013; de Haas et al., 2013). Этот прожектор действовал как маска. Мы построили вектор признаков из значений вокселей в маске и использовали классификатор с исключением по одному, чтобы различать изображения с высоким и низким рейтингом. Для каждого прожектора точность классификатора записывалась обратно в центральный воксель.Следовательно, для каждого участника и материальной собственности мы получили карту точности прожектора. Из них мы вычли уровень вероятности классификаторов (50%) и объединили карты точности отдельных участников в анализе второго уровня в SPM для обнаружения групповых эффектов.
Результаты
Рейтинги изображений
Группы с высоким и низким рейтингом были основаны на рейтингах участников. На рисунке показано распределение оценок для каждого свойства.
Распределения оценок (средние оценки шести наблюдателей) для всех 84 изображений для каждого из трех свойств материала (A) и изображений-примеров (B) . Вертикальные красные линии обозначают 25-й и 75-й процентиль оценок. Изображения с рейтингом ниже 25-го процентиля составляли изображения с низким рейтингом для этого свойства, а изображения с рейтингом выше 75-го процентиля составляли изображения с высоким рейтингом. Отсечки составляли 2,3 и 4,2 для шероховатости, 2,5 и 4,7 для текстуры и 2,5 и 5,7 для твердости.
Чтобы оценить объем информации о группах свойств материала, содержащихся в моделях мозговой активности наших участников, когда они наблюдали за нашими материальными стимулами, мы запустили классификатор по β-весам, извлеченным из областей V1, V2 и V3 в таблице. подмножество участников, завершивших ретинотопию ( Рисунок ).Картина результатов очень похожа на ту, которая наблюдается с визуально реагирующими вокселями, с лучшими характеристиками классификации для шероховатости и текстуры.
Классификация точности дискриминантного анализа в ретинотопически определенных визуальных областях V1-V3 (девять участников). Опять же, горизонтальная линия указывает уровень вероятности (0,5). Заштрихованная область указывает порог p , полученный в результате теста перестановки ( p <0,05, односторонний тест). Пороговое значение было усреднено по всем участникам.
Статистика изображения
Чтобы увидеть, сколько информации о наших группах изображений содержится в различных наборах статистики изображений, мы применили классификатор к статистике, полученной с помощью алгоритма Портилья и Симончелли. На рисунке показаны результаты классификатора статистики изображений. Результаты представлены для следующих групп статистики изображений: (1) предельная статистика пиксельного распределения яркости, (2) параметры пространственной частоты, (3) параметры фильтра.Вся статистика Portilla и Simoncelli показала хорошие результаты при классификации высокой и низкой шероховатости и текстуры. Интересно, что даже «простая» пространственная частота и статистика пикселей также приводят к относительно хорошей классификации; они превосходят фильтры Портилья и Симончелли и статистику пикселей.
Точность классификатора статистики изображений. Заштрихованная область указывает порог p , полученный в результате теста перестановки ( p <0.05, односторонний тест, 500 перестановок).
Шероховатость может быть хорошо классифицирована по параметрам Портилья и Симончелли, которые, конечно, отражают важные низкоуровневые аспекты (например, контраст), а также критический внешний вид текстуры (например, зернистость, отсутствие направленности). Однако информация о пространственной частоте работает даже лучше при прогнозировании высокой и низкой шероховатости.
Что касается текстуры, то все статистические данные изображения работают так же, как и для шероховатости, что указывает на то, что аналогичные функции могут использоваться для различения высокой и низкой текстуры и шероховатости.Это может быть связано с тем фактом, что хотя шероховатость и фактура являются разными понятиями, по крайней мере изображения, получившие низкую оценку по обоим свойствам, очень похожи, а именно гладкие поверхности без текстуры.
Твердость не была выше случайной. Это имеет смысл, потому что твердость сама по себе не имеет надлежащего визуального соотношения. Вместо этого факторы более высокого уровня, такие как восприятие категорий и обучение, вступают в игру в визуальном восприятии твердости.
Видя, что одна пространственная частота достаточно хорошо работает для свойств визуального материала, мы хотели исследовать, какие ориентированные поддиапазоны пространственной частоты лучше всего различают изображения с высоким и низким рейтингом.Поэтому мы провели t -тестов для сравнения групп с высоким и низким рейтингом в отношении энергии, содержащейся в каждом поддиапазоне управляемой пирамиды. Результаты этого анализа показаны на рисунке . Очевидно, что для шероховатости и текстуры элементы разрешения от средних до высоких частот содержат больше энергии, чем элементы с низкими частотами.
Сравнение поддиапазонов управляемой пирамиды между изображениями с высоким и низким рейтингом. Управляемая пирамида представляет собой набор многомасштабных полосовых фильтров с разной ориентацией, охватывающих примерно одну октаву в полосе пропускания на каждой шкале.Пространственная частота увеличивается снизу вверх. Пространственная частота увеличивается снизу вверх, примерно от 0,07 до 4,6 импульсов в день с логарифмическими шагами. Ориентация представляет собой ориентацию компонентов в спектре Фурье. Положительные значения t означают, что изображения с высоким рейтингом имеют больше энергии в этом поддиапазоне. Слева и справа от графика показаны примеры изображений, которые были правильно отнесены к группам с низким и высоким рейтингом соответственно. В качестве примеров мы выбрали изображения с наибольшей вероятностью принадлежности к соответствующей группе по оценке классификатора.Поскольку классификатор работает случайно для изображений с высоким и низким рейтингом твердости, изображения материалов здесь не отображаются.
Чтобы поверхности выглядели шероховатыми, они должны иметь более высокую мощность на средних и высоких пространственных частотах, в то время как появление текстуры требует энергии на низких и средних пространственных частотах. Однако, за исключением очень низких пространственных частот, изображения с высокими уровнями обоих свойств показывают более высокую мощность почти на всех частотах, кроме очень низких. Это имеет смысл, учитывая, что для обоих свойств изображения, получившие низкие оценки, были изображениями гладких однородных поверхностей, как показано в примерах изображений.
Очевидно, что различия в твердости очень малы и поэтому не могут быть учтены нашим классификатором.
Согласованность между MVPA и классификатором статистики изображений
Показав, что мы можем классифицировать свойства материалов, используя статистику изображений и паттерны активации мозга, решающий вопрос, конечно, заключается в том, действительно ли функции, извлеченные нами из анализа изображений, используются визуальными объектами. кора. Поэтому мы сравнили согласованность между классификатором статистики изображений и классификатором фМРТ с степенью согласованности, которую мы ожидаем от случайности на основе точности двух классификаторов.В частности, мы проверили, совпадают ли метки, которые два классификатора дали каждому отдельному изображению (высокий или низкий) чаще, чем ожидалось, и в предположении независимости между двумя классификаторами. Эта процедура похожа на подход вероятности выбора (Britten et al., 1996), который использовался для изучения взаимосвязи между активностью клеток и поведением, и вдохновлен им. Его, например, также применили Стоун и Краузлис (2003) для изучения того, управляются ли восприятие движения и глазодвигательные сигналы общими нейрональными субстратами.Оба этих подхода ищут общую дисперсию двух показателей, чтобы определить степень связи этих двух показателей. Мы использовали его, потому что нас интересовала связь между статистикой изображения и нейронным откликом.
Согласие между статистикой изображений и активацией мозга, конечно же, объясняется тем фактом, что и те, и другие направлены на классификацию перцептивного суждения. Чтобы избежать этой проблемы, мы рассмотрели два полюса каждого свойства отдельно. Мы взяли, например, 21 изображение, на котором были обнаружены шероховатые поверхности, и подсчитали, сколько из них были классифицированы как грубые, используя статистику фильтров Портиллы и Симончелли или активацию мозга, в данном случае 14 и 16.2 (усредненных по 15 участникам) изображения. Основываясь на этих числах, мы затем вычислили (для каждого участника) согласованность, которую мы ожидали бы, если бы два классификатора были независимыми (в среднем по 15 участникам: 59%), и сравнили это с фактической согласованностью двух классификаторов (в среднем по участникам: 67%). %). Мы проделали такой же анализ для изображений с низким рейтингом, в данном случае сглаженных изображений. По сути, мы сравнили фактическое согласие с вероятностью, рассчитанной на основе точности классификации.Если согласие значительно выше, чем рассчитанный нами уровень вероятности, это указывает на то, что и то и другое может быть обусловлено одними и теми же основными факторами.
Обобщенные совпадения для каждой группы статистики изображений (столбцы показывают средние результаты для изображений с высоким и низким рейтингом) показаны на рис. . Статистика фильтров Портиллы и Симончелли, а также статистика пространственной частоты показывают большую согласованность с MVPA, чем мы ожидаем от случая. Это указывает на то, что статистика изображения тесно связана с различиями в активации мозга, которые могут быть обнаружены MVPA.Оба показывают значительную согласованность шероховатости и текстуры, но не твердости. Это, однако, ожидаемо, поскольку MVPA показала случайную жесткость. Что касается текстуры, классификатор со статистикой пикселей показывает большее совпадение с метками, заданными MVPA, чем мы могли бы ожидать от случая. Это предполагает, что информация о пространственной частоте и статистика фильтров, а также статистика пикселей в градациях серого частично управляют паттернами дифференциального отклика для изображений с высоким и низким рейтингом в ранней зрительной коре.Мы проанализировали всю статистику пикселей по отдельности и обнаружили, что минимум и максимум влияют на классификацию.
Резюме фактического и ожидаемого совпадения двух классификаторов (статистика изображений и MVPA) для трех различных групп статистики изображений. Планки погрешностей указывают стандартные отклонения; звездочки указывают на статистическую значимость ( p <0,05).
Анализ прожектором
Поскольку классификация паттернов в визуально реагирующих вокселях и V1, V2 и V3 показала довольно похожие результаты, мы хотели более детально изучить, где информация о свойствах материала содержится в ЖИРНЫХ паттернах по всему мозгу.Результаты поиска с помощью прожектора представлены в таблице , рис. и таблице . Результаты анализа прожектором подтверждают результаты анализа маски, показывая, что наилучшее различение может быть достигнуто по шероховатости и текстуре, особенно в областях раннего зрения. За пределами раннего вентрального потока мы не могли наблюдать значительную выше случайную точность классификации в пределах зрительной системы. Очевидно, что высокие и низкие оценки собственности лучше всего можно расшифровать из первых визуальных областей. Что касается твердости, мы не обнаружили значительной точности классификации в ранних визуальных областях.Вместо этого мы обнаружили вышеупомянутую случайную точность классификации в правой язычной извилине (см. Таблица для полного списка результатов маркировки).
Результаты процедуры классификации прожектора целиком для различных свойств [ t (14) = 3,79, p <0,001]. Поперечные срезы при z = 7, 0, -7 и -14.
Таблица 1
Обзор значимых кластеров ( k > 5), идентифицированных с помощью прожекторного подхода.
Координаты MNI | Размер | Местоположение | Маркировка | Вероятность | T -Значение | ||||
---|---|---|---|---|---|---|---|---|---|
028197 028 | 197197197Левая нижняя затылочная извилина | hOC3v (V3v) | 60% | 19,81 | |||||
24-88-2 | Правая язычная извилина | Площадь 17 | 20 30% | 43||||||
-27-61-5 | 32 | Левая язычная извилина | hOC4v (V4) | 20% | 3,87 | ||||
Текстура | Правая язычная извилина | Площадь 18 | 60% | 9,69 | |||||
-15-94-8 | Левая нижняя затылочная извилина | Площадь 18 | 202 | Левая средняя затылочная извилина | hOC5 (V5) | 10% | 4.46 | ||
Твердость | |||||||||
9-55-2 | 129 | Правая язычная извилина | Площадь 18 | 50% | 6,35 | ||||
97 |