Статья. Скиннер Беррес “Оперантное поведение”
Беррес Фредерик Скиннер (англ. Burrhus Frederic Skinner; 20 марта 1904 — 18 августа 1990) — американский психолог и писатель.Внёс огромный вклад в развитие и пропаганду бихевиоризма — школы психологии, рассматривающей поведение человека как результат предшествующих воздействий окружающей среды. Скиннер наиболее известен своей теорией оперантного научения, в меньшей степени — благодаря художественным и публицистическим произведениям, в которых он продвигал идеи широкого применения развиваемых в бихевиоризме техник модификации поведения (например, программированного обучения) для улучшения общества и осчастливливания людей, как форму социальной инженерии.
Б.Ф. Скиннер
Оперантное поведение
Рефлексы, как условные, так и всякие другие, главным образом связаны с внутренними физиологическими процессами в организме. Однако чаще всего нас интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например «поощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента.
КРИВЫЕ НАУЧЕНИЯ
В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его эксперименты возникли на основе дискуссии, которая впоследствии заинтересовала многих ученых. Ч. Дарвин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количество анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение особенностей, ранее характеризующих только поведение человека на поведение животных, привело к постановке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявления мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внутренних мыслительных процессах. Должно было пройти много лет, прежде чем тот самый вопрос о специфичности поведения человека не возник вновь, но эксперименты Торндайка и его» объяснение мышления (reasoning) животных явились важным шагом в этом направлении.
Если кошка помещается в ящик, из которого она может выбраться, открыв задвижку, она может проявить много видов поведения, некоторые из которых могут оказаться эффективными. Торндайк установил,. что при многоразовом помещении кошки в ящик успешное поведение наступало все быстрее и быстрее, и это продолжалось до тех пор, пока оно не стало предельно простым и быстрым. Кошка решала свою задачу, как разумное человеческое существо, хотя, возможно, и не так быстро. Однако Торндайк не видел за этим «мыслительных процессов» и утверждал, что они ненужны для объяснения. Он описал свои результаты, указав на то, что поведение кошки было «запечатлено» (stamped in), поскольку оно сопровождалось открытием двери.
Тот факт, что поведение запечатлевается или сопровождается определенными последствиями, Торндайк назвал «законом эффекта». В своих экспериментах. он установил, что в рамках одной и той же ситуации определенное поведение протекает все более и более стабильно в отличие от других поведенческих проявлений. Фиксируя промежутки времени, которые требовались кошке для того, чтобы выбраться из ящика, он построил «кривую научения». Эта ранняя попытка описать поведенческий процесс количественно, аналогично описанию физических и биологических процессов, рассматривалась как важный шаг вперед. Он раскрыл процесс, который развертывался в течение длительного времени и который был доступен для наблюдения. Итак, Торндайк сделал открытие. С тех пор было получено много кривых, которые легли в основу многих психологических работ, посвященных научению.
Однако кривые научения не описывают сущность запечатления. Критерий Торндайка — время, необходимое животному для того, чтобы выбраться из клетки, — был связан с устранением других видов поведения, и его кривая зависела от ряда различных действий, которые могла выполнять кошка в определенном ящике. Форма кривой также зависела от поведения, которое было «успешным», и от того, был ли это редкий или обычный способ поведения в данном ящике. Можно сказать, что кривая научения, построенная таким образом, отражает свойства ящика с задвижкой, а не поведение кошки. Это положение распространяется на многие другие устройства, разработанные для изучения научения. Различные лабиринты, через которые белые крысы и другие животные учатся проходить, «ящики выбора», в которых животные научаются различать свойства, или паттерны стимулов, аппараты, посредством которых представляется последовательность стимулов, подлежащих усвоению при изучении памяти человека, — все они порождают различные кривые научения.
Усредняя многие показатели индивидов, мы можем сгладить эти кривые настолько, насколько хотим. Более того, кривые, полученные в различных условиях, могут иметь определенные общие свойства. Например, при измерении данным способом научение обычно «имеет негативную характеристику убыстрения» — улучшение выполнения наступает все более и более медленно до тех пор, пока оно вовсе не прекращается. Однако из этого не следует, что негативная акселерация характеризует сущность процесса. Предположим по аналогии, что мы наполнили стеклянный сосуд песком и так его перемешали, что песчинки одного и того же размера равномерно распределились внутри него. Если мы слегка встряхнем сосуд, то песчинки перераспределяются. Большие песчинки окажутся наверху, маленькие — внизу. Этот процесс также характеризуется негативной акселерацией. Сначала смесь перераспределяется быстро, но по мере приближения к его завершению процессы в распределении наступают реже и реже. Такая кривая может оказаться совершенно ровной и воспроизводимой, но один лишь этот факт не имеет большого значения. Кривая зависит от определенных процессов взаимодействия песчинок различного размера, от силы сотрясения, сосуда и т. д., но в то же самое время она прямо не отражает сами эти процессы.
Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отбираются, закрепляются и реорганизуются. Базисный: процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не отражен.
ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ
Для понимания сущности закона эффекта Торндайка нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?
Если бы определенное поведение существовало в двух ипостасях — в одном случае оно всегда бы имело место, а в другом — никогда, то мы оказались бы почти в беспомощном состоянии при введении программы функционального анализа. Феномен, имеющий характеристики «все и ничего», имеет только простые формы описания. Гораздо более продуктивным является предположение, что вероятность осуществления реакции последовательно распределяется между этими двумя полюсами «все — ничего». Тогда мы можем рассмотреть переменные, которые в отличие от стимулов порождения (eliciting stimulus), «не являясь причиной данного поведения», делают его наступление более вероятным. Далее мы можем, например, рассмотреть последствия действия нескольких таких переменных.
Распространенные выражения, отражающие вероятностную природу явления, — «тенденция» или «предрасположенность» — характеризуют частоту наступления определенных видов поведения. Мы никогда не наблюдаем вероятность. Мы говорим, что кто-то «обожает бридж», потому что замечаем, что он часто играет в бридж и часто говорит о нем. «Глубоко интересоваться» музыкой означает много играть, часто слушать музыку и много говорить о музыке. «Неисправимый игрок» много играет в карты. Любитель киносъемок делает снимки, проявляет их и любуется своими собственными снимками и снимками других людей и т. д…
Характеризуя поведение человека с точки зрения его частоты, мы принимаем определенные стандартные условия: он должен быть способен выполнить и повторить определенное действие, при этом другие виды поведения не должны мешать. Например, мы не можем знать, насколько сильна тяга человека к музыке, если ему приходится также заниматься другими вещами. Подойдя к проблеме уточнения научного определения вероятности, мы обнаруживаем, что исходными моментами являются частота и условия, при которых наблюдается то или иное поведение. Мы устраняем или по крайней мере сохраняем в неизменном виде любое условие, которое способствует проявлению конкурирующего с изучаемым нами видом поведения. Животное помещается в отдельный (quiet) ящик, и за его поведением наблюдают с помощью одно-канального экрана, или оно регистрируется посредством специальных технических устройств. Эти условия нельзя рассматривать как вакуумную среду, так как животное будет реагировать на свойства ящика многими способами, однако его поведение постепенно достигнет достаточно устойчивого уровня, на котором можно исследовать частоту заданной реакции.
Для изучения процесса, который Торндайк назвал запечатлением, мы должны иметь его «последствие». Это может быть, например, предъявление еды голодному животному. Мы можем предъявлять нашему испытуемому еду в удобном для него месте, на большом подносе, с помощью специального устройства. При первом предъявлении подноса животное, вероятно, будет реагировать на него различными поведенческими реакциями, которые мешают проявлению изучаемого нами поведения. Постепенно после нескольких кормлений оно без промедления принимает пищу и мы получаем возможность рассматривать это последствие как зависящее от поведения и наблюдать его результат.
Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и который легко поддается наблюдению и регистрации. Например, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удобным поведением для изучения. Оно может быть зафиксировано взглядом экспериментатора на шкале, прикрепленной к задней стенке ящика, на фоне которой находится голубь. Сначала мы изучаем естественную высоту поднятия головы голубем и выбираем на шкале отметку, которая достигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, экспериментатор начинает очень быстро открывать поднос, как только голова поднимается выше этой линии. Если эксперимент проводится в соответствии со спецификациями, то получается один и тот же результат: мы наблюдаем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значение. Мы можем очень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы выбрали вначале.
Когда мы демонстрируем процесс запечатления в такой относительно простой форме, мы видим, что некоторые обычные интерпретации эксперимента Торндайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие головы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленному нами результату. Даже употребление термина «научение» вводит в заблуждение. Утверждение, что «птица научается получать пищу посредством вытягивания шеи», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вытягивать шею — значит просто обращаться к объяснительным вымыслам, поскольку единственным доказательством наличия навыка является приобретенная тенденция выполнять действие. Простейшим возможным описанием данного процесса является следующее: мы делаем данный контингент следствий зависимым от определенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу «одно порождает другое», поэтому термин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать.
Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (оперантное поведение), и как существительное, обозначающее поведение, определенное данным следствием.
Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств (instances), является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле оперант можно определить посредством следствия, характеризуемого с помощью физических терминов. «Поднятие головы» («cutoff») на определенную высоту является частью (property) поведения.
Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперантное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали, что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопровождает другой стимул или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а.ее предъявление, когда реакция «выделяется», является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление — высотой, на которую должна подниматься голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс оперантного обусловливания.
Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством оперантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. ‹:…› Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.
КОЛИЧЕСТВЕННЫЕ СВОЙСТВА
Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кривую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана произвольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изменение в схеме будет гораздо больше, чем в случае, когда выбирается высота, на которую голубь обычно поднимает голову. Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепления. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления.
Мы не можем обойти эти проблемы, выбрав реакцию, которая более строго определяется свойствами среды, например открытие двери. Определенный механический индикатор поведения, разумеется, предпочтительнее, поскольку, например, он позволяет организовать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с помощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене экспериментального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции. Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характеристику «все или ничего». Но ниже будет видно, что «реакция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».
Нет необходимости иметь совершенное экспериментальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обусловливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конечностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только если он получает обратную связь о. своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей. Одной из функций педагога является обеспечение произвольных (иногда ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.
Отдельное подкрепление может иметь значительный эффект.
При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных случаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблюдение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, поскольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкого уровня развития», как крысы и голуби, приводит к интересным выводам. Различия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факторами.
УПРАВЛЕНИЕ (CONTROL) ОПЕРАНТНЫМ ПОВЕДЕНИЕМ
Экспериментальная процедура оперантного обусловливания не сложна. Создается контингент подкрепления и предъявляется организму в течение определенного периода времени. Затем на основе этого объясняется частота возникновения реакции. Что было сделано в на-: правлении предсказания и управления поведением в будущем? Какие переменные заставляют нас предсказывать, будет или не будет реагировать организм? Какими переменными нужно управлять, чтобы заставить организм реагировать? Мы экспериментируем с голодным голубем. Это означает, что голубь лишался пищи в течение определенного периода времени или до тех пор, пока он немного не терял в весе. В противоположность тому, что можно было бы ожидать, экспериментальные исследования показали, что сила эффекта пищевого под- крепления может не зависеть от количества пищи. Но наблюдается, что частота реакций, которая является результатом подкрепления, зависит от степени депривации. Даже если мы научили голубя вытягивать шею, он не будет этого делать, если он не голоден. Таким образом, имеется еще один способ контроля за его поведением: для того чтобы заставить голубя вытягивать шею, необходимо лишить его пищи. Выбранный оперант прибавляется ко всему тому, что будет делать голодный голубь. Контроль за реакцией объединился с контролем за лишением животного пищи. Оперант ” может также контролироваться с помощью внешнего стимула, являющегося еще одной переменной величиной, которую можно использовать для предсказания поведения и контроля за ним. Тем не менее следует отметить, что обе эти переменные можно вывести из самого оперантного подкрепления.
ОПЕРАНТНОЕ УГАШЕНИЕ
Когда подкрепление больше не поступает, реакция становится все менее и менее частой; этот процесс получил название «оперантного угашения». Если задержать подачу пищи, голубь перестанет поднимать голову. В общем, когда мы выполняем поведение, которое больше «не приносит нам никакой выгоды», мы утрачиваем тенденцию повторять его. Если мы потеряли авторучку, мы все реже и реже направляем руку в карман, в котором она хранилась. Если нам не отвечают на телефонные звонки, то в конце концов мы перестаем звонить. Если пианино расстраивается, то мы все реже и реже на нем играем. Если звук нашего радиоприемника стал слишком громким или передачи стали хуже, мы перестаем его слушать.
Поскольку оперантное угашение протекает гораздо медленнее, чем оперантное обусловливание, постольку наблюдать за ним гораздо проще. При благоприятных условиях получаются плавные кривые, показывающие, что скорость реакций медленно уменьшается, возможно, в течение нескольких часов. Кривые раскрывают свойства, которые нельзя получить из наблюдения. У нас «может сложиться впечатление», что организм реагирует реже и реже, но за характером изменения можно проследить только при регистрации поведения. Кривые показывают, что угашение есть довольно однородный процесс, который определяет силу поведения.
При определенных условиях на кривую оказывают влияние эмоциональные реакции. Отсутствие подкрепления приводит не только к угашению операнта. Оно вызывает также реакцию фрустрации, или ярости. Голубь, который не получил подкрепления, отворачивается от рычага, воркует, хлопает крыльями и демонстрирует другие виды эмоционального поведения. Человек также демонстрирует подобные реакции. Ребенок, у которого велосипед не двигается с места, когда он нажимает на педали, перестает их крутить. Взрослый, который находит ящик письменного стола запертым, скоро перестает дергать ручку, но он может колотить по столу и браниться или может проявлять другие признаки гнева. Точно так же как ребенок вновь вернется к велосипеду, а взрослый — к ящику стола, птица вновь повернется к рычагу, когда эмоциональная реакция угаснет. Могут наблюдаться и другие явления эмоционального характера. В таких условиях кривая угашения характеризуется циклическими колебаниями, поскольку эмоциональные реакции появляются, исчезают и вновь появляются. Если каким-либо способом удается устранить эмоцию, кривая принимает более простую форму.
Поведение, которое наблюдается во время угашения, является результатом обусловливания, которое ему предшествовало, и в свете этого кривая угашения дает еще одну меру эффекта подкрепления. Если было подкреплено всего лишь несколько реакций, угашение происходит быстро. Большое количество подкреплений приводит к длительному сохранению реакции. Силу сопротивления угашению нельзя предсказать по вероятности реакции, наблюдаемой в каждый отдельный момент. Необходимо знать историю подкрепления. Например, если мы получили подкрепление в виде великолеп-, но приготовленной пищи в новом ресторане, невкусно приготовленная пища может «свести на нет» хорошее впечатление от этого ресторана; но если мы питались в ресторане качественной пищей в течение многих лет, то тогда, при прочих равных условиях, нам надо будет несколько раз принять невкусную пищу, прежде чем мы утратим склонность постоянно питаться в нем.
Между количеством подкрепленных реакций и количеством реакций, возникающих при угашении, нет простых связей. Сила сопротивления угашению в режиме прерывистого подкрепления может быть гораздо больше силы сопротивления угашению в случае, когда то же количество подкреплений дается за каждую реакцию. Таким образом, если мы только один раз случайно подкрепим ребенка за хорошее поведение, то оно при отсутствии подкрепления будет сохраняться дольше, чем в том случае, когда мы подкрепляем каждое правильное выполнение.
Этот вывод имеет практическую значимость в тех случаях, когда ценные виды подкреплений ограничены. Подобного рода проблемы возникают в области образования, промышленности, экономики и пр. В условиях некоторых режимов прерывистого подкрепления голубь может произвести 10 000 поведенческих реакций, прежде чем полностью завершится процесс угашения.
Угашение является эффективным способом устранения операнта из организма. Его не следует путать с другими процедурами, созданными для получения того же эффекта. В настоящее время предпочтение отдается наказанию, которое включает в себя различные процессы и эффективность которого вызывает сомнения. С угашением часто путают забывание. При забывании эффект обусловливания утрачивается просто по мере прохождения определенного времени, в то время как угашение требует, чтобы реакция возобновлялась без подкрепления. Обычно забывание наступает не быстро; большие кривые угашения были получены через шесть лет после того, как реакции голубей были подкреплены последний раз. Шесть лет составляют больше половины жизни голубей. В этот период времени голуби жили в таких условиях, в которых реакция не могла быть подкреплена. В поведении человека реакции научения, порожденные относительно определенными условиями, часто сохраняются без использования на протяжении половины жизни человека. Утверждение, что ранний опыт определяет личность зрелого организма, предполагает, что эффект оперантного обусловливания долгосрочен. Таким образом, если из-за раннего опыта, полученного в детстве, мужчина женится на женщине, которая напоминает его мать, то это говорит о том, что эффект определенных подкреплений должен сохраняться долгое время. Большинство случаев забывания включают в себя оперантное поведение при контроле определенных стимулов, и их нельзя подвергнуть адекватному анализу до обсуждения проблемы контроля.
Эффект угашения. Условия процесса протекания угашения более или менее известны, однако сущность его часто понимают неправильно. Экстремальное угашение иногда называют «abulia». Определение этого феномена как «отсутствие воли» мало что дает, поскольку отсутствие или наличие воли выводится из наличия или отсутствия поведения. Однако термин представляется полезным, поскольку он предполагает, что поведение отсутствует по определенной причине, и мы можем провести то же самое различение другим способом. Поведение является сильным или слабым из-за действия многих различных переменных, и задача, науки о поведении заключается в том, чтобы их выявлять и классифицировать. Каждый случай мы определяем в терминах переменных величин. Условия, которые возникают в результате длительного угашения, по лежащим на поверхности признакам напоминают инактивность, возникающую в результате действия других причин. Различия этих случаев надо искать в истории организма. Целеустремленный писатель, отправляющий издателям одну рукопись за другой, когда все они были отвергнуты, может в конце концов заявить, что «он не может больше написать ни одного слова». Частично он парализован тем, что его «зажимают», но все-таки он продолжает настаивать на том, что он «хочет писать», и мы можем согласиться с ним и квалифицируем это так: чрезвы-: чайно низкая вероятность реакции определяется угашением. Однако другие переменные все еще сохраняют свое действие и если бы угашение не произошло, они бы дали высокую вероятность достижения.
Необходимо обратиться к условиям, при которых небольшая сила операнта является результатом угашения. Некоторые формы психотерапии являются системами подкрепления, созданными для восстановления поведения, которое было утрачено в процессе угашения. Терапевт может сам давать подкрепление или он организует такие условия жизни, которые будут подкреплять поведение. В терапии профессионального продвижения, например, терапевты способствуют тому, чтобы пациент начал осуществлять простые формы поведения, мгновенно и сравнительно постоянно подкрепляемые. Объяснения, что такая терапия помогает пациенту потому, что дает ему чувство «достижения» или «укрепляет его нравственную сферу», «формирует его интересы» или предотвращает его от «разочарования», не дают никаких преимуществ. Такая терминология просто увеличивает объем объяснительных фикций. Человек, который действительно вовлечен в данный вид активности, проявляет не интерес, а демонстрирует эффект подкрепления. Мы не даем человеку «чувство достижения», а подкрепляем определенное его действие. Разочароваться — просто означает утратить возможность реагировать из-за отсутствия подкрепления. Наша проблема состоит лишь в том, чтобы объяснить вероятность реакции в терминах процесса подкрепления и угашения.
КАКИЕ СОБЫТИЯ ЯВЛЯЮТСЯ ПОДКРЕПЛЯЮЩИМИ
Имея дело с людьми в жизни, клинике и лаборатории, мы должны знать, каков подкрепляющий эффект какого-либо специфического события. Мы часто замечаем, насколько наше собственное поведение подкрепляется одним и тем же событием. Нередко подобного рода практика уводит нас в сторону; тем не менее существует общепринятое мнение, что подкрепления можно определять в отрыве от рассмотрения их воздействий на определенный организм. Однако в соответствии с нашим использованием этого термина единственной определяющей характеристикой подкрепляющего стимула является то, что он подкрепляет.
Для того чтобы сказать, подкрепляет ли определенное событие определенный организм в определенных условиях, необходимо провести прямое испытание. Мы наблюдаем за частотой выбранной реакции, затем делаем событие зависимым от нее и следим за изменениями, происходящими в его частоте. Если изменения имеют место, то тогда мы рассматриваем данное событие как подкрепляющее организм в данных условиях. В классифицировании событий на основе их эффектов нет ничего тавтологичного; используемый критерий является как эмпирическим, так и объективным. Однако он стал бы тавтологичным, если затем мы стали бы утверждать, что данное событие усиливает оперант, потому что оно подкрепляет. Мы достигаем определеных успехов, когда нам удается угадать подкрепляющее событие только в результате «грубого» наблюдения. Так как мы испытали подкрепляющий эффект стимула на себе, мы допускаем, что он будет оказывать то же воздействие и на других. Мы достигаем успеха только тогда, когда рассматриваем себя как организм, подвергаемый изучению, и корректно наблюдаем за собственным поведением.
Можно выделить два типа событий, обладающих эффектом подкрепления. Некоторые подкрепления представляют собой предъявление стимулов или добавление чего-то, например воды, еды или возможности сексуального контакта в ситуацию. Они называются положительными подкреплениями. Другой тип подкрепляемых событий состоит в устранении чего-либо, например сильного шума, яркого света, холода, жары или электрического шока из ситуации. Это — отрицательное подкрепление. В обоих случаях сохраняется один и тот же эффект подкрепления — вероятность реакции повышается. Мы не можем обойтись без этого различения, просто указав на то, что в негативной ситуации подкрепляет отсутствие яркого света, сильного шума и т. д., поскольку воздействие оказывает именно отсутствие чего-либо после его презентации, и это еще один способ выражения того, что стимул устранен. Различия между двумя случаями станут яснее, когда мы рассмотрим случаи с презентацией негативного подкрепления, или случаи с устранением позитивного подкрепления. Их последствия мы называем наказанием.
В условиях практического применения оперантного обусловливания часто бывает необходимо наблюдать за событиями, оказывающими подкрепляющее воздействие на данного индивида. В любой области, важной характеристикой которой является поведение, — образовании, управлении, семье, здравоохранении, промышленности, искусстве, литературе и т. д. — мы постоянно изменяем вероятности реакции с помощью их подкрепления. Промышленник, который хочет, чтобы его рабочие работали постоянно и без прогулов, должен заботиться о соответствующем подкреплении их поведения, и не только с помощью заработной платы, но также и с помощью подходящих условий работы. Девушка, которая хочет еще раз встретиться с молодым человеком, должна быть уверена, что поведение ее друга, связанное с назначением свидания и желанием сдержать свое слово, получило адекватное подкрепление. Для того чтобы обучить ребенка читать или петь, или играть на музыкальном инструменте, необходимо разработать программу педагогических подкреплений, в соответствии с которой правильные реакции должны постоянно «оцениваться». Если пациенту необходимо еще раз обратиться к врачу за консультацией, то последний должен быть уверен в том, что данное поведение пациента получило соответствующее подкрепление.
Мы оцениваем силу подкрепляющих событий, когда пытаемся установить, что «человек выбирает в жизни». Какие следствия определяют репертуар его поведения и относительную частоту реакций, входящих в него? Кое-что об этом говорят нам реакции на различные темы, обсуждаемые в разговоре, но его обычное поведение является еще лучшим ориентиром. Мы делаем вывод о значимых видах подкрепления на основании проявления им интересов к какому-то писателю, освещающему определенные проблемы, к магазинам или музеям, в которых представлены определенные предметы, к друзьям, проявляющим определенные виды поведения, к ресторанам, в которых подают определенную пищу и т. д. «Интерес» соответствует вероятности, являющейся результатом, по крайней мере частично, последствий поведения «проявления интереса». Мы можем быть почти уверены в значимости подкрепления, если наблюдаем за тем, как начинается и протекает поведение по мере чередующегося предъявления и удержания подкрепления, так как тогда изменение вероятности, очевидно, будет в меньшей степени определяться случайным изменением какого-то другого вида. Поведение, которое ассоциируется с дружбой с каким-либо человеком, изменяется, поскольку этот человек изменяет поставляемые им подкрепления.
Если мы пронаблюдаем за подобными изменениями, то сможем составить вполне определенное мнение о том, «что означает эта дружба» или «что наш испытуемый видит в своем друге».
Данная процедура наблюдения может быть усовершенствована с целью ее применения в клинических и лабораторных исследованиях. Можно составить набор картинок, предоставив испытуемому возможность просмотреть их и при этом записав время разглядывания каждой из них. Поведение «разглядывания картинки» подкрепляется тем, что видится в ней. Рассматривание одной картинки может иметь больший эффект подкрепления, чем рассматривание другой картинки и, время, затрачиваемое на рассматривание картинок, также будет варьировать. Эта информация может быть применена в тех случаях, когда возникает необходимость по какой-либо причине подкрепить или устранить поведенческие реакции нашего испытуемого.
Литературу, живопись и эстраду можно рассматривать как хорошо продуманные подкрепления. Так или иначе приобретение книг, билетов на представления и выставки произведений искусства зависит от того, являются ли эти книги, пьесы, концерты или картины подкреплениями. Часто художник ограничивает себя поисками того, что является подкреплением для него самого. Когда он действует таким образом, в его работе «отражается его собственная индивидуальность», и тогда только случайно (как мера универсальности) его книга или пьеса или музыка, или картина оказывают подкрепляющее воздействие на других. Поскольку коммерческий успех имеет большое значение, постольку с его помощью можно непосредственно изучать поведение других людей.
Для выяснения того, что является подкреплением для данного человека, мы не можем ограничиться простым вопросом к нему о том, что его подкрепляет. Его ответ может представлять определенную ценность, но его ни в коем случае нельзя считать надежным. Подкрепляющие связи не всегда очевидны для человека. Часто только в ретроспективе тенденции человека вести себя определенным образом рассматриваются как результат определенных последствий, и отношения могут совсем не репрезентироваться субъекту, даже если они очевидны для других людей.
Конечно, существуют большие различия между индивидами в отношении событий, которые имеют силу подкрепления. Различия между видами настолько велики, что едва ли они могут представлять интерес; очевидно, что-то, что подкрепляет лошадь, необязательно подкрепляет собаку или человека. Среди представителей вида большие различия могут объясняться не столько наследственностью, но и историей жизни индивида, обстоятельства которой могут быть прослежены. Тот факт, что организм наследует способность получать подкрепления в виде определенных событий, не может использоваться для предсказания неиспытанного стимула. Также и отношения между подкрепляющим событием и депри-вацией или любым другим условием организма не наделяют подкрепляющее событие никакими определенными физическими качествами. Особенно невероятно, чтобы событие, которое приобрело силу подкрепления, выделилось бы каким-то определенным образом. Тем не менее такие события являются важными видами подкрепления.
УСЛОВНЫЕ ПОДКРЕПЛЕНИЯ
Презентируемый при оперантном подкреплении стимул может быть соединен с другим стимулом, представленным в респондентном обусловливании. В гл. 4 мы рассмотрели условия приобретения способности вызывать реакцию; здесь остановимся на феномене подкрепления. Хотя подкрепление имеет другую стимульную функцию, процесс, возникающий при сочетании стимулов, представляется таким же. Если голодному животному часто предъявлять пищу на подносе, то пустой поднос вызывает выделение слюны. В определенной степени пустой поднос также будет подкреплять оперант.
Можно еще проще продемонстрировать условное подкрепление на примере стимулов, которые легче контролировать. Если каждый раз, давая пищу голодному голубю, мы будем включать свет, то свет постепенно ста-яет условным подкреплением. Он может использоваться для обусловливания операнта так же, как используется пища. Нам уже кое-что известно о том, как свет приобретает это свойство: чем чаще свет сочетается с пищей, тем большую силу как подкрепление он приобретает; нельзя предъявлять пищу вслед за светом через большие промежутки времени; сила подкрепления быстро утрачивается, когда пища не предъявляется. Все это вытекает из наших знаний о стимульном обусловливании. Условные подкрепления часто являются продуктом естественных контингентов. Обычно пища или вода получаются только после того, как организм выполнил «предшествующее» поведение — после того, как он воздействовал на среду, чтобы создать возможность для того, чтобы поесть и попить. Поэтому стимулы, порожденные этим «предшествующим» поведением, становятся подкреплениями. Таким образом, прежде чем мы сможем успешно перенести пищу с тарелки к себе в рот, необходимо приблизиться к тарелке, и любое поведение, которое приближает нас к тарелке, автоматически подкрепляется. Следовательно, поддерживается сила «предшествующего» поведения. Это имеет большое значение, поскольку только незначительная часть поведения сразу подкрепляется пищей, водой, сексуальным контактом или другими событиями биологической важности. Хотя характерной особенностью человеческого поведения является то, что важные подкрепления могут быть эффективными при отсрочке на большие промежутки времени, это объясняется, по-видимому, тем, что промежуточные события становятся условными подкреплениями. Когда человек в октябре укрепляет на окнах своего дома вторые рамы, потому что в результате аналогичного поведения в октябре прошлого года в январе в доме было тепло, нам необходимо определить, как заполняется промежуток между поведением в октябре и его эффектом в январе. Среди условных подкреплений, ответственных за силу этого поведения, есть определенные вербальные последствия, исходящие от самого человека или его соседей. Иногда бывает важно оставить ряд событий между действием и конечным важным подкреплением для того, чтобы осуществлять контроль за поведением в практических целях. В сфере образования, промышленности, психотерапии и др. мы сталкиваемся с различными методиками, разработанными для создания соответствующих условных подкреплений. Обеспечение непосредственных эффективных последствий тогда, когда конечные последствия отсрочены, должно «улучшать мораль», «усиливать интерес», «предотвращать появление чувства неуверенности» или корректировать условия низкой оперантной силы, которые мы называем «abulia», и т. д. Конкретизируя это положение, можно сказать, что оно побуждает студентов учиться, лиц, нанятых на работу, приходить в учреждения, больных принимать посильное участие в общественной жизни и т. д.
Обобщенные (generalized) подкрепления. Условное подкрепление обобщается (is generalized), когда оно сочетается более чем с одним первичным подкреплением. Генерализованное подкрепление оказывается полезным потому, что состояние организма в данный момент необязательно является значимым. Оперантная сила, генерализованная посредством только одного подкрепления, наблюдается при создании соответствующего условия, депривации; когда мы подкрепляем пищей, мы получаем возможность управлять голодным животным. Но если условное подкрепление сочетается с подкреплениями, соответствующими многим условиям, тогда по крайней мере одно из них, соответствующее состоянию депривации, должно будет оказать влияние на последующую ситуацию. Поэтому реакция должна будет произойти. Например, когда мы подкрепляем деньгами, организуемое нами управление относительно независимо от кратковременных депривации…Создается один вид, обобщенного подкрепления, потому что многие первичные подкрепления получаются только после предъявленных преобразований физической среды.
В различных ситуациях одна форма «предшествующего» поведения может вести за собой различные виды подкреплений. Непосредственная стимуляция на основе такого поведения становится обобщенным подкреплением. Мы автоматически получаем подкрепление, независимо от любой определенной депривации, когда мы, успешно осуществляем контроль за физическим миром. Этим объясняется наша тенденция увлекаться профессиональным мастерством, художественным творчеством, и такими видами спорта, как игра в кегли, биллиард и теннис.
Однако возможны ситуации, при которых некоторые эффекты подкрепления «сенсорной обратной связи» не обусловливаются. Оказывается, что ребенок подкрепляется стимуляцией, идущей из среды, за которой не следует первичное подкрепление, например действие детской погремушки. Способность получать подкрепление таким образом могла возникнуть в эволюционном процессе, и она, возможно, аналогична подкреплению, которое мы получаем, просто «организуя мир соответствующим образом». Любой организм, который подкрепляется успешным взаимодействием со средой, несмотря на последствия в каждый момент, окажется в более благоприятных условиях, когда последуют значимые последствия.
Когда поведение подкрепляется другими людьми, появляется несколько важных генерализованных подкреплений, например внимание. Всем известны случаи, когда ребенок плохо ведет себя «только для того, чтобы привлечь к себе внимание». Внимание людей подкрепляет, потому что оно является необходимым условием других подкреплений, исходящих от них. Вообще, только те люди, которые внимательны к нам, подкрепляют наше поведение. Внимание со стороны людей, которые прежде всего обычно являются источниками подкрепления — родителей, учителя или любимого человека, — служит особенно хорошим обобщенным подкреплением и формирует особенно сильное поведение «получения внимания». Специфичность многих вербальных реакций состоит в том, что они привлекают внимание, например «смотри», «пойми», а также произнесение имени человека. Другими характерными формами поведения, которые можно назвать сильными, потому что они требуют внимания, являются симуляция болезни, раздраженность и броскость (самореклама).
Часто внимания бывает недостаточно. Другой человек может подкрепить только ту часть поведения данного человека, которое он одобряет, и, следовательно, любой признак его одобрения по праву становится подкрепляющим. Поведение, которое вызывает улыбку, или вербальную реакцию «Правильно», «Хорошо», или любую другую похвалу, подкрепляет. Мы пользуемся этим обобщенным подкреплением для формирования поведения других людей, особенно в сфере образования. Например, мы обучаем детей и взрослых говорить правильно, произнося «Правильно», когда они дают правильную поведенческую реакцию.
Еще более сильным генерализованным подкреплением является аффектация. Она может быть прежде всего связана с сексуальным контактом как первичным подкреплением, но когда тот, кто вызывает аффектацию, также вводит другие виды подкрепления, эффект тенерализуется.
Трудно дать определение внимания, одобрения и аффекта и также трудно наблюдать за ними и измерять их. Они являются не вещами, а аспектами поведения других. Их неуловимые физические параметры представляют трудность не только для ученого, который должен изучать их, но также и для индивида, которого они подкрепляют. Если мы не можем легко обнаруживать, что человек обращает внимание на нас, одобряет
наше поведение или что мы привлекательны для него, тогда наше поведение не будет последовательно подкрепляться. Поэтому оно может оказаться слабым, может иметь тенденцию протекать в несоответствующее время и т. д. Мы не знаем, что делать для того, чтобы «привлечь к себе внимание», «вызвать любовь», или «когда это делать». Ребенок, борясь за внимание, влюбленный — за проявления любви, художник — за одобрение его произведений, демонстрируют стойкое поведение, которое является только результатом прерывистого подкрепления.
Другим генерализованным подкреплением является подчиненность других людей. Когда человек бывает вынужден давать различные подкрепления, то любое указание на его подчиненность становится подкреплением. Задиристого человека всегда подкрепляют признаки трусости, а представителей правящего класса — признаки уважения. Престиж и уважение являются генера-лизованными подкреплениями только постольку, поскольку они гарантируют, что другие люди будут действовать определенным образом. То, что наличие своего собственного образа действия подкрепляет, можно показать на примере поведения тех людей, которые управляют ради того, чтобы управлять. Физические признаки покорности обычно не бывают столь неуловимыми, как свойства внимания, одобрения и любви. Задиристый человек может настаивать на проявлении четких признаков признания его доминирования, а ритуальные обычаи могут подчеркивать уважение.
Источники обобщенных подкреплений легко забываются, и они рассматриваются как подкрепления, имеющие якобы самостоятельную силу. Мы говорим о потребности во внимании, одобрении или аффекте, о «потребности в доминировании» и «любви к деньгам», как будто бы они являются первичными условиями де-привации. Но способность к подкреплению с помощью подобных средств едва ли может развиться за короткий промежуток времени, в течение которого преобладают необходимые условия. Внимание, аффект, одобрение и подчинение, по-видимому, существовали в человеческом обществе только короткий промежуток времени в процессе эволюции. Более того, они не представляют собой фиксированные формы стимуляции, поскольку зависят от особенностей склада определенных групп. Поскольку аффектация главным образом связана с сексуальной сферой, постольку она может быть связана с условием первичной депривации, которая в определенной мере независима от истории жизни человека, но признаки «удовольствия», которые приобретают силу подкрепления благодаря их связи с сексуальным контактом или с другими подкреплениями, едва ли могут обладать эффектом подкрепления по генетическим причинам. Символы появились еще позднее, и редко высказывается мнение, что потребность в них врождена. Обычно мы можем наблюдать за процессом, в котором ребенок начинает получать подкрепление в форме денег. Однако часто «любовь к деньгам» кажется независимой от «потребности в одобрении», но если мы более детально рассмотрим эффективность этих генерализованных подкреплений, у нас окажется столько же оснований для признания врожденной потребности к деньгам, как и для признания врожденной потребности во внимании, удовольствии или доминировании.
Обычно генерализованные подкрепления оказываются эффективными, даже если первичные подкрепления, на которых они основываются, больше их не сопровождают. Мы играем в игры, требующие определенных навыков ради них самих. Аффекты не всегда вызываются сексуальным подкреплением. Подчиненность других людей подкрепляет, даже если мы не используем ее. Эффект подкрепления деньгами жадного человека может оказаться настолько сильным, что он может обречь себя на голод, чтобы не лишиться их. Эти факты, поддающиеся наблюдению, должны занять надлежащее место при построении теорий и изучении практики. Они не означают, что обобщенные подкрепления представляют собой нечто большее, чем физические свойства стимулов, наблюдаемые в каждом случае, или что существуют какие-то нефизические данности, которые необходимо принимать во внимание.
Закон эффекта не является теорией. Это просто правило, объясняющее усиление поведения. Когда мы подкрепляем реакцию и наблюдаем за изменениями ее частоты, можно легко описать то, что произошло, в объективных терминах. Но при объяснении того, почему это произошло, необходимо обратиться к теории. Почему подкрепление подкрепляет? Одна из теорий утверждает, что организм повторяет реакцию, потому что он находит, что его следствия «приятны» или «приносят удовлетворение». Но в каком смысле это является объяснением для естественной науки? Такие характеристики, как «приятный» или «приносящий удовлетворение», вероятно, не относятся к физическим свойствам того, что подкрепляет, поскольку физическая наука не использует ни эти термины, ни какие-либо другие их эквиваленты. Термины должны характеризовать определенное воздействие на организм, но можно ли его определить таким образом, чтобы оно было пригодным для объяснения подкрепления?
Иногда полагают, что вещь является приятной, если индивид стремится к ней или сохраняет ее, и она считается неприятной, если индивид избегает или отвергает ее. Сделано много попыток найти объективное определение, но все они уязвимы для критики: определяемое поведение может быть просто еще одним продуктом эффекта подкрепления. Утверждение, что стимул приятен, потому что организм стремится приблизиться к нему или удержать его, может быть еще одним способом выражения того, что стимул подкрепил поведение «приближения» или «удержания». Вместо того чтобы определять эффект подкрепления с точки зрения его воздействия на поведение в общем, мы просто определили известный нам вид поведения, который почти с неизбежностью подкреплялся и, следовательно, в общем является пригодным в качестве индикатора силы подкрепления. Если продолжать утверждать, что стимул подкрепляет потому, что он приятен, тогда то, что выдвигается как объяснение, включающее два эффекта, в действительности является излишним описанием одного из них.
Альтернативный подход к описанию характеристик «приятный» и «неприятный» (или «приносящий удовлетворение» и «раздражающий») заключается в том, что испытуемого спрашивают, что он ощущает, когда имеет дело с определенными событиями. Это предполагает, что подкрепление имеет два эффекта: усиливает поведение и порождает «чувства» и что одно является функцией другого. Но функциональные отношения можно рассмотреть и в другой плоскости. Когда человек сообщает, что событие приятно, он может просто иметь в виду, что это такое событие, которое подкрепляет его или по отношению к которому он обнаруживает в себе тенденцию стремиться, двигаться, так как оно подкрепляет такое движение. Далее мы увидим, что человек мог бы и не приобретать вербальные реакции, указывающие на его ощущение удовольствия, если бы подобный феномен не имел бы места. В любом случае сам испытуемый не получает преимуществ, фиксируя таким образом свои наблюдения. Субъективные суждения об удовольствии или удовлетворении, порождаемые стимулами, как правило, ненадежны и неустойчивы. Как подчеркивается в теории бессознательного, мы не можем давать самоотчет о всех событиях, которые проявляют себя как подкрепляющие нас, или мы можем сообщить о том, что вступает в прямое противоречие с объективными наблюдениями; также мы можем назвать неприятным событие, которое в действительности подкрепляет. Примеры такой аномалии варьируют от мазохизма до мученичества.
Иногда утверждают, что подкрепление оказывается эффективным потому, что оно редуцирует состояние депривации. В данном случае имеет место по крайней мере побочный эффект, который не следует путать с самим подкреплением. Очевидно, что депривация имеет большое значение для оперантного обусловливания. В наших экспериментах мы имеем дело с голодным голубем и по-другому не можем продемонстрировать oпeрантное обусловливание. Чем голоднее птица, тем чаще она реагирует в результате подкрепления. Но, несмотря на эту связь, неправильно было бы считать, что подкрепление всегда редуцирует депривацию. Обусловливание может наступать прежде любого значительного изменения в депривации, измеряемой другими способами.
Связь между насыщением и подкреплением следует искать в процессе эволюции. Едва ли можно оставить без внимания тот факт, что первичные подкрепления играют огромную биологическую роль. Пища, вода, сексуальный контакт и избегание боли явно связаны с благополучием организма. Индивид, который подкрепляется такими событиями, приобретает в высшей степени эффективное поведение. Также биологически значимым является то обстоятельство, согласно которому поведение, порождаемое определенным подкреплением, с большей вероятностью появляется в состоянии депривации. Таким образом, важным является не только то, что любое поведение, которое приводит к приему пищи, должно стать важной частью поведенческого репертуара, но и то, что это поведение оказывается особенно сильным, когда организм голоден. Эти две особенности организма, по-видимому, определяют то, что организм может подкрепляться специфическими способами и что результат будет наблюдаться в релевантных условиях депривации.
Некоторые формы стимуляции получают положительное подкрепление, хотя они не вызывают поведения, имеющего биологическое значение. Ребенок подкрепляется не только пищей, но и звоном колокольчика или блеском яркого предмета. Поведение, которое постоянно следует за этими стимулами, характеризуется увеличением вероятности. Трудно, а может быть и невозможно проследить эти эффекты подкрепления в истории обусловливания. Позднее мы можем обнаружить, что того же самого индивида подкрепляют звучание оркестра или красочный спектакль. В данном случае еще труднее убедиться в том, что эффект подкрепления не обусловлен. Однако можно утверждать, что способность получить подкрепление из среды с помощью любой обратной связи была бы биологическим достижением, поскольку она готовила бы организм к успешному управлению средой, прежде чем сформируется данное состояние депривации. Когда организм порождает тактильную обратную связь, например, ощущение текстуры материала или поверхности скульптуры, обусловливание обычно рассматривается как результат сексуального подкрепления даже тогда, когда стимулируемая область по функции не является первично-сексуальной. В этой связи хотелось бы предположить, что другие формы стимуляции, продуцированные поведением, точно так же связаны с биологически значимыми событиями.
Когда среда изменяется, тогда способность получать подкрепление данным событием с биологической точки зрения может рассматриваться как недостаток. Сахар является очень обильным подкреплением для большинства представителей человеческого рода, о чем свидетельствует огромное количество прилавков для продажи сладостей. В этом отношении его эффект гораздо превосходит биологическую потребность в нем в наши дни.
Этого не было до того, как сахар стал выращиваться и производиться в большом количестве. Несколько сот лет тому назад сильный подкрепляющий эффект сахара, вероятно, был оправдан. Среда изменилась, но генетические возможности организма остались на прежнем уровне. Секс является еще одним примером. В настоящее время сильный эффект сексуального контакта не является преимуществом организма, но нам нет необходимости возвращаться на много лет назад, для того чтобы обнаружить условия голода и эпидемий, при которых сила сексуального подкрепления была оправдана. Объяснение силы подкрепления биологией организма можно продолжать до тех пор, пока мы будем говорить о том, почему то или иное событие подкрепляет. Для функционального анализа такое объяснение, вероятно, ничего не даст, так как оно не дает никаких способов идентификации подкрепляющих стимулов, прежде чем мы не испытаем его подкрепляющего воздействия на организм. Следовательно, мы должны довольствоваться объяснением с точки зрения воздействий стимулов на поведение.
НЕПРЕДВИДЕННЫЕ ОБСТОЯТЕЛЬСТВА И «СУЕВЕРНОЕ» ПОВЕДЕНИЕ
Утверждалось, что эксперименты Торндайка нетипичны для процесса научения, поскольку кошка не может «видеть связей» между движением задвижки и «выходом из ящика». Но в оперантном обусловливании фиксирование связей не является существенным моментом. Как во время, так и после обусловливания человек часто рассказывает о связи своего поведения с окружающей его средой. Его отчет может оказаться пригодным для научного объяснения, и его реакция на его собственное поведение может даже оказаться важным связующим звеном в определенных сложных процессах. Но в простых процессах оперантного обусловливания такие отчеты или реакции не требуются. Это объясняется тем, что человек может оказаться неспособным описать контингента подкрепления, которые имели явно выраженный эффект.
Также отсутствует необходимость в каких-либо перманентных связях между реакцией и ее подкреплением.
Мы делаем прием пищи зависимым от реакции голубя, организуя механические и электрические связи. За пределами лаборатории ситуации, в которых возникают связи между поведением и его следствием, определяются различными физическими системами. Но это никак не влияет на организм, и в этом никакой необходимости нет. Что касается самого организма, то единственно важное свойство контингента подкрепления — в его временном характере. Подкрепление следует за реакцией. Каким образом это происходит, значения не имеет.
Мы должны допустить, что презентация подкрепления всегда что-то подкрепляет, поскольку она неизбежно совпадает с каким-либо поведением. Мы знаем, что уже одно подкрепление может иметь значительный эффект. Если устанавливается только случайная связь между реакцией и появлением стимула, поведение называется «суеверным». Мы можем показать это на примере с голубем, аккумулируя эффект нескольких случайных обстоятельств. Предположим, что мы будем давать голубю небольшое количество еды каждые пятнадцать секунд, независимо от того, что он делает. Когда пища предъявляется первый раз, он выполняет какие-то поведенческие реакции — если только он не будет стоять спокойно — и произойдет обусловливание. Тогда более вероятно, что при предъявлении пищи снова будет наблюдаться то же самое поведение. Если это произойдет, то оперант будет еще более усилен. Если этого не произойдет, то будет усилено какое-то другое поведение. Обычно данное поведение достигает частоты, с которой оно подкрепляется. В дальнейшем оно становится постоянной частью репертуара птицы, даже если пища предъявлялась в такое время, которое не связано с поведением птицы. Видимые реакции, которые были установлены таким образом, включают резкие наклоны головы, переступание с ноги на ногу, наклоны и шарканье ногами, повороты вокруг своей оси, неестественную походку и наклоны головы. В дальнейшем топография поведения может сместиться на другие подкрепления, поскольку легкие изменения в форме реакции могут совпадать с приемом пищи.
При продуцировании «суеверного» поведения важное значение имеют интервалы, через которые подается пища. За шестьдесят секунд эффект подкрепления утрачивается в значительной мере, прежде чем появляется другой, и вероятность появления другого поведения больше. Следовательно, вероятность появления «суеверного» поведения меньше, хотя оно может иметь место, если эксперимент выполняется на протяжении длительного времени. Через пятнадцать секунд обычно эффект бывает почти мгновенным. Когда «суеверная» реакция устанавливается, она будет сохраняться, даже если она будет подкрепляться изредка.
Голубь не является исключением. Поведение людей также во многом «суеверно». Только небольшая часть поведения, усиливаемая непредвиденными обстоятельствами, становится ритуалом, который мы называем «суеверием», однако сам принцип сохраняется в силе. Предположим, что, прогуливаясь по парку, вы находите десять долларов (и предположим, что это событие имеет для вас значительный подкрепляющий эффект). То, что мы делали в момент, когда мы нашли деньги, подкрепляется. Конечно, трудно привести строгие доказательства, но весьма вероятно, что мы вновь пойдем на прогулку именно в тот же парк или в парк, похожий на этот, и более вероятно, что мы будем смотреть именно на та место, где были найдены деньги, и т. д. Это поведение будет варьироваться в зависимости от состояния депривации, которому релевантны деньги. Его не следует называть «суеверным», но оно порождается ситуацией, которая редко оказывается «функциональной».
Некоторые ситуации, которые продуцируют «суеверное» поведение, не являются абсолютно случайными. Иногда за реакцией следует следствие, которое тем не менее ее не «продуцирует». Это можно лучше всего показать на примерах с таким типом стимула, который подкрепляет после его устранения. Прекращение кратковременной стимуляции такого вида может подкреплять поведение, порождаемое его началом. Когда появляется неприятный стимул, организм приходит в состояние активности; стимул, прекращает свое действие, и это подкрепляет определенную часть поведения. Определенные заболевания, хромота, аллергия таковы, что любые меры, предпринятые для того, чтобы вылечить их, вероятно, будут подкреплять, когда состояние улучшится. Необязательно, чтобы данная мера была актуально связана с лечением. Ритуалы, используемые в ненаучной, народной медицине, вероятно, можно объяснить с точки зрения этой характеристики многих форм заболеваний.
В «суеверном» оперантном поведении, как и в условных «суеверных» рефлексах, процесс обусловливания терпит неудачу. Обусловливание дает организму большие преимущества, вооружая его средствами поведения, которое позволяет ему действовать в новых условиях, однако не существует способов предотвращения усвоения неэффективных приемов случайного поведения. Любопытно, что эта трудность, вероятно, возрастала по мере развития обусловливания в процессе эволюции. Если, например, для изменения вероятности реакции всегда требовалось три подкрепления, «суеверное» поведение было бы невероятным. Только потому что организм достиг такого уровня, на котором уже один контингент приносит значительные изменения поведения, они могут совпадать.
В человеческом обществе «суеверные» ритуалы включают в себя вербальные формулы и передаются как часть культуры. В этом смысле они отличаются от простого эффекта оперантного подкрепления. Но, вероятно, их источником является один и тот же процесс, и их, должно быть, поддерживают случайные условия, которые имеют такой же паттерн.
ЦЕЛИ, НАМЕРЕНИЯ И ДРУГИЕ КОНЕЧНЫЕ ПРИЧИНЫ ПОВЕДЕНИЯ
Неправильно говорить, что оперантное подкрепление «усиливает» реакцию, которая предшествует ему. Реакция уже произошла и не может измениться. Изменению подвергается будущая вероятность реакции одного и того же класса. Именно оперант как класс поведения, а не реакция как определенный случай подвергается обусловливанию. Следовательно, отсутствуют нарушения фундаментальных принципов науки, которые исключают «конечные причины». Но этот принцип нарушается, когда начинают утверждать, что поведение находится под контролем «мотивов», или «целей», которых организм еще не достиг, или «намерений», которых он еще не выполнил. Утверждения, в которых используются такие слова, как «мотив», или «цель», обычно сводятся к утверждениям об оперантном обусловливании, и необходимо внести лишь небольшое изменение, для того чтобы ввести их в русло естественной науки. Вместо того чтобы говорить, что человек ведет себя соответствующим образом потому, что есть следствия, которые должны следовать за его поведением, мы просто говорим, что он ведет себя так потому, что имеются следствия, которые следовали за похожим поведением в прошлом. Это, конечно, закон эффекта, или оперантное обусловливание.
Иногда утверждают, что данную реакцию нельзя полностью описать до тех пор, пока не будут рассмотрены ее цели как ее «текущее» свойство. Но что имеется в виду под словом «описать»? Если мы пронаблюдаем за человеком, идущим по улице, мы сможем описать это событие на языке физической науки. Если затем мы добавим, что его цель состояла в том, чтобы опустить письмо, дополнит ли это то, что было выражено в первом высказывании? Вероятно, ответ будет положительным, так как человек может идти по улице «по многим причинам» и в каждом случае физический способ передвижения останется одним и тем же. Однако различительную грань необходимо проводить не по линии поведения, а по линии переменных величин, от которых поведение зависит функционально. Цель является свойством не самого поведения, а является способом обращения к контролирующим переменным. Если мы составляем наше описание после того, как мы увидели, что человек опустил свое письмо в почтовый ящик и повернул обратно, мы приписываем ему цель события, которое заставило его идти по улице. Это событие придает «смысл» его выполнению не посредством расширения описания как такового, а посредством указания на независимую переменную, функцией которого оно могло бы быть. Мы не можем увидеть его цель, не увидев, что он опустил письмо, если только прежде мы не наблюдали подобного поведения и подобных следствий. В тех случаях, когда мы это делаем, мы пользуемся данным термином просто для предсказания того, что в данной ситуации им будет опущено письмо.
Также и наш испытуемый не может видеть свою цель, не соотносясь с похожими событиями. Если мы спросим его, почему он идет по улице или какова его цель, и он ответит: «Я иду, чтобы опустить письмо», то. мы не узнаем ничего нового о его поведении, кроме нескольких возможных причин. Конечно, сам испытуемый может находиться в преимущественном положении, описывая эти переменные, поскольку он находится в постоянном контакте со своим поведением на протяжении многих лет. Следовательно, его утверждение относится к тому же классу, что и утверждения других людей, которые несколько раз наблюдали за его поведением. Он просто делает возможное предсказание с точки зрения своего опыта с самим с собой. Более того, он может ошибаться. Он может сообщить о том, что собирается отправить письмо, и, действительно, он может нести в руке неотправленное письмо и опустить его в конце улицы, но мы все-таки можем показать, что его поведение определяется тем фактом, что в прошлом он находился в таких ситуациях, когда он имел дело с человеком, значимость которого для него связана с такой прогулкой. Он может не осознавать эту цель в том смысле, что он не способен сказать, что его поведение определяется именно этой причиной. Тот факт, что оперантное поведение «направлено на будущее», вводит в заблуждение. Например, рассмотрим случай, когда «что-либо, ищется». В каком смысле это «что-либо», которое еще не было найдено, релевантно поведению? Предположим, что мы научаем голубя клевать пятно на стенке ящика и после формирования операнта устраняем пятно. Птица подойдет к привычному для нее месту около стены. Она поднимет голову, направит взгляд в привычном направлении и даже возможно, что она произведет слабое клевательное движение. До тех пор пока процесс угашения не продвинется очень далеко, она будет возвращаться на то же самое место и демонстрировать те же поведенческие реакции. Можно ли говорить, что голубь ищет пятно? Должны ли мы при объяснении поведения принимать во внимание поиск пятна?
Интерпретация этого поведения с позиций оперантного обусловливания не представляет большого труда. Поскольку визуальная стимуляция, исходящая от пятна, обычно предшествовала приему пищи, пятно стало условным подкреплением. Оно усиливает поведение поиска в данном направлении с различных положений. Хотя мы пытались обусловливать только реакцию клевания, в действительности мы усиливали много различных видов «предшествующего» поведения, которые заставляли птицу принять положение, из которого она ищет пятно и клюет его. Эти реакции продолжают появляться даже тогда, когда мы убираем пятно вплоть до наступления затухания. Пятно, которое ищется, является таким пятном, которое в прошлом было неотсроченным подкреплением поискового поведения. В общем, поиск чего-либо включает в себя порождение реакций, которые в прошлом произвели «нечто» как следствие.
Аналогичная интерпретация применима к поведению человека. Когда мы видим, что человек передвигается по комнате, открывает ящик письменного стола, смотрит на что-то, находящееся под журналами и т. д., можно совершенно объективно описать его поведение: «Сейчас он находится в определенной части комнаты; большим и указательным пальцами правой руки он держит книгу; он поднимает книгу и наклоняет свою голову так, чтобы можно было видеть любой объект, находящийся под книгой». Можно также проинтерпретировать его поведение или «придать ему смысл»: он ищет что-то, или, если быть более конкретным, он ищет очки. То, что мы добавляем, является не дальнейшим описанием его поведения, а суждением о некоторых переменных, определяющих его. Здесь нет ни текущей цели, ни мотива, ни намерения, которые должны быть приняты во внимание. То же самое будет иметь место, даже если мы спросим его о том, что он делает, и он ответит: «Я ищу свои очки». Это не дальнейшее описание его поведения, а это описание переменных, функцией которых является его поведение, оно эквивалентно высказываниям: «Я потерял очки», «Я прекращу делать то, что я делаю, когда найду мои очки», или «Когда я это делал в прошлом, я находил мои очки?» Эти выражения могут показаться не вполне конкретными, однако это происходит потому, что высказывания, включающие цели и намерения, являются аббревиатурами.
Очень часто приписывание цели поведению используется как еще один способ описания биологической адаптации. Это положение уже обсуждалось, однако можно добавить следующее. Как в оперантном обусловливании, так и в эволюционном отборе поведенческих характеристик следствия изменяют будущую вероятность. Рефлексы и другие врожденные паттерны поведения развиваются, потому что они увеличивают вероятность выживания вида. Операнты укрепляются, потому что за ними следуют важные следствия в жизни индивидов. По той же самой причине оба процесса порождают вопрос о цели, и в обоих случаях обращение к конечной причине может быть аналогичным образом отвергнуто. Паук не владеет тщательно отработанным репертуаром поведения, с помощью которого он плетет паутину, потому что она дает ему возможность ловить пищу, благодаря которой он выживает. Он владеет схожим поведением, потому что в прошлом такое же поведение пауков давало им возможность ловить пищу, которая необходима для выживания. В эволюции поведению «плетения паутины» соответствовала серия событий. Мы не правы, когда говорим, что видим «цель» плести паутину, наблюдая похожие события в жизни индивида.
Опубликовано:26.04.2018Вячеслав Гриздак