Книги о Скиннере Оперантное поведение (глава V )

Ф. Скиннер. Наука и человеческое поведение
Глава V. Оперантное поведение

ПОСЛЕДСТВИЯ ПОВЕДЕНИЯ
Рефлексы, как условные, так и все остальные, связаны главным образом с внутренней физиологией организма. Однако нас чаще всего интересует поведение, которое оказывает определенное воздействие на окружающий мир. Такое поведение создает большинство практических проблем в деятельности человека, а также представляет особый интерес для теории в силу своих специфических характеристик. Для организма последствия поведения могут играть роль «обратной связи». В этом случае они изменяют вероятность возникновения поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например, «вознаграждение» и «наказание», но ясное представление о нем мы можем получить только посредством экспериментального анализа.
КРИВЫЕ НАУЧЕНИЯ
Одна из первых серьезных попыток изучения изменений, производимых последствиями поведения, была предпринята Э.Л. Торндайком в 1898 году. Его эксперименты возникли на основе дискуссии, которая в то время интересовала многих ученых. Настаивая на непрерывности видов, Дарвин подверг сомнению веру в то, что человек – единственное животное, способное мыслить. В печати появилось большое количество историй о животных, демонстрирующих «силу разума». Но когда понятия, ранее применимые только к поведению человека, распространили на животных, это вызвало определенные вопросы, связанные с их значением. Указывали ли наблюдаемые факты на психические процессы, или эти видимые проявления мышления можно было объяснить иначе? В конце концов, стало ясно, что предположение о существовании внутренних мыслительных процессов не является необходимым. Должно было пройти много лет, прежде чем аналогичный вопрос был серьезно поставлен применительно к поведению человека, но эксперименты Торндайка и его альтернативное объяснение мышления животных стали важным шагом в этом направлении.
Если кошка помещена в ящик, из которого она может выбраться, только открыв задвижку, она проявит множество видов поведения, некоторые из которых могут оказаться эффективными для открытия дверцы. Торндайк установил, что при многоразовом помещении кошки в такой ящик поведение, ведущее к освобождению, возникало все быстрее и быстрее, пока, наконец, не стало предельно простым и быстрым. Кошка решала эту задачу, словно была «мыслящим» человеческим существом, хотя, возможно, и не так быстро. Однако Торндайк не видел за этим никаких «мыслительных процессов» и утверждал, что для объяснения они не нужны. Он смог описать свои результаты, указав, что часть поведения кошки была «запечатлена», поскольку за ней следовало открытие дверцы.
Тот факт, что поведение запечатлевается, когда сопровождается определенными последствиями, Торндайк назвал «законом эффекта». В своих исследованиях он наблюдал, что в одной и той же ситуации определенное поведение возникает все быстрее и быстрее по сравнению с другим поведением, характерным для этой ситуации. Фиксируя последовательные промежутки, которые требовались кошке, чтобы выбраться из ящика, и отмечая их на графике, он построил «кривую научения». Эта ранняя попытка описать количественные особенности поведения, аналогичные физическим и биологическим процессам, была объявлена важным шагом вперед. Был обнаружен продолжительный во времени процесс, незаметный для обычного наблюдения. Одним словом, Торндайк совершил открытие. С тех пор было получено множество похожих кривых, вошедших в главы по научению в психологических работах.
Однако сами кривые научения не описывают базовый процесс «запечатлевания». Единица измерения Торндайка – время, необходимое животному, чтобы выбраться – была связана с устранением других видов поведения, и его кривая зависела от множества различных действий, которые могла совершать кошка в конкретном ящике. Кривая также зависела и от поведения, которое экспериментатор или аппаратура определяли как «успешное», а также от того, являлось ли это поведение обычным или редким в сравнении с другими видами действий, возникающих в ящике. Таким образом, можно сказать, что форма получаемой таким образом кривой скорее отражала свойства самого проблемного ящика, а не поведения кошки. Это же верно в отношении многих других устройств, разработанных для исследования научения. Разнообразные лабиринты, которые учатся проходить белые мыши и другие животные, «ящики выбора», в которых животные учатся различать свойства или паттерны стимулов, аппараты для изучения человеческой памяти, позволяющие предъявлять материал в определенной последовательности, – все они порождают свои типы кривых научения.
Усредняя множество отдельных случаев, мы можем сгладить эти кривые настолько, насколько хотим. Более того, кривые, полученные в различных условиях, могут иметь общие свойства. Например, при измерении данным способом научение обычно «негативно ускорено» – улучшение выполнения происходит все медленнее и медленнее, пока не наступает момент, когда дальнейшее улучшение невозможно. Но из этого не следует, что негативное ускорение характеризует базовый процесс. Предположим по аналогии, что мы наполнили стеклянную банку мелким гравием и так хорошо его перемешали, что камешки разных размеров равномерно распределились внутри нее. Если мы слегка встряхнем банку, мы увидим, как камешки перераспределяются. Большие движутся к верху, а маленькие – к низу. Этот процесс также негативно ускорен. Сначала смесь перераспределяется быстро, но, по мере приближения к состоянию, в котором дальнейшие изменения уже невозможны, процесс происходит все медленнее. Такая кривая может оказаться вполне гладкой и воспроизводимой, но сам по себе этот факт не имеет большого значения. Эта кривая – результат определенных фундаментальных процессов, включающих взаимодействие камешков различных размеров, распределение сил, возникших из-за встряхивания, и т.д., но это отнюдь не самый прямой способ их регистрации.
Кривые научения показывают, как отбираются, выделяются и реорганизуются различные виды поведения, возникающие в сложных ситуациях. Базовый процесс запечатлевания отдельного действия осуществляет это изменение, но в самом изменении этот процесс прямо не отражен.
ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ
Для понимания сущности «закона эффекта» Торндайка нам необходимо прояснить понятие «вероятность реакции». Это крайне важное, но, к сожалению, очень сложное понятие. При обсуждении человеческого поведения, мы часто ссылаемся на «тенденции» и «предрасположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как наблюдать тенденцию? И как мы можем ее измерить?
Если бы определенное поведение существовало только в двух состояниях, в одном из которых оно бы происходило всегда, а в другом – никогда, мы бы оказались практически беспомощны в попытках следовать программе функционального анализа. Предмет изучения типа «все-или-ничего» подходит только для самых простых форм описания. Гораздо продуктивней предположить, что вероятность возникновения реакции непрерывно распределяется между этими полюсами «все-или-ничего». В этом случае мы можем изучать переменные, которые в отличие от вызывающих стимулов, не будучи «причиной определенного поведения», делают его возникновение более вероятным. Далее мы можем, например, перейти к рассмотрению комбинированного влияния нескольких таких переменных.
Общепринятые выражения, использующие понятия вероятности, тенденции или предрасположенности, описывают частоту возникновения поведения. Мы никогда не наблюдаем вероятность как таковую. Мы говорим, что человек «увлечен» бриджем, когда мы видим, что он часто играет в него и говорит о нем. «Глубоко интересоваться» музыкой – значит часто исполнять музыку, слушать ее и говорить о ней. «Заядлый» игрок – тот, кто часто играет в азартные игры. Любитель фотографии делает снимки, проявляет и рассматривает фотографии, сделанные им самим и другими людьми. Человек с «большим сексуальным аппетитом» часто вовлечен в различные формы сексуального поведения. «Алкоголик» часто пьет.
Характеризуя поведение человека в терминах частоты, мы принимаем определенные стандартные условия: он должен быть способен выполнить и повторить определенное действие, при этом другое поведение не должно этому заметно мешать. Например, мы не можем знать, насколько человек увлечен музыкой, если он постоянно занят другими делами. Уточняя понятие вероятности с научной целью, мы видим, что и в науке наши данные также являются частотами и что условия, в которых они наблюдаются, должны быть точно определенными. Основная техническая проблема в планировании и проведении контролируемого эксперимента – сделать возможным наблюдение и интерпретацию частот. Мы устраняем или, по крайней мере, сохраняем константным любое условие, которое провоцирует поведение, конкурирующее с тем, что мы изучаем. Организм помещается в изолированный ящик, в котором его поведение можно наблюдать через односторонний экран или записывать при помощи аппаратуры. Безусловно, это вовсе не вакуумная среда, поскольку организм будет множеством способов реагировать на особенности ящика. Но со временем его поведение достигнет довольно устойчивого уровня, относительно которого можно исследовать частоту выбранной реакции.
Чтобы исследовать процесс, который Торндайк назвал «запечатлеванием», у нас должно быть его «последствие». Им может послужить предоставление еды голодному животному. Удобным способом кормления является небольшой лоток для пищи, управляемый электричеством. Когда лоток откроется в первый раз, организм, вероятно, будет на него реагировать способами, мешающими процессу, который мы планируем наблюдать. Со временем после неоднократного кормления при помощи лотка, животное с готовностью из него ест, и мы получаем возможность связать это последствие с поведением и наблюдать результат.
Мы выбираем относительно простой вид поведения, который можно легко и быстро повторить и который просто наблюдать и регистрировать. Если нашим экспериментальным объектом является, например, голубь, подходящим вариантом поведения является поднятие головы выше определенного уровня. За ним можно наблюдать при помощи шкалы, нанесенной на заднюю стенку ящика. Сначала мы определяем обычную высоту, на которой голубь держит голову, и выбираем отметку на шкале, которая достигается лишь изредка. Затем, фиксируя взгляд на шкале, мы начинаем очень быстро открывать пищевой лоток каждый раз, как голова поднимается выше этой линии. Если эксперимент проводится в соответствии с инструкцией, результат неизменен: мы наблюдаем немедленное изменение частоты пересечения заданной линии головой голубя. Мы также видим, что теперь голова голубя поднимается ещё выше, и этот факт имеет определенное теоретическое значение. Почти сразу же мы можем перейти к более высокой отметке, которой теперь будет определяться предоставление пищи. Спустя одну-две минуты поза птицы изменится настолько, что ее голова будет редко опускаться ниже первоначально выбранной линии.
Когда мы демонстрируем процесс запечатлевания в такой относительно простой форме, мы видим, что некоторые типичные интерпретации эксперимента Торндайка являются избыточными. Так, здесь явно неуместно выражение «обучение методом проб и ошибок», которое часто связывают с законом эффекта. Называя любое направленное вверх движение головы «попыткой», мы приписываем нашим наблюдениям нечто несуществующее, и нет оснований называть «ошибкой» любое движение, которое не приводит к определенным нами последствиям. Даже сам термин «научение» вводит в заблуждение. Утверждение, что птица «научается получать еду, вытягивая шею», является некорректным описанием происходящего. Сказать, что у нее появилась «привычка» вытягивать шею, значит прибегнуть к объяснительной фикции, поскольку единственным свидетельством существования привычки является приобретенная тенденция выполнять действие. Простейшим возможным описанием процесса является следующее: мы связываем заданное последствие с определенными физическими свойствами поведения (направленное вверх движение головы), и далее в наблюдении устанавливаем, что частота этого поведения возрастает.
Принято рассматривать любое движение организма как «реакцию». Это слово заимствовано из области изучения рефлекторных действий и предполагает действие, которое, так сказать, отвечает на предшествующее событие – стимул. Но мы можем сделать событие контингентно зависимым от поведения без определения предшествующего стимула или даже не имея самой возможности его определить. Мы не изменяли среду голубя, чтобы вызвать поднимание головы. Вероятно, невозможно показать, что какой-то отдельный стимул неизменно предшествует этому движению. Такое поведение может находиться под контролем стимулов, но эта связь не такого рода, что одно вызывает другое. Таким образом, термин «реакция» не вполне адекватен, но он настолько укоренился, что мы продолжим его использовать в дальнейшем обсуждении.
Разумеется, нельзя предсказать или проконтролировать реакцию, которая уже произошла. Мы можем лишь предсказать, что похожие реакции произойдут в будущем. Таким образом, единицей предсказательной науки является не реакция, а класс реакций. Для описания этого класса будет использоваться слово «оперант». Это понятие подчеркивает тот факт, что поведение оперирует средой, производя последствия. Именно последствия определяют свойства, по которым устанавливается сходство реакций. Термин будет использоваться и как прилагательное (оперантное поведение), и как существительное – для обозначения поведения, определенного заданным последствием.
Единичное поднимание головы голубем является реакцией. Это некоторое прошлое, которое мы можем рассмотреть с любой точки зрения, которая нам интересна. Поведение, называемое «поднимание головы» безотносительно к конкретному случаю, – это операпт. Он может быть описан не как завершенный акт, а скорее как множество действий, определенных свойствами высоты, на которую поднимается голова. В этом смысле оперант определяется результатом, который можно выразить в физических терминах: «пересечение» определенной высоты является свойством поведения.
Традиционное значение термина «научение» можно с пользой сохранить для описания рекомбинации реакций в сложной ситуации. Терминологию для описания процесса запечатлевания можно заимствовать из анализа условных рефлексов, проведенного Павловым. Павлов называл все события, усиливающие поведение, «подкреплением», а все производимые изменения «обусловливанием». Однако в экспериментах Павлова подкрепляющий стимул сочетается с безусловным стимулом, в то время как в оперантном поведении он контингентно зависит от реакции. Таким образом, оперантное подкрепление является отдельным процессом и требует отдельного анализа. В обоих случаях, усиление поведения в результате подкрепления вполне уместно назвать «обусловливанием». В оперантном обусловливании мы «усиливаем» оперант в том смысле, что делаем реакцию более вероятной или, что точнее соответствует действительности, более частой. В павловском, или «респондентном» обусловливании , мы просто повышаем величину реакции, вызванной условным стимулом, и сокращаем время между стимулом и реакцией. (В этой связи отметим, что этими двумя случаями исчерпываются все возможности: организм обусловливается, когда подкрепляющий стимул (1) сопутствует другому стимулу или [2] следует за собственным поведением организма. Любое другое событие не влияет на изменение вероятности реакции.)
В опыте с голубем еда является подкрепляющим стимулом, или подкрепителем “, а ее предъявление, когда возникает реакция, – подкреплением. Оперант определяется свойством, от которого контингентно зависит подкрепление, – высотой, на которую нужно поднять голову. Изменение частоты, с которой на эту высоту поднимается голова, есть оперантное обусловливание.
Пока мы бодрствуем, мы постоянно воздействуем на окружающую среду, и многие последствия наших действий имеют подкрепляющий эффект. Посредством оперантного обусловливания среда создает базовый репертуар, посредством которого мы сохраняем равновесие, ходим, играем в игры, пользуемся инструментами и приборами, говорим, пишем, ходим под парусом, управляем автомобилем или летаем на самолете. Мы можем оказаться не готовы к изменению среды – новой машине, новому другу, новому интересу, новой работе или новому месту, – но, как правило, наше поведение быстро приспосабливается к нему, когда мы приобретаем новые реакции и утрачиваем старые. В следующей главе мы увидим, что оперантное обусловливание делает больше, чем просто создает поведенческий репертуар. Оно повышает эффективность поведения и еще долгое время сохраняет его в силе после того, как его приобретение или эффективность перестали представлять интерес.
КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ
Получить кривую оперантного обусловливания не так просто. Мы не можем ни полностью изолировать оперант, ни устранить все случайные факторы. В нашем примере мы могли бы построить кривую, показав, как частота поднимания головы голубем на определенную высоту изменяется в зависимости от времени или числа подкреплений, но проблема в том, что общий эффект очевидно больше. Происходит сдвиг в расширенном сегменте поведения, и чтобы его полностью описать, мы должны отследить все движения головы. И даже в этом случае наше описание не будет полным. Высота, на которую должна подняться голова голубя, была выбрана произвольно, и действие подкрепления зависит от этого выбора. Если мы подкрепляем редко достигаемую высоту, изменение модели будет гораздо большим, чем если бы мы выбрали более типичную высоту. Для адекватного описания нам требуется построить множество кривых, покрывающих все возможности. Если заставить голубя поднимать голову все выше и выше, возникает еще один произвольный элемент, поскольку мы можем использовать разные режимы изменения повышения линии, выбранной для подкрепления. Каждый режим дает свою собственную кривую, и картина станет полной, только если включит в себя все возможные режимы.
Мы не можем избежать этих проблем, выбирая реакцию, которая более строго определена характеристиками среды – например, открытие дверной задвижки. Безусловно, некоторые механические индикаторы поведения дают преимущество, например, помогая нам осуществлять подкрепление последовательно и единообразно. Мы могли бы регистрировать высоту головы голубя при помощи устройства с фотоэлементом, но проще выбрать такую реакцию, которая сама производит изменение в среде и которое проще регистрировать. Если птица обусловливается клевать маленький диск на стенке экспериментального ящика, можно использовать движение диска для замыкания электрической цепи – одновременно и для выдвижения пищевого лотка, и для подсчета или регистрации реакций. Такая реакция кажется отличной от вытягивания шеи тем, что имеет характер «все или ничего». Но мы скоро увидим, что механические особенности нажимания на диск не определяют «реакцию», которая менее произвольна, чем вытягивание шеи. Организация эксперимента не должна быть совершенной, чтобы получить важные количественные данные об оперантном обусловливании. Уже сейчас мы можем оценить многие факторы. Так, очевидна важность обратной связи. Чтобы произошло обусловливание, организм должен стимулироваться последствиями своего поведения. Например, при научении шевелить ушами необходимо знать, когда уши двигаются, если нужно усилить реакции, которые производят это движение, в сравнении с реакциями, которые этого не делают. При обучении пациента заново пользоваться частично парализованной конечностью может быть полезно усилить обратную связь от еле заметных движений, например, при помощи оборудования или отчета инструктора. Глухонемой человек учится говорить, только когда получает такую обратную связь от своего собственного поведения, которую можно сравнить со стимуляцией, получаемой им от других говорящих. Одна из функций педагога заключается в обеспечении произвольных (порой ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, величины и оперативности подкрепления, а, кроме того, и многих других факторов.
Разовое подкрепление может иметь значительный эффект. В благоприятных условиях частота реакции сдвигается от преобладающего низкого значения до стабильно высокого одним резким скачком. Обычно же мы наблюдаем существенное увеличение в результате первого подкрепления и дальнейший рост в ходе дальнейших подкреплений. Это наблюдение не противоречит предположению о мгновенном изменении в сторону максимальной вероятности, поскольку мы не изолировали единичный оперант. Увеличение частоты следует интерпретировать, учитывая другие поведенческие характеристики ситуации. Тот факт, что обусловливание может быть настолько быстрым у таких «простых» организмов, как крыса или голубь, приводит к интересным выводам. Различия в том, что обычно называют интеллектом, отчасти приписываются различиям в скорости научения. Но нет научения быстрее мгновенного увеличения вероятности реакции. Таким образом, превосходство человеческого поведения заключается в чем- то другом.
КОНТРОЛЬ ОПЕРАНТНОГО ПОВЕДЕНИЯ
Экспериментальная процедура оперантного поведения безыскусна. Мы создаем контингенцию подкрепления и на определенное время помещаем в нее организм. Затем на основе этого мы объясняем частое появление реакции. Что было сделано для улучшения предсказания и контроля поведения в будущем? Какие переменные позволяют нам предсказать, будет организм реагировать или нет? Какие переменные мы должны контролировать, чтобы побудить его реагировать?
Мы экспериментировали с голодным голубем. Это означает, как мы увидим в главе IX, что голубь лишался еды на определенный период времени или до тех пор, пока он немного не терял в весе. Вопреки тому, что можно было бы ожидать, экспериментальные исследования показали, что величина подкрепляющего эффекта еды может не зависеть от степени такой депривации. Но частота реакции, являющаяся результатом подкрепления, зависит от степени депривации ко времени наблюдения реакции. Даже если мы научили голубя вытягивать шею, он этого не делает, если не голоден. Таким образом, у нас появился новый вид контроля над его поведением: чтобы заставить голубя вытягивать шею, нужно просто сделать его голодным. Избранный оперант добавляется ко всему тому, что делает голодный голубь. Наш контроль над реакцией объединился с нашим контролем над пищевой депривацией. В главе VII мы также увидим, что оперант может контролироваться внешним стимулом, который является еще одной переменной, которую можно использовать в предсказании и контроле поведения. Однако, необходимо отметить, что обе эти переменные следует отличать от самого оперангного подкрепления.
ОПЕРАНТНОЕ УГАСАНИЕ
Когда подкрепление больше не происходит, реакция становится все менее и менее частой. Этот процесс получил название «оперантное угасание». Не получая еды, голубь со временем перестанет поднимать свою голову. В общем, когда наше поведение больше не приносит «отдачи», мы менее склонны вести себя таким образом снова. Если мы потеряли авторучку, мы все реже и реже будем тянуться за ней в карман, где она была прежде. Если нам не отвечают по телефону, мы, в конце концов, перестанем звонить. Если наше пианино расстраивается, мы постепенно начинаем играть на нем все реже и реже. Если радио начинает шуметь или радиопередачи становятся хуже, мы перестаем слушать.
Поскольку оперантное угасание происходит намного медленнее, чем оперантное обусловливание, за этим процессом проще проследить. В подходящих условиях можно получить гладкие кривые, в которых видно, как медленно понижается частота реакции, возможно, что в течение многих часов. Эти кривые обнаруживают свойства, которые, быть может, нельзя было бы увидеть при обычном осмотре. У нас может «возникнуть впечатление», что организм реагирует все менее часто, но закономерность изменений можно увидеть, только если поведение зарегистрировано. Кривые говорят о существовании довольно однородного процесса, определяющего объем поведения во время угасания.
В некоторых условиях кривую нарушает эмоциональное воздействие. Отсутствие подкрепления после реакции ведет не только к оперантному угасанию, но также и к реакции, которую обычно называют фрустрацией или гневом. Голубь, которому не удалось получить подкрепление, отворачивается от рычага, воркуя, хлопая крыльями и демонстрируя другое эмоциональное поведение (глава X). Человеческий организм демонстрирует похожие двойные реакции. Ребенок, чей трехколесный велосипед больше не реагирует на нажатие педалей, не только перестает их крутить, но и выражает эмоции, которые могут быть весьма сильными. Взрослый, который обнаружил, что ящик стола заклинило, может вскоре перестать пытаться его выдвинуть, но также он может ударить по столу, выругаться «Черт возьми!» или показать другие признаки гнева. Но также как ребенок со временем вернется к велосипеду, а взрослый – к ящику стола, так и голубь снова повернется к рычагу, когда эмоциональная реакция угаснет. Если и другие реакции останутся неподкрепленными, вновь может последовать эмоциональный эпизод. В таких условиях кривые угасания показывают циклические колебания по мере того, как эмоциональная реакция проявляется, исчезает и вновь проявляется. Если мы устраним эмоцию при помощи многократного угасания, или каким-то другим способом, кривая примет более простую форму.
Поведение в процессе угасания представляет собой результат обусловливания, которое ему предшествовало, и в этом смысле кривая угасания дает дополнительную возможность измерить эффективность подкрепления. Если были подкреплены лишь несколько реакций, угасание произойдет быстро. После долгой истории подкреплений сохраняется длительное реагирование. Сопротивление угасанию нельзя предсказать исходя из вероятности реакции, наблюдаемой в некоторый конкретный момент времени. Необходимо знать историю подкрепления. Например, если мы получили подкрепление великолепной едой в новом ресторане, плохо приготовленное блюдо может свести нашу благосклонность на нет. Но если мы прекрасно питались в ресторане на протяжении многих лет, то тогда, при прочих равных условиях, нужно несколько раз поесть там плохо, прежде чем мы утратим склонность постоянно туда ходить.
Не существует простой связи между числом подкрепленных реакций и числом реакций, возникающих при угасании. Как мы увидим в главе VI, сопротивляемость угасанию, возникшая в ходе прерывистого подкрепления, может намного превосходить ту, которая возникнет, если то же число подкреплений давать последовательно за каждую реакцию. Таким образом, если мы лишь изредка подкрепляем ребенка за хорошее поведение, то оно сохранится намного дольше при отсутствии подкрепления, чем если бы мы подкрепляли каждый случай хорошего поведения (при условии, что общий размер подкрепления в итоге окажется одинаковым). Этот факт имеет практическую значимость, когда число подкрепляющих стимулов ограничено. Такие проблемы возникают в сферах образования, промышленности, экономики и многих других областях. При определенных режимах прерывистого подкрепления голубь может произвести до 10000 поведенческих реакций, прежде чем угасание завершится полностью.
Угасание является эффективным способом устранения операнта из поведенческого репертуара организма. Его не следует путать с другими процедурами, разработанными с той же целью. В настоящее время предпочтение отдается технике наказания, которая, как мы увидим в главе XII, включает в себя различные процессы и имеет сомнительную эффективность. Часто с угасанием путают забывание. При забывании эффект обусловливания теряется просто в силу прошедшего времени, в то время как угасание требует, чтобы реакции эмитировались без подкрепления. Как правило, забывание не происходит быстро; так, у голубей были получены значительные кривые угасания спустя шесть после того, как была подкреплена реакция. А шесть лет – это примерно полжизни голубя. И в течение этого времени голуби жили в условиях, в которых реакция не могла быть подкреплена. В поведении человека квалифицированные реакции, произведенные относительно точными контингенциями, часто сохраняются, будучи неиспользованными практически полжизни. Утверждение, что детский опыт определяет личность зрелого организма, подразумевает, что эффект оперантного обусловливания имеет долговременный характер. Таким образом, если, в силу детского опыта, мужчина женится на женщине, напоминающей его мать, влияние определенных подкреплений должно было сохраняться на протяжении многих лет. Большинство случаев забывания включают в себя оперантное поведение под контролем особых стимулов, и мы не сможем его адекватно обсудить, пока не изучим этот контроль в главе VII.
Эффекты угасания. Условия, при которых угасание имеет более или менее завершенный характер, известны, но часто неправильно понимаются. Крайнее угасание порой называют «абулия». В том, чтобы определять его как «отсутствие воли» мало пользы, поскольку наличие или отсутствие воли логически выводится из наличия или отсутствия поведения. Однако, этот термин все же представляется полезным, поскольку подразумевает, что поведение отсутствует по определенной причине, и мы можем провести то же самое различение другим способом. Поведение является сильным или слабым в силу действия множества различных переменных, и задача науки о поведении заключается в том, чтобы их выявить и классифицировать. Каждый конкретный случай мы определяем в терминах переменных. Условие, возникшее из-за длительного угасания, может внешне напоминать бездействие, являющееся результатом других причин. Различие кроется в истории организма. Честолюбивый писатель, отправляющий издателям одну рукопись за другой, когда все они будут отвергнуты, может заявить, что «он больше не может написать ни слова». Частично он может быть парализован тем, что называется «писательский застой». Но он может продолжать настаивать на том, что «хочет писать», и мы можем с ним согласиться, перефразировав это так: его крайне низкая вероятность реакции связана, главным образом, с угасанием. Другие переменные продолжают действовать и, если бы угасание не произошло, привели бы к высокой вероятности.
Состояния, связанные с малой силой операнта, являющейся результатом угасания, часто требуют особого обращения. Некоторые формы психотерапии представляют из себя системы подкрепления, разработанные для восстановления поведения, утерянного в ходе угасания. Подкрепление может давать сам терапевт, либо он может организовать такие условия проживания, которые повышают вероятность подкрепления поведения. Например, в трудотерапии пациента побуждают выполнять простые виды деятельности, которые получают немедленное и относительно постоянное подкрепление. Бесполезно говорить, что такая терапия помогает тем, что дает ему «чувство достижения», или улучшает его «моральный дух», формирует у него «интересы» или устраняет или предотвращает «упадок духа». Эти термины лишь множат постоянно растущее количество объяснительных фикций. Человек, который с охотой занимается определенной деятельностью, показывает не интерес, а действие подкрепления. Мы не даем человеку чувство достижения, мы подкрепляем конкретное действие. Потерять дух – значит просто не реагировать, потому что за реакцией не следует подкрепление. Наша проблема заключается просто в том, чтобы объяснить вероятность реакции в терминах истории подкрепления и угасания.
КАКИЕ СОБЫТИЯ ПОДКРЕПЛЯЮТ
При взаимодействии с окружающими людьми в жизни, в клинике и лаборатории у нас может возникнуть необходимость знать, какова подкрепляющая сила конкретного события. Мы часто начинаем с того, что отмечаем, насколько этим событием подкрепляется наше собственное поведение. Эта практика часто терпит неудачу, но до сих пор распространено мнение, что подкрепляющие стимулы можно выявить отдельно от их влияния на конкретный организм. Но в том смысле, в котором это понятие используется нами, единственной определяющей характеристикой подкрепляющего стимула является то, что он подкрепляет.
Единственный способ сказать, подкрепляет или нет конкретное событие конкретный организм в конкретных условиях, – это проведение прямого испытания. Мы наблюдаем частоты выбранной реакции, затем формируем контингентную связь между ним и определенным событием и наблюдаем, есть ли изменение в частоте. Если есть, мы относим событие к классу подкрепляющих организм в существующих условиях. Нет никакого порочного круга в том, чтобы классифицировать события в терминах их эффектов: этот критерий одновременно и эмпирический, и объективный. Однако, порочный круг возник бы, если бы затем мы стали утверждать, что данное событие усиливает оперант, потому что являются подкрепляющим. Мы достигаем определенного успеха в догадках относительно подкрепляющих сил только потому, что проводим, так сказать, грубое исследование. Мы оцениваем подкрепляющее действие стимула на нас самих и предполагаем, что аналогичное действие он оказывает и на других. Мы преуспеваем только тогда, когда сами напоминаем изучаемый организм и когда правильно изучили собственное поведение.
Подкрепляющие события делятся на два вида. Один вид подкрепления заключается в предоставлении стимулов, добавлении чего-то – например, еды, воды или секса – к ситуации. Их мы называем положительными подкрепляющими стимулами. Другой заключается в удалении чего-то – например, громкого шума, очень яркого света, сильного холода или жары или электрического тока – из ситуации. Это мы называем отрицательными подкрепляющими стимулами. В обоих случаях подкрепление оказывает одинаковое воздействие – увеличивается вероятность реакции. Мы не можем избежать этого различения, доказывая, что то, что подкрепляет в отрицательном смысле – это отсутствие яркого света, громкого шума и т.д., поскольку отсутствие такого стимула эффективно только после его присутствия, что является лишь еще одним способом сказать, что стимул удалили. Различие между этими двумя случаями станет яснее, когда мы обсудим предоставление отрицательного подкрепляющего стимула или удаление положительного. Эти последствия мы называем наказанием (глава XII).
При практическом применении оперантного обусловливания часто требуется изучить события, которые подкрепляют конкретного индивида. В любой области, в которой человеческое поведение занимает важное место – образовании, государственном управлении, семье, здравоохранении, промышленности, искусстве, литературе и т.д. – мы постоянно изменяем вероятности реакций, организуя подкрепляющие последствия. Промышленник, который хочет, чтобы его сотрудники работали постоянно и без прогулов, должен убедиться, что их поведение подкрепляется должным образом – не только заработной платой, но и соответствующими условиями работы. Девушка, которая хочет еще одного свидания с молодым человеком, должна удостовериться, что его поведение, заключающееся в том, что он пригласил ее на свидание и пришел на него, получило надлежащее подкрепление. Чтобы эффективно учить ребенка читать, петь или играть в определенную игру, мы должны разработать программу образовательного подкрепления, в которой соответствующие реакции часто «приносят плоды». Если психотерапевт хочет, чтобы пациент пришёл на следующую консультацию, он должен убедиться, что соответствующее поведение получило некоторое подкрепление.
Мы оцениваем силу подкрепляющих событий, когда пытаемся определить, что человек «берег ог жизни». Какие последствия определяют репертуар его нынешнего поведения и относительную частоту реакций в нем? Кое-что нам говорят его реакции на различные темы разговора, но лучшим руководством является его повседневное поведение. Мы выводим важные подкрепляющие стимулы из таких обычных вещей, как его «интерес» к писателю, который пишет на определенную тему, к магазинам или музеям, в которых выставлены определенные вещи, к друзьям, которые занимаются определенными вещами, к ресторанам, в которых подается определенная еда, и так далее. «Интерес» указывает на вероятность, которая, по меньшей мере, частично, является результатом последствий поведения «проявления интереса». Мы можем быть еще больше уверены в значимости подкрепляющего стимула, если увидим, как протекает поведение при попеременном предоставлении и удалении этого стимула, поскольку в этом случае менее вероятно, что изменение вероятности связано с другими случайными изменениями. Поведение, связанное с определенным другом, меняется вместе с тем, как меняется подкрепление, которое дает этот друг. Если мы наблюдаем такую сопряженность, мы можем составить вполне определенное мнение о том, «что значит эта дружба» или «что наш испытуемый видит в своем друге».
Такая техника оценки может быть усовершенствована с целью использования в клинических или лабораторных исследованиях.
Можно разработать прямой метод опроса, позволив испытуемому разглядывать набор картинок и регистрируя время, которое он тратит на каждую из них. Поведение разглядывания картинки подкрепляется тем, что в ней видится. Разглядывание одной картинки может подкреплять сильнее, чем разглядывание другой, и соответствующим образом будет варьироваться и время. Эта информация может представлять ценность, если по некоторой причине необходимо подкрепить или устранить какое-то поведение нашего испытуемого.
Литература, живопись и сфера развлечений представляют из себя специально разработанные подкрепляющие стимулы. То, будут ли люди покупать книги, билеты на представления или произведения искусства, зависит от того, подкрепляют ли их эти книги, пьесы, концерты или картины. Человек искусства часто ограничивает себя изучением того, что является подкрепляющим для него самого. В этом случае его работа «отражает его индивидуальность», и тогда дело случая (или мера его универсальности), будет ли его книга, пьеса, музыка или картина подкреплять и других людей. Если ему важен коммерческий успех, он может предпринять прямое изучение поведения других. (Интерпретация деятельности писателя и художника как изучения подкрепляющих сил конкретных средств информации будет обсуждаться нами в главе XVI.)
Мы не можем обойтись без такого исследования, просто спрашивая человека, что его подкрепляет. Его ответы могут представлять некоторую ценность, но они отнюдь не обязательно надежны. Подкрепляющая связь нс всегда очевидна для подкрепляемого индивида. Часто только в ретроспективе можно увидеть, что тенденции вести себя определенным образом являются результатом определенных последствий, и как станет ясно в главе XVIII, для самого человека эта связь может остаться вовсе незамеченной, хотя она и очевидна для других.
Конечно, существуют большие индивидуальные различия, касающиеся событий, доказавших свою подкрепляющую силу. Различия между видами так велики, что практически не представляют интереса: очевидно, что то, что подкрепляет лошадь, не обязательно будет подкреплять собаку или человека. Среди представителей одного вида менее вероятно, что большие различия связаны с генетическими факторами, и до определенной степени их можно отследить до обстоятельств истории индивида. Тот факт, что организм очевидным образом наследует способность быть подкрепляемым определенными видами события, не поможет нам предсказать подкрепляющее действие непроверенного стимула. Равным образом связь между подкрепляющим событием и депривацией или любым другим состоянием организма не наделяет подкрепляющее событие неким особым физическим свойством. Весьма маловероятно, что события, которые приобрели свои возможности подкреплять, будут отмечены каким-то особым образом. Тем не менее, эти события являются важными видами подкрепляющих стимулов.
УСЛОВНЫЕ ПОДКРЕПЛЯЮЩИЕ СТИМУЛЫ
Предъявляемый при оперантном подкреплении стимул можно соединить со стимулом в респондентном обусловливании. В главе IV мы рассмотрели приобретение стимулом способности вызывать реакцию; теперь же мы обратимся к способности подкреплять. Хотя само подкрепление является другой стимульной функцией, процесс, возникающий в результате соединения стимулов, представляется таким же. Если голодному организму часто предъявлять блюдо с едой, то пустое блюдо будет вызывать слюноотделение. В определенной степени пустое блюдо также будет подкреплять оперант.
Процесс условного подкрепления проще продемонстрировать со стимулами, которые можно лучше контролировать. Если каждый раз, когда мы включаем свет, давать еду голодному голубю, со временем свет станет условным подкрепителем. Он может использоваться для обусловливания операнта так же, как используется пища. Нам кое-что известно о том, как свет приобрел это свойство: чем чаще соединять свет с пищей, тем более подкрепляющим он станет; еда не должна следовать за светом с большим опозданием; подкрепляющая способность света быстро исчезает при отмене предъявления пищи. Все это вытекает из наших знаний о стимульном обусловливании.
Условные подкрепляющие стимулы часто являются продуктом естественных контингенций. Обычно организм получает пищу и воду только после «предшествующих» действий, т.е. после того, как он воздействовал на среду таким образом, что создал возможность, чтобы поесть или попить. Таким образом, стимулы, созданные этим предшествующим поведением, становятся подкреплением. Так, прежде чем мы удачно сможем перенести еду с тарелки себе в рот, мы должны приблизиться к тарелке, и любое поведение, которое приближает нас к тарелке, автоматически подкрепляется. Следовательно, поддерживается сила предшествующего поведения. Это имеет большое значение, поскольку лишь незначительная часть поведения получает незамедлительное подкрепление пищей, водой, сексуальным контактом или другими событиями несомненной биологической важности. Хотя человеческое поведение характеризуется тем, что первичные подкрепляющие стимулы могут оставаться эффективными и после долгой задержки, это, по- видимому, происходит в силу того, что промежуточные события становятся условными подкрепителями. Когда в октябре человек ставит на окно вторую раму, потому что похожее поведение в прошлом октябре привело к тому, что в январе дома было тепло, нам необходимо заполнить разрыв между поведением в октябре и результатом в январе. Среди условных подкрепителей, поддерживающих силу этого поведения, находятся определенные вербальные последствия, предоставляемые самим человеком или его соседями. Часто важно включить ряд событий между действием и конечным первичным подкреплением, чтобы контролировать поведение в практических целях. В образовании, промышленности, психотерапии и многих других областях мы сталкиваемся с техниками, разработанными для создания соответствующих условных подкрепителей. Обеспечение непосредственных эффективных последствий, когда конечные последствия отсрочены, должно «поднимать дух», «усиливать интерес», «предотвращать разочарование» или корректировать состояние низкой оперантной силы, называемой абулией, и т.д. Если конкретизировать, их результат заключается в том, чтобы побудить учеников учиться, сотрудников – ходить на работу, пациентов – действовать приемлемым в социуме образом и т.д.
Генерализованные подкрепители. Генерализация условного подкрепителя происходит тогда, когда он сочетается более чем с
одним первичным подкрепляющим стимулом. Генерализованные подкрепители полезны, поскольку состояние организма в данный момент времени не обязательно является важным. Оперантная сила, созданная только одним подкреплением, наблюдается лишь в соответствующем состоянии депривации – когда мы подкрепляем едой, мы получаем контроль над голодным человеком. Но если условный подкрепитель был связан с подкрепителями, которые соответствуют многим состояниям, возрастает вероятность того, что в будущем возникнет, по меньшей мере, одно из этих состояний. Таким образом, повышается и вероятность реакции. Например, когда мы подкрепляем деньгами, наш последующий контроль относительно независим от кратковременных деприваций. Создается один вид генерализованного подкрепителя, потому что многие первичные подкрепители получаются только после эффективного преобразования физической среды. В различных ситуациях одна форма предшествующего поведения может вести за собой различные виды подкрепителей. Таким образом, непосредственная стимуляция на основе такого поведения становится генерализованным подкрепителем. Независимо от любой конкретной депривации, мы автоматически получаем подкрепление, когда успешно осуществляем контроль над физическим миром. Этим может объясняться наша склонность увлекаться искусными ремеслами, художественным творчеством и такими видам спорта, как боулинг, бильярд или теннис.
Однако, возможно, что некоторые подкрепляющие эффекты «сенсорной обратной связи» являются безусловными. Как оказывается, дети подкрепляются стимуляцией, идущей из среды, за которой не следует первичное подкрепление. Способность получать подкрепление таким образом могла возникнуть эволюционно, и ее можно сравнить с подкреплением, которое мы получаем, «меняя мир под себя». Любой организм, который подкрепляется своим успешным воздействием на среду, будет иметь преимущество, когда последуют значимые последствия.
Некоторые важные генерализованные подкрепители образуются, когда поведение подкрепляется другими людьми. Простой случай этого – внимание. Хорошо знакомой ситуацией является пример ребенка, который плохо себя ведет, «только чтобы добиться внимания». Внимание людей обладает подкрепляющей силой, поскольку является необходимым условием для получения от них других подкреплений. В общем, наше поведение подкрепляют только люди, уделяющие нам внимание. Внимание человека, от которого с большой вероятностью можно получить подкрепление – родителя, учителя или возлюбленного, – является особенно хорошим генерализованным подкрепляющим стимулом и приводит к особенно сильному поведению, направленному на получение внимания. Многие вербальные реакции напрямую требуют внимания, например, «Послушай», «Смотри» или зов по имени. Другие характерные формы поведения, которые обычно сильны, поскольку привлекают внимание, – это симуляция болезни, раздражающее поведение и выставление себя на показ (эксгибиционизм).
Внимания часто недостаточно. Вероятно, другой человек станет подкреплять только ту часть поведения, которую он одобряет, и, таким образом, любой знак его одобрения становится подкрепляющим сам по себе. Подкрепляется поведение, которое вызывает улыбку или вербальную реакцию «Правильно», «Хорошо» или любую другую похвалу. Мы используем этот генерализованный подкрепитель, чтобы создавать и формировать поведение других людей, особенно в образовании. Например, мы учим и детей, и взрослых говорить правильно, произнося «Это правильно», когда они демонстрируют должное поведение.
Еще более сильный генерализованный подкрепитель – это любовь. Она может быть особенно сильно связана с сексуальным контактом как первичным подкрепляющим стимулом, но когда человек, который демонстрирует любовь, дает также и другие виды подкрепления, эффект генерализуется.
Внимание, одобрение и любовь трудно определить, наблюдать и измерить. Это не вещи, а аспекты поведения других. Их тонкие физические характеристики представляют сложность не только для ученого, который должен их изучать, но также и для индивида, которого они подкрепляют. Если нам непросто увидеть, что кто-то уделяет нам внимание, одобряет или любит нас, наше поведение не будет последовательно подкрепляться. Вследствие этого оно может быть слабым, склонным происходить не в то время и пр. Мы не
«знаем, что сделать, чтобы получить внимание или любовь, или когда это сделать». Ребенок, пытающийся получить внимание, влюбленный знак внимания или художник – профессиональное одобрение, демонстрируют стойкое поведение, которое, как мы увидим в главе VI, возникает только в результате прерывистого подкрепления.
Другой генерализованный подкрепитель – это покорность других. Когда кого-то принуждают силой давать различные подкрепления, любой знак его подчиненности становится генерализованным подкрепляющим стимулом. Задиру подкрепляют знаки трусости, а представителей правящего класса – знаки уважения. Престиж и уважение являются генерализованными подкрепителями только постольку, поскольку они гарантируют, что другие люди будут вести себя определенным образом. То, что «поступать по-своему» подкрепляет, видно из поведения тех, кто контролирует ради самого контроля. Физические параметры покорности обычно более заметны, чем признаки внимания, одобрения или любви. Задира может добиваться четких признаков своего доминирования, а ритуальные обычаи подчеркивают почтение и уважение.
Генерализованный подкрепляющий стимул, отличаемый по своим физическим деталям, – это знак (token). Самым распространенным примером являются деньги. Эго генерализованный подкрепитель в полном смысле слова, поскольку, хотя «не все можно купить за деньги», его можно обменять на великое множество первичных подкрепителей. Поведение, подкрепленное деньгами, относительно независимо от кратковременной депривации организма, и общая полезность денег как подкрепителя отчасти вытекает из этого факта. Их эффективность также обусловлена их физическими параметрами. Они позволяют сформировать четкую контингенцию между поведением и последствием: когда нам платят деньгами, мы знаем, что наше поведение завершено и какое именно это поведение. Также в этом случае можно более успешно обусловить подкрепляющий эффект: ценность денег как средства обмена более очевидна, чем у внимания, одобрения, любви и даже покорности.
Деньги – это не просто знак. Например, в сфере образования человек действия человека отчасти связаны с получаемыми оценками, отметками и дипломами. Их не так просто обменять на первичное подкрепление, как деньги, но возможность этого присутствует. Образовательные знаки образуют определенную последовательность, в которой один можно обменять на следующий за ним, а конечный знак, диплом, обычно имеет ясную коммерческую или статусную ценность. Как правило, призы, медали и стипендии за высокие оценки или особые умения и достижения явно не связаны с первичными подкрепителями, но четкие физические параметры таких наград дают преимущество в организации контингенций. Обычно конечное подкрепление похоже на то, что имеют престиж или уважение.
Легко забыть про источники происхождения генерализованных подкрепителей и считать, что они подкрепляют сами по себе. Мы говорим о «потребности во внимании, одобрении или любви», «потребности в доминировании» и «любви к деньгам», словно они являются первичными депривационными состояниями. Но способность к подкреплению подобными вещами вряд ли могла развиться за тот короткий период времени, в течение которого преобладают необходимые состояния. Внимание, любовь, одобрение и покорность, по-видимому, существуют в человеческом обществе только краткий период времени относительно продолжительности всей эволюции вида. Более того, они не представляют устойчивые формы стимуляции, поскольку зависят от отличительных особенностей отдельных групп. Поскольку любовь главным образом связана с сексом, ее можно связать с состоянием первичной депривации, которая до определенной степени не зависит от личной истории индивида, но «знаки любви», которые становятся подкреплением в силу своей связи с сексуальным контактом или другими подкрепителями, едва ли обладают подкрепляющей способностью в силу генетических причин. Знаки имеют еще более недавнее происхождение, и нечасто кто-то всерьез считает, что потребность в них является врожденной. Обычно мы можем видеть процесс, посредство которого (в котором) ребенок начинает получать подкрепление в виде денег. И все же «любовь к деньгам» часто кажется автономной, как и «потребность в одобрении», но если мы ограничим себя наблюдаемой эффективностью этих генерализованных подкрепителей, у нас будет столько же оснований для признания врожденной потребности к деньгам, как и для признания врожденной потребности во внимании, одобрении, любви или доминировании. В конечном итоге генерализованные подкрепители становятся эффективны, даже когда первичные подкрепители, лежащие в их основе, больше им не сопутствуют. Мы играем в игры, требующие особых умений, ради них самих. Мы стремимся получить внимание или одобрение ради них самих. За любовью не всегда следует более явное сексуальное подкрепление. Покорность других людей подкрепляет даже в том случае, когда мы не извлекаем из нее пользу. Деньги могут быть таким сильным подкреплением для скряги, что он скорее будет голодать, чем лишится их. Эти наблюдаемые факты должны занять свое место в любом теоретическом или практическом рассмотрении. Они не означают ни того, что генерализованные подкрепители являются чем-то большим, чем физические свойства наблюдаемых в каждом случае стимулов, ни того, что они представляют собой нефизические сущности, которые нужно принять во внимание.
ПОЧЕМУ ПОДКРЕПЛЯЮЩИЕ СТИМУЛЫ ПОДКРЕПЛЯЮТ
Закон эффекта – это не теория. Это просто правило усиления поведения. Когда мы подкрепляем реакцию и наблюдаем изменение ее частоты, мы с легкостью можем описать происходящее в объективных терминах. Но при объяснении того, почему это происходит, мы склонны обращаться к теории. Почему подкрепление подкрепляет? Одна теория заключается в том, что организм повторяет реакцию, потому что находит последствия «приятными» или «приносящим удовлетворение». Но каким образом это объяснение включить в рамки естественной науки? Очевидно, что слова «приятный» или «удовлетворяющий» не обращены к физическим свойствам подкрепляющих событий, поскольку физические науки не используют ни сами эти понятия, ни любые их эквиваленты. Понятия должны быть обращены к некоторому воздействию на организм, но можем ли мы дать такое определение, которое будет полезно для объяснения подкрепления?
Порой утверждают, что некоторая вещь приятна, если организм стремится к ней или поддерживает контакт с ней, а неприятна, если организм ее избегает или стремится быстро прекратить взаимодействие с ней. Попытка такого объяснения существует во многих вариациях, но все они уязвимы для одной и той же критики: указанное поведение может быть просто еще одним продуктом подкрепляющего эффекта. Утверждение, что стимул приятен в том смысле, что организм стремится приблизиться к нему или удержать его, может быть лишь другим способом сказать, что стимул подкрепляет такое поведение «приближения» или «удержания». Вместо того, чтобы определять эффект подкрепления в терминах его воздействия на поведение в общем, мы просто выделили легко узнаваемый тип поведения, который практически наверняка подкреплялся и, следовательно, в общем пригоден в качестве индикатора подкрепляющей способности. Но если мы продолжим утверждать, что стимул подкрепляет, потому что он приятен, то, что претендовало на то, чтобы быть объяснением в терминах двух эффектов, в реальности превратится в избыточное описание одного.
Альтернативный подход к определению «приятного» и «неприятного» (или «приносящего удовлетворение» и «раздражающего») заключается в том, что испытуемого спрашивают, что он «чувствует» по поводу конкретных событий. Это подразумевает, что у подкрепления есть два эффекта – оно усиливает поведение и производит «чувства», а также то, что одно является функцией другого. Но функциональная связь вполне может быть обратной. Когда человек сообщает о том, что некоторое событие приятно, он может просто подразумевать, что это такое событие, которое его подкрепляет или к которому он стремится приблизиться, поскольку оно подкрепляет такое движение. В главе XVII мы увидим, что человек мог бы и не приобретать вербальные реакции, связанные с удовольствием как сугубо личным фактом, если бы подобный феномен не имел места. В любом случае, сам субъект находится не в особо выгодной позиции для осуществления подобных наблюдений. «Субъективные суждения» об удовольствии или удовлетворении, порождаемые стимулами, обычно ненадежны и непоследовательны. Как подчеркивается в учении о бессознательном, мы можем быть неспособны сообщать обо всех событиях, нас подкрепляющих, или же наш отчет о них может прямо противоречить объективным наблюдениям: мы можем назвать неприятным такое событие, которое в действительности нас подкрепляет. Примеры такой аномалии варьируют от мазохизма до мученичества.
Порой утверждается, что подкрепление эффективно, поскольку ослабляет состояние депривации. Это, по меньшей мере, побочный эффект, который не следует путать с самим подкреплением. Очевидно, что в оперантном обусловливании депривация важна. В нашем эксперименте мы использовали голодного голубя, и в противном случае не смогли бы продемонстрировать оперантное обусловливание. Чем голоднее птица, тем чаще она реагирует в результате подкрепления. Но несмотря на эту связь, неверно считать, что подкрепление всегда ослабляет депривацию. Обусловливание может произойти прежде любого существенного изменения в депривации, измеренной другими способами. Мы можем лишь сказать, что тип событий, который ослабляет депривацию, также и подкрепляет.
Связь между подкреплением и насыщением следует искать в процессе эволюции. Едва ли можно не заметить огромное биологическое значение первичных подкрепителей. Пища, вода и секс, также как и бегство от вредных условий (глава XI), очевидным образом связаны с благополучием организма. Индивид, который легко подкрепляется такими событиями, приобретает высоко эффективное поведение. С биологической точки зрения также полезно, если поведение, обусловленное конкретным подкреплением, с особо высокой вероятностью происходит в соответствующем состоянии депривации. Таким образом, важно не только то, чтобы любое поведение, ведущее к получению пищи, становилось значимой частью репертуара, но и то, чтобы это поведение было особенно сильным, когда организм голоден. Эти два преимущества, по-видимому, определяют тот факт, что организм может подкрепляться специфическими способами и что результат будет наблюдаться в релевантных условиях депривации.
Некоторые формы стимуляции являются положительным подкреплением, хотя кажется, что они не вызывают поведение, имеющее биологическое значение. Ребенок подкрепляется не только едой, но и звоном колокольчика или блеском яркого предмета.
Поведение, за которым постоянно следуют эти стимулы, демонстрирует увеличение вероятности. Трудно, а, быть может, и невозможно, отследить эти подкрепляющие эффекты в истории обусловливания. Позднее мы можем обнаружить, что того же человека подкрепляет оркестр или красочный спектакль. В этом случае сложнее удостовериться, что подкрепляющий эффект не был обусловлен. Тем не менее, мы можем правдоподобно утверждать, что способность подкрепляться любой обратной связью от среды является биологически полезной, поскольку готовит организм к эффективному воздействию на среду, прежде чем возникнет конкретное состояния депривации. Когда организм порождает тактильную обратную связь, как, например, в ощущении текстуры ткани или поверхности скульптуры, обусловливание обычно рассматривается как результат сексуального подкрепления, даже если стимулируемая область по функции не является первично-сексуальной. Заманчиво считать, что и другие формы стимуляции, порождаемые поведением, схожим образом связаны с биологическими значимыми событиями.
Когда среда изменяется, способность подкрепляться конкретным событием может стать биологически вредной. Для большинства представителей человеческого вида сахар является сильным подкреплением, о чем свидетельствуют повсеместно распространенные прилавки для продажи сладостей. В этом отношении его эффект намного превосходит нынешнюю биологическую потребность в нем. Этого не было до того, как сахар стали выращивать и производить в огромных количествах. Еще несколько столетий назад сильный подкрепляющий эффект сахара был биологически полезен. Среда изменилась, но генетические особенности организма остались прежними. Другим примером является секс. Сильный подкрепляющий эффект сексуального контакта больше не является биологическим преимуществом, но нам нет необходимости возвращаться на многие столетия назад, чтобы обнаружить условия голода и эпидемий, в которых сила сексуального подкрепления имела решающее значение.
Биологическое объяснение силы подкрепления можно продолжать до тех пор, пока мы будем говорить о том, почему то или иное событие подкрепляет. Вероятно, для функционального анализа такое объяснение мало что даст, поскольку оно не предлагает никакого способа идентифицировать подкрепляющий стимул как таковой, прежде чем мы не испытаем его подкрепляющую способность на конкретном организме. Таким образом, мы должны довольствоваться анализом с точки зрения воздействий стимулов на поведение.
СЛУЧАЙНЫЕ КОНТИНГЕНЦИИ И «СУЕВЕРНОЕ» ПОВЕДЕНИЕ
Утверждалось, что эксперимент Торндайка нетипичен для процесса научения, потому что кот не может «видеть связи» между движением задвижки и выходом из ящика. Но в оперантном обусловливании возможность видеть связь не является существенным моментом. Как во время, так и после процесса обусловливания человек часто говорит о связи своего поведения со средой (глава XVII). Его сообщения могут быть полезны в научном объяснении, а его реакции на собственное поведение могут даже представлять важное звено в определенных сложных процессах. Но такие сообщения или реакции не являются обязательными в простом процессе оперантного обусловливания. Это очевидно в свете того факта, что испытуемый может быть не способен описать контингенцию, которая имеет явно выраженный эффект.
Нет необходимости и в существовании постоянной связи между реакцией и ее подкреплением. Мы связываем получение еды с реакцией нашего голубя, организуя механическую и электрическую связь. Вне стен лаборатории за контингенции между поведением и его последствиями ответственны различные физические системы. Но это не обязательно влияет на организм каким-то иным способом, и, как правило, не влияет. Что касается самого организма, единственным важным свойством контингенции является ее временная организация. Подкрепитель просто следует за реакцией. Как это происходит, значения не имеет.
Мы должны допустить, что предъявление подкрепителя всегда что-то подкрепляет, поскольку оно неизбежно совпадает по времени с каким-либо поведением. Мы уже видели, что даже единичное
подкрепление может иметь значительный эффект. Если между реакцией и появлением подкрепляющего стимула существует только случайная связь, поведение называется «суеверным». Мы можем показать это на примере голубя, аккумулируя эффект нескольких случайных контингенций. Предположим, мы даем голубю небольшое количество пищи каждые 15 секунд независимо от того, что он делает. Когда пища дается в первый раз, он будет выполнять какие-то действия, если только не будет стоять неподвижно, – и произойдет обусловливание. Тогда растет вероятность того, что при следующем предъявлении пищи снова произойдет то же самое поведение. Если так и случится, «оперант» будет еще больше усилен. Если нет, будет подкреплено какое-то другое поведение. В конечном итоге, некоторый вид поведения достигнет частоты, на которой он получает частое подкрепление. Тогда он станет постоянно частью поведенческого репертуара птицы, даже несмотря на то, что пища давалась строго по часам независимо от ее поведения. Видимые реакции, которые были установлены таким образом, включали в себя резки поворот в одну сторону, подпрыгивание с ноги на ногу, прогибания и поскребывания, повороты вокруг своей оси, походку с «важным» видом и вскидывание головы. При дальнейшем подкреплении топография поведения может продолжить изменяться, поскольку легкие изменения в форме реакции могут совпадать с получением еды.
При создании суеверного поведения большое значение имеют интервалы, по которым дастся еда. При интервале в 60 секунд эффект от подкрепления в основном будет утрачен (потерян), прежде чем будет предъявлено следующее подкрепление, – и с большей вероятностью возникнет другое поведение. Таким образом, снизится вероятность формирования суеверного поведения, хотя оно все же может возникнуть, если эксперимент будет идти долгое время. При интервале в 15 секунд эффект обычно наступает незамедлительно. Когда суеверная реакция укоренится, она будет сохраняться даже тогда, когда подкрепление будет происходить лишь изредка.
В своем легковерии голубь не уникален. Поведение человека также весьма суеверно. Только небольшая часть поведения, усиленная случайными контингенциями, превращается в ритуальные практики, которые мы называем «суевериями», однако сам принцип сохраняется в силе. Предположим, мы нашли 10-долларовую купюру, прогуливаясь по парку (и предположим, что это событие имеет значительный подкрепляющий эффект). То, что мы делали – или только закончили делать – в момент, когда нашли деньги, подкрепляется. Конечно, было бы трудно доказать это строгим образом, но, возможно, что возрастет вероятность того, что мы снова пойдем на прогулку в тот же парк или парк, похожий на него, что немного вырастет вероятность того, что наш взгляд будет направлен вниз, как в тот раз, когда мы увидели деньги, и т.д. Это поведение будет варьироваться в зависимости от состояния депривации, для которого релевантны деньги. Его не следует называть суеверным, но оно порождено контингенцией, которая лишь изредка бывает «функциональной».
Некоторые контингенции, продуцирующие суеверное поведение, не являются полностью случайными. Иногда за реакцией идет последствие, которое она, тем не менее, не «продуцирует». Лучше всего показать это на примере с таким типом стимулов, который подкрепляет при его устранении (глава XI). Завершение кратковременной стимуляции такого рода может произойти как раз в такой момент, что подкрепит поведение, порожденное ее началом. Появляется аверсивный стимул и организм начинает действовать. Стимул исчезает и это подкрепляет определенное поведение. Некоторые болезни, хромота и аллергические реакции имеют такой характер течения, что любые меры, предпринятые для «излечения», вероятно будут подкреплены, когда состояние улучшится. И необязательно, что эти меры на самом деле приводят к излечению. По-видимому, сложные ритуалы ненаучной медицины можно объяснить этой характеристикой многих форм заболеваний.
В суеверном оперантном поведении, как и в случае суеверных условных рефлексов, рассмотренных в главе IV, процесс обусловливания терпит неудачу. Обусловливание дает невероятные преимущества, обеспечивая организм поведением, которое эффективно в новой среде, но, по-видимому, нет никакого способа предотвратить приобретение бесполезного поведения, возникающего в силу случайности. Любопытно, что эта трудность необходимо возрастала по мере того, как в ходе эволюции ускорялся процесс обусловливания. Если, к примеру, всегда были бы необходимы три подкрепления, чтобы изменить вероятность реакции, суеверное поведение было бы маловероятно. Организмы уязвимы для влияния случайных совпадений только потому, что достигли точки развития, на которой единственная контингенция может произвести существенное изменение.
В человеческом обществе суеверные ритуалы обычно включают в себя вербальные формулы и передаются как часть культуры. В этом смысле они отличаются от простого эффекта случайного оперантного подкрепления. Но их истоки лежат в том же самом процессе, и, вероятно, они поддерживаются посредством случайных контингенций, следующих той же схеме.
ЦЕЛИ, НАМЕРЕНИЯ И ДРУГИЕ КОНЕЧНЫЕ ПРИЧИНЫ
Неправильно говорить, что оперантное подкрепление «усиливает предшествующую ему реакцию». Реакция уже произошла и не может измениться. Что меняется, так это будущая вероятность реакций того же класса. Обуславливает не реакция, как отдельный эпизод, а операнг как класс поведения. Следовательно, в этом нет нарушения фундаментального принципа науки, который исключает
существование «финальных причин». Но этот принцип нарушается, когда утверждается, что поведение находится под контролем «мотива» или «цели», которых организм еще нс достиг, или намерения, которое еще не выполнено. Утверждения, содержащие такие слова, как «мотив» или «намерение», обычно можно редуцировать до утверждений об оперангном обусловливании, и требуется лишь незначительное изменение, чтобы включить их в границы естественной науки. Вместо того чтобы говорить, что человек совершает действия по причине последствий, которые должны за ними последовать, мы просто скажем, что он совершает действия по причине последствий, которые следовали за схожим поведением в прошлом. Это, конечно, закон эффекта или оперантное обусловливание.
Порой утверждают, что реакцию нельзя полностью описать, пока не будет рассмотрена ее цель как ее актуальное свойство. Но что подразумевается под словом «описать»? Если мы видим человека, идущего по улице, мы можем сообщить об этом событии на языке естествознания. Если затем мы добавим, что «его цель – отправить письмо», скажем ли мы тем самым что-то, что уже не включено в наше первое сообщение? Очевидно, да, поскольку человек может идти по улице «с разными целями», и в каждом случае физический способ передвижения остается тем же самым. Но нам следует провести различие не между разными эпизодами поведения, а между переменными, функцией которых является поведение. Цель и намерение – это не свойства самого поведения, а способ указания на контролирующие переменные. Если мы делаем сообщение после того, как видели, что наш испытуемый отправил письмо и вернулся, мы приписываем ему «намерение» исходя из события, которым завершилось поведение передвижения по улице. Это событие «придает смысл» его деятельности, но не посредством более детального описания самого поведения, а посредством указания независимой переменной, функцией которой оно может являться. Мы не можем увидеть его «намерение», прежде чем мы увидим, как он отправляет письмо, если только мы раньше не наблюдали похожее поведение и похожие последствия. Если мы это делали, то мы пользуемся данным термином просто для предсказания, что он отправит письмо и в этом случае.
Также и наш испытуемый не может видеть собственное намерение, без обращения к похожим событиям. Если мы спросим его, почему он идет по улице и с каким намерением, а он ответит «Я иду, чтобы отправить письмо», то мы не узнаем ничего нового о его поведении, а только о некоторых его возможных причинах. Конечно, сам испытуемый может находиться в преимущественном положении для описания этих переменных, потому что он находится в постоянном контакте с собственным поведением на протяжении многих лет. Но, следовательно, его утверждение относится к тому же классу, что и утверждения других людей, реже наблюдавших за его поведением. Как мы увидим в главе XVII, он просто делает правдоподобное предсказание с точки зрения своего опыта взаимодействия с самим собой. Более того, он может ошибаться. Он может сообщить, что «идет отправить письмо», и он может действительно нести в руках неотправленное письмо и опустить его в почтовый ящик, дойдя до конца улицы, но мы все равно можем показать, что его поведение преимущественно определяется тем фактом, что в прошлом он сталкивался с важным для него человеком как раз во время такой прогулки. Он может не «осознавать этого намерения» в том смысле, что он не способен сказать, что его поведение обусловлено этой причиной.
Факт, что оперантное поведение кажется «направленным в будущее», вводит в заблуждение. Рассмотрим, к примеру, случай, когда «нечто ищется». В каком смысле это «нечто», что еще не найдено, имеет отношение к поведению? Предположим, мы посредством обусловливания научаем голубя клевать пятно на стенке ящика, а затем, когда оперант хорошо закрепился, убираем это пятно. Птица идет к обычному месту вдоль стены. Поднимает свою голову, направляет взгляд в привычном направлении и может даже эмитировать слабый клевок в обычное место. Пока угасание не зайдет очень далеко, он будет возвращаться на то же место снова и снова, демонстрируя одно и то же поведение. Нужно ли говорить, что голубь «ищет пятно»? Нужно ли нам учитывать «поиск» пятна при объяснении поведения?
Несложно интерпретировать этот пример в терминах оперантного обусловливания. Поскольку визуальная стимуляция от пятна обычно предшествует получению еды, пятно становится условным подкрепителем. Оно усиливает поведение «глядения» в определенном направлении с разных позиций. Хотя мы проводили обусловливание только клевательной реакции, фактически, мы усиливали много различных видов предшествующего поведения, которые приводили птицу в позиции, в которых она могла увидеть и клюнуть пятно. Эти реакции продолжат появляться даже несмотря на то, что мы убрали пятно, пока не произойдет угасание. Пятно, которое «ищется», – это пятно, которое служило в прошлом непосредственным подкреплением поискового поведения. В общем, поиск чего-то заключается в эмитировании реакций, которые в прошлом продуцировали это «что- то» в качестве последствия.
Эта же интерпретация применима к поведению человека. Когда мы видим человека, который ходит по комнате, открывая ящики, заглядывая под журналы и т.д., мы можем описать его поведение в полностью объективных терминах: «Сейчас он находится в определенной части комнаты; он взял книгу большим и указательным пальцем правой руки; он приподнимает книгу и наклоняет голову так, чтобы можно было увидеть любой объект под книгой». Мы также можем «интерпретировать» его поведение или «наделить его смыслом», сказав, что «он что-то ищет» или, более определенно, что «он ищет свои очки». Это добавление не является дальнейшим описанием его поведения, а представляет собой предположение о некоторых переменных, за него ответственных. Здесь нет текущей цели, мотива, намерения или значения, которые нужно принять во внимание. Ничего не изменится, даже если мы спросим, что он делает, а он скажет: «Я ищу свои очки». Это не дальнейшее описание его поведения, а описание переменных, функцией которых оно является. Оно эквивалентно высказываниям: «Я потерял свои очки», «Я перестану делать то, что делаю, когда найду свои очки», «Когда я предпринимал такие действия в прошлом, я находил свои очки». Такой перевод может показаться излишне иносказательным, но лишь потому, что выражения, включающие цели и намерения, являются своего рода аббревиатурами.
Очень часто приписывание намерения поведению является еще одним способом описания его биологической способности к адаптации. Этот вопрос мы уже обсуждали, но кое-что можно добавить. И в оперантном обусловливании, и в эволюционном отборе поведенческих характеристик последствия изменяют будущую вероятность. Рефлексы и другие врожденные паттерны поведения возникают, поскольку они повышают шанс на выживание вида. Операнты же усиливаются, потому что за ними следуют важные последствия в жизни индивида. Оба процесса поднимают вопрос о цели по одной и той же причине, и в обоих случаях апелляция к финальной причине может быть отвергнута одним и тем же способом. Паук не обладает сложным поведенческим репертуаром плетения паутины, потому что паутина позволяет ему ловить пищу, необходимую для выживания. Он обладает этим поведением, потому что в прошлом схожее поведение части пауков позволяло им ловить пищу, которая были необходима им для выживания. В его ранней эволюционной истории последовательность событий оказалась релевантна поведению плетения паутины. Мы совершим ошибку, сказав, что видим «намерение» плести паутину, наблюдая похожие события в жизни отдельного паука.

Нет комментариев