Понятие стимула и подкрепления собак

Положительное подкрепление в дрессировке собак

Екатерина Кастрицкая, психолог, специалист по анималотерапии, консультант по поведению и благополучию животных

О положительном подкреплении в дрессировке собак мы можем говорить, когда собака в результате совершения «хорошего поступка» получает что-то важное и ценное. Например, собака ложится по команде, и мы награждаем ее лакомством. Во многих странах (тех, которые мы называем цивилизованными) положительное подкрепление давно стало основным, если не единственным приемлемым методом обучения животных, в том числе собак. Чем же хорош этот метод?

Для чего можно использовать положительное подкрепление?

В свое время Э. Торндайк сформулировал «Закон Эффекта», согласно которому в одной и той же ситуации при прочих равных условиях лучше закрепляются те реакции, которые привели к чувству удовлетворения. Также идею о связи поведения с последствиями разрабатывал основатель оперантного научения Б.Ф. Скиннер.

Метод положительного подкрепления основан на том, что поведение, которое подкрепляется, проявляется все чаще. И главный его плюс в том, что удовлетворяется мотивация собаки.

Причем положительное подкрепление не имеет ограничений в сфере использования. То есть мы можем использовать его, чтобы научить собаку (как и любое животное, в принципе способное обучаться) чему угодно и даже чтобы скорректировать проблемное поведение.

Какие аргументы приводят противники положительного подкрепления и почему эти аргументы несостоятельны?

У положительного подкрепления есть и сторонники, и противники. Основные аргументы против использования исключительно положительного подкрепления:

Однако ни один из этих аргументов не является хоть сколько-нибудь состоятельным.

Если говорить о подкупе, то противники положительного подкрепления подменяют понятия. Подкуп – это когда вы показываете собаке лакомство или игрушку и подзываете. Да, во время обучения, чтобы собака поняла, что от нее требуется, мы, безусловно, учим ее подбегать на вкусный кусочек или игрушку – но только на этапе объяснения. А если вы позвали собаку, не подманивая ее, похвалили в момент, когда она отвернулась от других собак или от интересных запахов в траве и побежала к вам, а когда подбежала, играете с ней или угощаете – это не подкуп, а оплата.

Так что о подкупе речь точно не идет.

Те, кто говорят «Мы пробовали положительное подкрепление, но оно не формирует стабильный навык», вероятно, допускали ошибки в дрессировке собак. И одна из таких ошибок – резкое усложнение задачи.

Прежде чем переходить к следующему этапу, нужно убедиться в том, что собака понимает задачу. Если задачу усложнять постепенно, не пропускать важные этапы обучения и правильно выбирать способ мотивации, собака будет показывать отличный результат при обучении методом положительного подкрепления, причем стабильно.

К тому же, в положительном подкреплении используется метод «вариативного подкрепления», когда награда выдается не каждый раз, и собака не знает, получит ли она бонус за выполнение команды. Вариативное подкрепление более действенно, чем выдача приза после каждой команды. Разумеется, этот способ используется, когда навык уже сформирован, и собака точно понимает, чего вы от нее хотите. Это тоже обеспечивает стабильность выполнения команд.

Еще один аргумент противников положительного подкрепления – это «вседозволенность». «Собака сядет на шею!» — возмущаются они. Но вседозволенность – это когда владелец не вмешивается в поведение собаки, и она делает что хочет (хочет – ловит кошек, хочет – грызет обувь и т.п.) Однако, используя положительное подкрепление, мы обучаем собаку, объясняем правила совместного проживания и помогаем приспособиться к разумным ограничениям, подсказывая, каким образом она может удовлетворить свои потребности – просто делаем это гуманно. То есть с вседозволенностью положительное подкрепление тоже не имеет ничего общего.

В чем преимущества положительного подкрепления?

Положительное подкрепление имеет ряд ценных преимуществ по сравнению с другими методами:

Что нужно, чтобы использовать метод положительного подкрепления в дрессировке собаки?

Метод положительного подкрепления можно применять со всеми собаками, так что от собаки требуется лишь достаточно здоровья, чтобы быть в состоянии учиться вообще и освоить те или иные навыки, в частности.

От человека, который принял решение использовать в обучении собаки положительное подкрепление, требуется:

Источник

Стимулы в качестве подкрепления: поведенческие цепи

Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим: «Вы свободны, идите и играйте». А кроме того, он воспринимается как подкрепление — дети рады, когда слышат его, и если бы они смогли сделать что-либо, чтоб заставить его прозвенеть скорее, они бы это сделали. Теперь представьте себе звонок на перемену, который не звонит, если в классе нет тишины. Ко времени перемены у вас будет очень тихий класс.

Условный стимул — предвестник подкрепления, и поэтому он становится желаемым событием. Желаемое событие — это само по себе уже подкрепление, а потому вы с успехом можете подкреплять поведение, давая условный стимул другого поведения. Например, я вознаграждаю кошку лакомством, когда она подходит ко мне по команде — она этому научается и выполняет это. Теперь, если я буду говорить: «Ко мне» и вознаграждать ее за реакцию всякий раз как увижу ее — на камине, то скоро окажется, что кошка, стремясь получить лакомство, будет забираться на камин. Как вы помните, с точки зрения кошки, она обучает меня давать ей лакомство. Для этого она нашла способ заставлять меня произносить: «Ко мне». Теперь допустим, что я обучаю ее вспрыгивать на камин, когда я жестом показываю на него, подкрепляя правильные ответы либо пищей, либо командой «Ко мне». Затем я буду жестом указывать на камин всякий раз, когда: а) я знаю, что кошка голодна и б) когда она случайно перевернется через спину…

Положительные и отрицательные подкрепления собаки

Дрессировка собак основывается на взаимопонимании и взаимодействии дрессировщиков и их собак. Даже если мы не можем разговаривать с собаками таким же образом, как мы говорим с другими людьми, то, несомненно, может общаться с нашими хвостатыми компаньонами. Один из самых эффективных способов общения с собаками — способ положительною и отрицательною подкрепления.

Оба этих вида необходимы для нормирования поведения и обучения повиновению.

Положительное подкрепление необходимо для того, чтобы ваша собака поняла, какое именно ее поведение вам нравится. Желая и в дальнейшем получить положительное подкрепление, собака будет готова пожурить нужное поведение в будущем. Положительное подкрепление будет значимым (интересным, важным) для собаки, если оно удовлетворяет какую-нибудь из потребностей. Существуют две основные потребности собак, которыми можно пользоваться в дрессировке — потребность в социальном взаимодействии и пищевая потребность.

Потребность в социальном общении и взаимодействии жизненно важна для собак. Дикие собачьи родственники, например, волки, женятся, играют, лентяйничают и едят в окружении себе подобных — в своей стае. Наши домашние собаки, потомки волков, инстинктивно ищут свою стаю. Поэтому ваша собака рассматривает людей и других собак вашего дома именно в этой роли.

Дрессировщик может закреплять нужное поведение своей собаки при помощи трех очень эффективных «социальных наград» (трех видов положительного социального подкрепления) — ласка, игра и словесная похвала. Собаки любят касаться. Нежное поглаживание за ушами или энергичный массаж спины и поясницы очень нравится большинству собак. Получение такого воздействия после завершения упражнения повиновения будет рассматриваться собакой как положительное подкрепление (награда). Собака будет знать, что ее поведение понравилось вам. Но, кажется, собакам не нравится, когда ей стучат по голове, как по барабану. И еще, собака может иметь свои собственные, свойственные только ей, зоны тела, чувствительные к ласкам.

Игра — форма другого приятного социального взаимодействия. Большинство собак любит играть. Найдите объект, который ваша собака любит, например, игрушку-пищалку или мяч. Играйте со своей собакой после того, как она успешно завершает упражнение повиновения. Когда я обучал своего золотистого ретривера Вуди по курсу послушания А.К.С., я всегда носил теннисный мяч в кармане жакета. После двухминутного упражнения я играл с Вуди мячом минуты две — бросал мяч в траву, а Вуди его отыскивал. Вуди любил такие игры и скоро понял, что занятия в конце концов приводят к веселой игре.

Ваша собака также интерпретирует словесную (устную) похвалу (условное положительное подкрепление) как награду. Собак привлекают восторженные, высокие звуки. Унылое повторение: «Хорошая собака, хорошая собака» не будет эффективным как подкрепление. Будьте оживленней. Делайте похвалу интересной для собаки. Следите за ее хвостом — если он виляет, собака принимает похвалу. Имейте в виду разные собаки имеют разные уровни возбудимости. Некоторые из них могут радоваться слабой похвале, другим требуется более интенсивное воздействие. Вы должны отыскать свою устную похвалу, чтобы ваша собака была довольна во время дрессировки.

Пищевая потребность — другая основная потребность собаки. Пищевое подкрепление очень помогает в обучении. Инструктора по дрессировке имеют различные мнения относительно использования пищевого подкрепления как награды. Некоторые считают, что наличие пищи мешает концентрации внимания собаки на поведении во время обучения. Я не соглашусь с этим. Ведь мысль о пище не нарушает концентрацию внимания волка, когда он обучается охотиться на кроликов. Но, наоборот, усиливает ее.

Другие инструкторы по дрессировке считают, что, если пищевое подкрепление используется в обучении, собака будет подчиняться только тогда, когда будет голодна. Но я рекомендую использовать пищу как один из способов положительного подкрепления. Если пищевая подкормка используется правильно, такое положительное подкрепление не будет вызывать проблем при обучении.

Отрицательное подкрепление. Любовь, похвала и награда — очень важные аспекты успешного обучения собаки. Но, к сожалению, этого не достаточно. Отрицательное подкрепление также необходимо, если дрессировщик хочет преуспеть в общении со своей собакой, если он желает чтобы она его поняла до конца. Как я упоминал ранее, обучение должно строиться на мироощущении, мировоззрении собаки. Например, волк поддерживает порядок в своей стае при помощи демонстративного и физического взаимодействия. Однако волк не наказывает членов своей стаи. Точно также и я рекомендую, чтобы вы воздерживались от наказания своей собаки.

Между наказанием и отрицательным подкреплением существует большое различие. Наказание происходит после того, как индивидуум совершил нежелательный поступок. Отрицательное подкрепление происходит во время нежелательного поведения. В этом случае собаке легче связать неприятные воздействия с выполнением нежелательного поведения. Как мы знаем, наказание, как расплата за преступление, неизбежно. Отрицательное подкрепление же всегда связано во времени с поведением. Собаки не способны думать так: «Ага, меня наказывают сейчас за то, что я сделал двумя часами раньше!» Поэтому пользуйтесь отрицательным подкреплением, оно наиболее действенно в дрессировке и исправлении поведения.

Натуральное отрицательное подкрепление. Лидер стаи собак не пинает, не бьет кулаком и не убивает членов своей стаи, поведение которых ему не нравится. Я настоятельно рекомендую, чтобы вы также избегали этих оскорбительных методов. Взамен используйте вот такие виды натурального отрицательного подкрепления при обучении своей собаки.

Например, ваш голос — один из видов натурального воздействия, при помощи которого вы можете общаться с собакой и изменить ее поведение. Как известно, собаки рычат. Когда щенки слишком шалят, родительница может громко рычать. Она говорит своим рычанием: «Что вы Делаете, остановитесь немедленно!» Всякий раз, когда вам нужно остановить нежелательное поведение собаки, попробуйте сказать ей что-нибудь (короткое слов или буквосочетание) хрипло рычащим тоном. Произносите не столько громко, сколько глубоко.

Собаки также кусают друг друга. Вы, наверное, наблюдали, как собака защищает свою кость, когда ее пытается отнять другая собака. Сначала собака-хозяин рычит. Если это не помогает, в ход идут зубы.

Я помню, как остался у магазина ждать своего приятеля в обществе его щенка. Отроду ему было девять-десять недель, а папой его был, скорее всего, немецкий овчар. Я попытался поднять его на руки, но это было так, как будто я пытался поднять детеныша аллигатора! Щенок зарычал и тут же укусил меня, как дикий звереныш. Я зарычал в ответ, но напрасно, щенок продолжал жевать мое запястье. Тогда я слегка укусил его в области спинки носа. Он тявкнул и отпустил мою руку. Я повернул его морду к себе и посмотрел ему в глаза. Щенок тут же принялся отчаянно меня вылизывать, как будто я был его давно потерянный отец.

Увидев это, приятель был очень удивлен. Он сказал: «Что ты сделал с моей собакой? Я никогда не видел, чтобы он кого-нибудь целовал! Он кусает каждого, кто близко подходит к нему».

«Он укусил меня, а я укусил его», — ответил я. С изумленным лицом приятель переспросил: «Ты укусил мою собаку! Но прежде, чем я успел ему ответить, он добавил: «Вообще-то я сам собирался его искусать. Он совсем не слушается меня и тоже норовит укусить. Сегодняшним утром я пытался наказать его скрученной газетой, так он напал на газету!»

Ясно, что приятелю никогда, действительно, не исправить нежелательное поведение его щенка, которого, вероятно последний раз воспитывала мамаша. Я же разговаривал с собакой на понятном ей языке.

Если вы собираетесь попробовать эту методику, будьте внимательны, чтобы собака не укусила вас в лицо. Зажмите ей пасть рукой, прежде чем укусите ее. Никогда не кусайте малознакомую собаку. Я кусаю щенков моих учеников пока они не достигли пятимесячного возраста. Своих собственных взрослых собак я кусаю смело, потому что знаю, они меня не укусят. Подчиненные не кусают бесспорного лидера стаи. (Я знаю, это звучит очень самоуверенно, но это совершенно точно).

Другое натуральное отрицательное подкрепление — толчок в области загривка шеи собаки. Загривок область шеи перед плечами. Трепание загривка используется собаками для коррекции поведения щенков. Я также наблюдал, как взрослые собаки захватывают пастью загривок другой собаки при попытке утвердить превосходство. Если вы не склонны кусать свою собаку, вы можете воспользоваться именно этим видом отрицательного подкрепления. Оба вида отрицательного подкрепления понятны собакам — это их язык. Я настоятельно советую вам разговаривать со своей собакой на их языке, так она быстрее поймет вас.

Со временем вы должны будете обучать свою собаку, используя методы, которые не относятся к разряду естественных. Собаки, конечно, не используют ошейников и поводков. Они не брызгают в морду друг другу водой, чтобы обучить шумных членов стаи быть тихими по команде. Но если способ гуманен, почему бы им не воспользоваться?

Что такое гуманный способ? Любой способ или приспособление, которые причиняют боль, вызывает визг собаки, или очень пугают ее, недопустимы. Гуманными являются те способы, которые помогают обучить собаку чему-нибудь ненасильственным путем.

Своевременная похвала дает понять собаке, что предшествующее поведение должно быть повторено. Своевременное отрицательное подкрепление обучает собаку избегать предшествующего ему поведения в следующий раз.

Наказание негуманно или, по крайней мере, несправедливо. Негуманно ругать или лупить собаку, которая час назад съела вашу диванную подушку. Это — не так честно, как жестоко звучащее рычание, произведенное в тот момент, когда собака только что схватила ее. При использовании своевременного отрицательного подкрепления собака быстро и эффективно обучится избегать нежелательного поведения без особого труда.

Гуманная дрессировка не разрушает доверие, существующее между дрессировщиком и его собакой. С другой стороны, слишком сильное или «зверское» наказание может очень сильно напугать вашу собаку. И, хотя вы сможете при помощи этого быстро исправить нежелательное для вас поведение, вы рискуете потерять любовь и доверие своей собаки. Если это случится, у вас будет плохой компаньон, друг и защитник.

Не вызывайте панического страха использованием отрицательного подкрепления. Вы должны использовать только соответствующее вашей собаке отрицательное подкрепление. Оно должно быть достаточно сильным, чтобы остановить исполнение нежелательного поведения, но вызывать страха.

Принципы гуманной дрессировки достаточно просты для понимания. Однако я знаю, что «гуманность очень субъективный термин. Познакомьтесь вот с такой историей. Я жил со стандартным пуделем в течение двенадцати лет. Я получил Джосси, когда ей было приблизительно восемнадцать месяцев, из ветеринарной больницы, где работал. Ее принесли в больницу для усыпления, потому что владельцы устали от ее выходок. Джосси мочилась, испражнялась и грызла вещи всякий раз, когда оставалась дома одна. Она кусала имеющихся в доме в семье трех маленьких детей. Как только дверь открывалась, она убегала прочь и не подходила по команде. У нее имелся длинный список огрехов поведения. Но все было просто: Джосси не была обучена.

Я чувствовал, что Джосси была хорошей собакой, и думал, что при правильном подходе и соответствующем обучении ее можно было бы спасти. Владельцы собаки были взволнованны и довольны тем, что я избавил их собаку от смерти. После того, как я за воевал доверие собаки, Джосси была готова для обучения. В течение полутора лет я обучал собаку по курсу А.К.С. — собака-компаньон. Однажды я отрабатывал навык укладки. Собака довольно хорошо справлялась с этим упражнением, но еще не была готова к сдаче экзаменов. Проезжающая повозка отвлекла ее и она встала, я зарычал на нее. Джосси посмотрела на меня. Я хотел коснуться ее рукой, но собака отступила. Проходившая мимо женщина внезапно начала меня ругать. «Вас нужно арестовать, — сказала она. — Я обращусь в общество по охране животных. Вы не должны так обращаться с хрупким, нежным созданием». Так она ругалась в течение десяти минут.

Я пробовал объяснить ей, что сохранил жизнь этой собаке, что ее хотели умертвить, потому что она не была обучена и поэтому меня нельзя назвать жестоким. Но мне не удалось оправдаться. Вот вам женская интерпретация «жестокой» и негуманной дрессировки.

Познакомьтесь с другой историей. Однажды, когда я работал в ветеринарной лечебнице, туда принесла свою маленькую собачку одна пожилая женщина. У песика были очень длинные когти на пальцах, которые приносили ему страдания. Когда я спросил ее, почему она вовремя не обрезала коготки или не принесла собаку раньше, она ответила: «Ему это не нравится и он не позволял нам даже приблизиться к лапкам!» Для того, чтобы произвести операцию, этой собаке пришлось дать наркоз и еще в течение двух недель лечить воспаление подушечек лап. В то время как гораздо гуманней было бы периодически подрезать когти собачке, но для этого она должна бы быть достаточно воспитанной.

Так что подумайте над тем, что такое гуманность и дрессировка. Гоните прочь свою слепую чувствительность. Гуманная дрессировка, обеспечивающая повиновение и регулярное ветеринарное обследование, может быть, требуют дополнительных затрат времени, но они делают счастливой жизнь собаки и в конечном счете, жизнь ее владельцев.

Источник

Понятие стимула и подкрепления собак

III. Управление с помощью стимулов

Взаимодействие без принуждения

Все, что вызывает какую-либо поведенческую реакцию, называется стимулом. Некоторые стимулы способны вызывать реакции без какого-либо обучения или тренировки: мы вздрагиваем от громкого звука, моргаем от яркого света, нас тянет в кухню, когда до нас доносится аппетитный запах; животные поступают точно так же. Такие звуки, свет и запахи называются безусловными, или первичными, стимулами.

Другие стимулы заучиваются благодаря ассоциации. Сами по себе они могут ничего не значить, но становятся выделяемыми сигналами для поведения; сигналы светофора заставляют нас стоять или идти, мы вскакиваем, чтобы снять трубку зазвонившего телефона, на шумной улице оборачиваемся, услышав свое имя и т. д., и т. д. Ежедневно мы отвечаем на множество выученных сигналов. Они называются условными, или вторичными, стимулами.

При формальном тренинге львиная доля усилий приходится на образование условных сигналов. Сержант, занимающийся строевой подготовкой со взводом новобранцев, и хозяин собаки на дрессировочной площадке в равной мере стремятся сделать в основном так, чтобы обучающиеся повиновались командам, которые в действительности являются условными сигналами. Фокус не в том, что собака может сидеть, а человек останавливаться, фокус в том, что это делается четко и по команде. Вот что мы называем повиновением — не просто выполнение действия, но гарантия того, что оно будет выполнено по сигналу. Психологи называют это «поставить поведение под контроль стимулов». Это вырабатывается с трудом, выработка основывается на правилах, а правила нуждаются в проверке.

А что, если у вас нет в мыслях становиться хозяином собаки и вы не собираетесь тренировать спортивную команду?

Вам все равно может пригодиться понимание того, что такое стимульный контроль. Например, если ваши дети бездельничают и не идут на ваш зов, вы плохо владеете стимульным контролем. Если вы руководите людьми и вам иногда приходится два или три раза повторять приказ или инструкцию, прежде чем они будут выполнены, то значит у вас проблемы со стимульным контролем. Разве не случается, что вы говорите: «Я тебе уже однажды сказала, я говорила тебе тысячу раз, не…» (Не хлопай дверью, или не клади мокрый купальник на кровать, или что-либо в этом роде.) Когда сказать один или тысячу раз недостаточно, поведение не управляется стимулами.

Иногда может казаться, что мы обладаем стимульным контролем когда в действительности этого нет. Мы предполагаем, что сигналу или команде должны подчиниться, а этого не происходит. Самой распространенной реакцией на это является усиление сигнала. Так, официант не понимает вашего французского? Говорите громче. Чаще всего это не помогает. Субъект должен распознавать сигнал, иначе безразлично, кричите ли вы что есть мочи или даже ревете с помощью усилительной аппаратуры рок-ансамбля, на вас будут смотреть невидящим взором.

Другой реакцией человека на игнорирование условного сигнала является бешенство, которое действует только в том случае, если субъект проявляет преднамеренное непослушание, не давая твердо заученного ответа на хорошо выученный сигнал. При этом иногда, показав характер, можно получить хорошее поведение.

Бывает, что субъект отвечает правильно, но с очень большой задержкой или через пень-колоду. Часто неуклюжие ответы на команды определяются тем, что субъект не обучен отвечать быстро. Без положительного подкрепления не только за правильный, но и за проворный ответ на сигнал у субъекта нет шансов усвоить, что успех приносит быстрое повиновение стимулам. При этом поведение в действительности не контролируется стимулами.

Реальная жизнь изобилует плохой организацией управления с помощью стимулов. Как только один человек пытается проявить власть, другой оказывается в опасности проявить «непослушание». В действительности проблема состоит в непонимании команд или сигналов, которым он поэтому не может повиноваться. Это примеры плохой коммуникации или нечеткого управления с помощью стимулов.

Правила управления с помощью стимулов

Для того, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигналом, поведения.

Например, предположим, что вы заставляете собаку садиться, надавливая на крестец и подтягивая за ошейник. Это безусловные стимулы, они действуют без обучения. Затем вы подкрепляете любое самостоятельное проявление собакой этой позы, формируя соответствующее поведение. Делая это, вы произносите команду «Сидеть!», которая первоначально ничего не значит для собаки (конечно, подойдет и любое другое слово на любом языке). Когда собака усвоит, что вам иногда надо, чтобы она села, она иногда станет выполнять это действие во время или после предъявления сигнала, или условного стимула, команды «Сидеть!». В конце концов она начнет выполнять действие точно в соответствии с тем, что ей приказывают.

Теперь поведение находится под контролем стимула, не так ли? Еще нет. Проделана только половина работы. Животное следует также обучить — и это специальная тренировочная задача — не садиться без команды. Установление управления поведением стимулами не является завершенным, пока оно совершается и в отсутствии условного сигнала.

Это, конечно, не означает, что собака должна целый день стоять, пока вы не скомандуете: «Сидеть!». Она может садиться сколько ей вздумается. Однако во время тренировок или работы, когда предполагается использование условных стимулов, «пуск» и «стоп» сигналы должны быть твердо установлены, чтобы выполнение команды было надежным.

Итак, полный контроль с помощью стимулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной задачи, самостоятельному пункту программы выработки.

1. Поведение всегда осуществляется сразу после подачи условного стимула (собака садится, «когда ей приказывают).

2. Поведение никогда не возникает в отсутствие стимула (во время занятий или работы собака никогда не садится спонтанно).

3. Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите: «Лежать!», собака не должна садиться).

4. Никакое другое поведение не возникает в ответ на данный стимул (когда вы говорите «Сидеть!» собака не должна ложиться или скакать и лизать ваше лицо).

Только когда все четыре условия соблюдаются, собака действительно полностью и окончательно понимает команду «Сидеть!». Теперь вы действительно управляете ею с помощью стимула.

Где в реальной жизни мы используем или нуждаемся в таком полном управлении с помощью стимулов? Ну к примеру, в музыке. Дирижеры оркестра часто создают очень сложную систему сигнального управления, а на репетиции дирижер может встретиться с самыми разнообразными неправильными реакциями. Например, он может дать сигнал означающий одно, — скажем, «форте», усиление звучания и не получить его, может быть, вследствие того что еще недостаточно прочно установлено значение сигнала. Или он может и не давать сигнала усиления, а тем не менее получить слишком большую интенсивность звука. Особенно этим отличаются духовые инструменты классических оркестров, Рихард Штраус в юмористическом своде правил для начинающих дирижеров говорил: «Никогда не подбадривайте взглядом играющих на духовых инструментах» Дирижер может дать сигнал, требующий другого, — допустим, «престо» — а вместо увеличения темпа получить усиление звучания солисты теноры проделывают это весьма часто. Наконец, дирижер может требовать включения большего числа исполнителей, а вместо этого получить множество ошибок, так происходит с хористами-любителями. Каждый тип неправильного ответа на условный стимул должен быть исправлен с помощью тренировки, прежде чем дирижер будет уверен, что у него или у нее адекватное сигнальное управление.

Так же жизненно важно сигнальное управление в военном деле. Занятия по строевой подготовке с новобранцами — утомительное и трудоемкое дело, и им самим оно может казаться трудным и бессмысленным, но оно выполняет очень важную функцию. Строевая подготовка не только вырабатывает точные реакции на строевые команды, что даст возможность командирам с легкостью приводить в движение большие группы людей, но она также вырабатывает навык ответа на условный сигнал вообще: повиновение команде, которое в конце концов является не столько умственным актом, сколько выученным умением, являющимся решающим, а часто и жизненно важным для солдата. С тех пор как были придуманы армии, строевая подготовка являлась способом выработки этого навыка.

Что может быть сигналом?

Условным стимулом — выученным сигналом может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского — короче говоря, безразлично, какой сигнал вы используете. Коль скоро субъект может воспринимать его, сигнал может быть использован для вызова выученного поведения.

Дельфинов обычно тренируют с помощью воспринимаемых зрением сигналов руки, но я знаю одного слепого дельфина, который выучил много разных типов поведения в ответ на различные прикосновения. Пастушьих собак обычно дрессируют с помощью сигналов, поданных рукой и голосом. Однако в Новой Зеландии с ее широкими просторами, где собака может находиться очень далеко, в качестве условного сигнала используют пронзительные свистки, которые слышны на большем расстоянии, чем голос. Когда новозеландский пастух продает такую собаку, покупателем может оказаться человек, живущий за много миль; так как свистки невозможно записать на бумаге, то старый хозяин обучает нового командам по телефону.

У рыб можно выработать условный рефлекс на звуки или свет — мы все знаем, как аквариумные рыбки устремляются к поверхности, если постучать по стеклу или включить свет. А человеческие существа могут выработать условные связи практически на все что угодно.

В тренировочной ситуации полезно, чтобы для всех субъектов были одни и те же ключи и сигналы, чтобы не только дрессировщик, но и другие люди могли вызывать данное поведение. Поэтому дрессировщики склонны строго следовать традициям в использовании условных стимулов. Во всем мире лошади под седлом начинают движение, когда вы толкаете их пятками в бока, и останавливаются, когда вы натягиваете поводья. Верблюды в зоопарке Бронц ложатся, когда слышат команду «Каш!», даже если рядом с ними никого нет, включая их дрессировщика, говорящего по-арабски; и любой человек знает, что надо сказать, чтобы верблюд лег.

И то, что живущих в Нью-Йорке верблюдов можно с тем же успехом обучить ложиться при словах «Спокойно, крошка!», не имеет ни малейшего значения.

Поэтому-то профессиональные дрессировщики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой лошадью на корде, обучая ее команде «Вперед!». Тренер конюшни смотрел на это с отвращением и наконец сказал: «Так ничего не выйдет — лошади не понимают „Вперед!“, надо цокать». Потом взял веревку у меня из рук, сказал: «Тцо-тцо» и стеганул жеребенка по крупу свободным концов веревки, что естественно тотчас же вызвало движение вперед.

«Понятно?» — сказал он, считая свои слова доказанными.

Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих команд, но и любой возможной системы понуканий, окриков, применяемой другими дрессировщиками. Это избавило меня от неприятностей и заставило говорить обо мне как о подающем надежды дрессировщике-любителе. По крайней мере мне не приходилось переделывать моих сигналов!

Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо получать только какое-либо одно поведение, вполне достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми помещении оратор может потребовать тишины, воскликнув: «Тихо!», или встать и, подняв руку, жестом призвать к молчанию.

А если присутствующие шумят и при этом находятся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих стимулов.

Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул — допустим, команду, поданную голосом, — как всегда, и новую команду — скажем, сигнал, поданный рукой, — и подкрепляете ответ; затем постепенно делаете старый стимул все менее и менее заметным и одновременно привлекаете внимание к новому, делая его очень выраженным, пока на новый стимул не будете получать столь же хороший ответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первоначальный стимул; когда уже выработано «Выполняй это действие» и «Выполняй это действие по команде», то легче выработать «Выполняй это действие также по другой команде».

Интенсивность сигнала и стирание стимулов

Мы пользуемся стиранием постоянно: то, что поначалу должно быть очень массированным стимулом («Дик, нельзя сыпать песок на головы другим детям», — говорим мы, вытаскивая Дика из песочниц), со временем превращается в чуть заметный сигнал (просто поднять брови или погрозить пальцем). Дрессировщики животных иногда добиваются поразительных, просто волшебных результатов с помощью стертых стимулов. Один из самых забавных номеров, которые я видела, проделывал попугай в Парке диких животных в Сан-Диего. Он разражался истерическим хохотом в ответ на чуть заметное движение руки дрессировщика. Представьте себе возможности этого трюка: «Педро, что ты думаешь о шляпе этого человека?» — «Ха-ха-ха!». Поскольку публика не замечает сигнал, единственное выученное попугаем поведение кажется результатом разумного сардонически-язвительного ответа на вопрос; а на самом деле это был четкий ответ на очень ослабленный стимул, а сардонический ум, если и присутствовал, то принадлежал дрессировщику, а может быть, сценаристу.

Однако лучшие примеры обусловливания, стирания и переноса стимулов мне приходилось наблюдать не в мире дрессированных животных, а на репетициях симфонических оркестров. Будучи певцом-любителем, я занималась в нескольких оперных и симфонических хорах, которые часто управлялись заезжими дирижерами. В то время как многие из сигналов, которые подают дирижеры музыкантам, являются более или менее стандартизованными, у каждого из дирижеров есть свои собственные сигналы, и их значение должно быть усвоено в очень короткое время — время на репетицию часто лишь немногим превосходит время на выступление. Однажды на репетиции симфонии Малера «Воскрешение», как раз в тот момент, когда басы собирались вступить с обычной оглушительной силой, я увидела, как дирижер предъявил безусловный сигнал, предупреждавший: «Вступайте мягче», изобразив на лице страшную тревогу, пригнувшись к земле и заслонив лицо рукой, как бы защищаясь от удара. Все поняли смысл переданного сообщения, и в следующие несколько минут дирижер смог ослабить сигнал и уменьшить интенсивность звучания всех частей хора с помощью предостерегающего взгляда, легкого движения спины, имитирующего припадание к земле, или чуть заметного отголоска от прежнего жеста, и наконец, только вздрагивание плеч. Столь же часто дирижеры осуществляют перенос стимулов, сочетая какой-либо известный или самоочевидный жест — скажем, — поднятие ладони кверху для обозначения «Громче» — с незнакомым жестом, таким, как присущий только ему наклон головы или поворот тела — однажды, сидя слева от дирижера среди альтов, я наблюдала дирижерский жест, управляющий громкостью звучания альтов с помощью левой брови.

Одним из результатов введения управления с помощью стимулов является усиление внимания субъекта, необходимое, если он хочет получить подкрепление за правильный ответ, особенно, если стимулы подвергаются стиранию. Бывает, что субъект способен воспринять столь слабые сигналы, в которых не отдает себе отчета сам дрессировщик, подающий их. Классический пример этого — Умный Ганс, лошадь, живущая в Германии. Это было в начале века; ее считали гениальной. Ударами копыт она могла считать, производить арифметические действия, складывать из букв слова и даже извлекать квадратные корни; правильные ответы, конечно, подкреплялись лакомством. Хозяин, в прошлом школьный учитель, был совершенно уверен, что обучил лошадь читать, думать, заниматься математикой и вступать в общение. И действительно лошадь «отвечала» на вопросы даже в отсутствие хозяина. Многие ученые мужи приезжали в Берлин изучать Умного Ганса и убеждались в его гениальности. И лишь одному из психологов удалось показать, что лошадь ориентируется на какой-то сигнал, и, если никто из присутствующих не знает ответа, удары копыта носят неопределенный характер. Потребовалось длительное время и дальнейшее исследование, против которого восставали те, кто был убежден в гениальности лошади; чтобы показать, что сигналом к прекращению ударов копыта был легкий подъем головы хозяина или любого другого человека, задающего вопрос, когда достигалось правильное число, это движение, первоначально усиливаемое широкополой шляпой, которую носил учитель, теперь было столь малым, что его почти не было видно (никому, кроме Умного Ганса), но оно почти не поддавалось подавлению произвольным усилием. Вот поэтому лошадь могла ориентироваться, когда прекращать удары копытом, наблюдая за любым человеком, а не только за хозяином. Феномен Умного Ганса стал нарицательным для любого случая, когда внешне поразительное поведение, начиная от разума животного, кончая психическими явлениями, на самом деле управляется какими-либо мельчайшими или стертыми проявлениями поведения экспериментатора, ставшими условными стимулами для субъекта.

Условные стимулы, вызывающие отвращение

Выученные сигналы и первоначальные стимулы совершенно различны по своей природе, а новички обычно это не учитывают. Если они не получают ответа, скажем, на легкий рывок, они дергают чуть сильнее, затем еще немного сильнее, и все совершенно без пользы, так как лошадь или собака с той же возрастающей силой тянут в другую сторону.

Профессиональные дрессировщики имеют обыкновение работать над сигналом и применять силу раздельно; они дают условный стимул, и если животное ему не повинуется, они, минуя все градации, немедленно вызывают нужное поведение чрезвычайно сильным неприятным стимулом, способным «освежить память», как выражается один дрессировщик лошадей. Такую же функцию выполняет парфорс в дрессировке собак. При умении даже небольшой человек, используя такой ошейник, может добиться такого рывка, который будет достаточен, чтобы свалить с ног датского дога.

Имея в запасе эти первичные стимулы, можно быстро получить хороший ответ на очень слабые рывки, и, как замечает английская дрессировщица Барбара Вудхаус, это в конечном счете гораздо лучше, чем постоянно дергать и тянуть за шею бедное животное к каким-то промежуточным и бессмысленным целям.

Чтобы добиться точности ответа на условный стимул, полезно применять прием ограничения времени отставления.

Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал времени между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке постепенно замедляет ход и наконец останавливается.

Если вы хотите, то, используя ограничение времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно.

Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепляете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкрепление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор.

Когда вы подобным образом установите временной интервал и будете давать подкрепление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы начинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните подавать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто наблюдается данное поведение.

Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реагируют на выработку времени отставания, но дрессировщик не должен полагаться на авось.

Пользуясь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите время ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается.

В 1960 г. в океанариуме «Жизнь моря» одним из наиболее эффектных номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыжки и повороты в ответ на подводные звуковые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требовались, возникали спорадически с интервалами пятнадцать-двадцать секунд. Но использовав секундомер и установив фиксированное отставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое животное знало, что получить рыбу можно только выскочив в воздух и совершив нужный прыжок или вращение в течение двух с половиной секунд после начала сигнала.

В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Родителей, начальников, и учителей, которые проявляют последовательность в выработке определенного временного интервала реакции, обычно считают хорошими, заслуживающими того, чтобы с ними иметь дело, даже если отставание — временное «окно», в течение которого должно осуществляться поведение, которое будет подкреплено, — очень короткое.

Наиболее частым недостатком в управляемом сигналами поведении является предвосхищение: как только сигнал усвоен, субъект так стремится продемонстрировать требуемое поведение, что совершает его раньше, чем подается сигнал.

Термин, описывающий это проявление, заимствован из опережающего поведения у людей при состязаниях в беге — опережая выстрел, фальстарт, ложная тревога. Люди, которые опережают указания и просьбы других, обычно считаются нетерпеливыми, выскочками или подобострастными; это очень раздражающая привычка, а вовсе не добродетель.

На соревнованиях по выучке с доберман-пинчерами часто бывают неприятности. Хотя эти собаки прекрасно поддаются дрессировке, они столь возбудимы, что предвосхищают команды по малейшим намекам и начинают работать прежде, чем им в действительности приказывают, теряя при этом баллы. Предвосхищение является обычной ошибкой лошадей, с которых бросают лассо на родео. Предполагается, что ковбой и лошадь должны ждать за барьером, пока не пустят бычка, но возбужденная лошадь перескакивает барьер раньше сигнала.

Ковбой иногда думает, что у него лошадь с высокими ходовыми качествами, но на самом деле это просто недостаточно выработанное управление с помощью сигналов.

Другой чрезвычайно распространенный случай предвосхищения — офсайт в американском футболе. Один из игроков так нетерпелив, что продвигается на территорию другой команды до того, как подан сигнал игры, за что команду наказывают.

С практической точки зрения ликвидировать предвосхищение можно, вводя тайм-ауты. Если субъект предвосхищает сигнал, и если это нежелательно, прекратите всякую работу. Не давайте сигналов и ничего не делайте целую минутy. Каждый раз как субъект опередит выстрел, останавливайте часы. За нетерпение вы наказываете отставлением возможности работать. Это вызывает очень эффективное подавление опережения команды, в то время как выговоры, наказание или повторение могут оказаться вовсе недейственными.

Стимулы в качестве подкрепления: поведенческие цепи

Я выработала цепное поведение

Поведенческие цепи — очень распространенное явление.

В реальной жизни мы часто производим серии связанных действий, состоящих из многих отдельных поведенческих актов. Не надо далеко ходить за примерами — работа плотника или уборка квартиры — неплохая иллюстрация. Мы ожидаем, что и наши питомцы будут вести себя так же: «Подойди», «Сядь», «Ляг», «Следуй за мной» и так далее без перерыва и без видимого подкрепления. Эти длительные рады действий являются цепным поведением. В противоположность другим длительным действиям эти могут выполняться часами, сотни раз без напряжения, без сбоев, без задержек, поскольку каждый акт в действительности подкрепляется возможностью выполнить следующее, действие цепочки, и так до заключительного подкрепления выполнением всего дела, всей цепи.

Однако поведенческие цепи рвутся и поведение рассыпается на элементы, если в цепочку вклинивается не выученный поведенческий акт, или действие, не находящееся под контролем стимулов. Вы не можете подкрепить субъекта сигналом, если он этот сигнал не распознает или не может выполнить то, что этот сигнал требует. Отсюда следует, что цепное поведение следует всегда вырабатывать с конца. Начинайте с последнего действия в цепи, удостоверьтесь, что оно усвоено и сигнал к его выполнению хорошо узнается, лишь потом переходите к разучиванию предпоследнего действия и т. д. Например, если при заучивании стихотворения, мелодии, текста речи, роли в пьесе вы разделите задания, скажем, на пять частей и начнете запоминать их в обратном порядке, с конца — вы всегда будете двигаться от того, что вы знаете слабее, к тому, что знаете более прочно, от материала, в котором вы не совсем уверены, к материалу, хорошо уже усвоенному, имеющему подкрепляющее действие. Запоминание материала в том порядке как он написан и должен воспроизводиться приводит к необходимости постоянно продираться от знакомой тропы в сторону более трудного и неизвестного, что — является не подкреплением. Подход к запоминанию материала как к цепному поведению не только убыстряет процесс запоминания, но и делает его более приятным.

Поведенческие цепи — это особое понятие. Я часто сама спотыкалась на них, чувствуя, что надо вернуться к концу ряда, так как я не могу заставить животное, ребенка или себя выполнить кажущуюся простой последовательность действий, пока я не понимала, что пыталась выработать цепное поведение не с того конца. Когда делают пирог, — то глазурью его украшают в последнюю очередь, но если вы хотите обучить ребенка получать удовольствие от приготовления пирога, начните с того, что попросите «помочь» украсить его глазурью.

Читайте также: Реклама алиса с собакой

Пример цепного поведения: обучение собаки игре в фризби (пчелку)

Один мой нью-йоркский знакомый каждый выходной ходил со своим золотистым спаниелем в Центральный парк, чтобы играть в «пчелку». Он рассказывает мне, что сплошь и рядом встречает людей, безуспешно пытающихся обучить своих собак этой игре. Это досадно, потому что игра в «пчелку» прекрасный способ тренировки собаки в городе. По сравнению с простым мячом «пчелка» летит медленнее и по неопределенной траектории, возможно, больше напоминает реальную дичь, заставляет собаку совершать прыжки в попытках поймать ее, что доставляет удовольствие и хозяину. И, наконец, игра в «пчелку» позволяет хозяину, оставаясь на одном месте, заставлять собаку бегать.

Люди жалуются, что, когда они бросают «пчелку», собака наблюдает за ее полетом, продолжая оставаться на месте, хотя если ее раззадорить, то она будет прыгать, пытаясь схватить «пчелку», когда та пролетает мимо. В этой игре два дрессировочных момента: первый состоит в том, чтобы обучить собаку, на какое расстояние она должна отбегать за «пчелкой». Второй состоит в том, что данная игра — цепное поведение: сначала собака гонится за «пчелкой», затем ловит «пчелку», наконец, несет ее назад хозяину, чтобы он снова кинул ее. Поэтому каждому элементу этого сложного поведения следует обучать отдельно, и последнее действие в цепи, принос, должно быть выработано первым.

Вы можете обучить приносу с очень маленьких расстояний даже в доме, используя предмет, который легко носить, скажем, старый носок. Большинство охотничьих собак приносят предметы сами, без обучения, собак некоторых пород, таких, как бульдоги, боксеры, необходимо обучать класть апорт около хозяина или отдавать его в руки, поскольку они предпочитают игры, в которых бы вещи у них отбирали.

Когда по команде собака будет приносить предметы, обучите ее ловить «пчелку». Сначала заставьте собаку как можно сильнее заинтересоваться «пчелкой», двигая ее у самой морды. Позвольте ей несколько раз взять игрушку в рот и добейтесь, чтобы она отдала вам ее обратно, при этом, конечно, бурно поощряйте ее за возврат. Затем подбросьте игрушку в воздух, позвольте собаке завладеть ею в прыжке и заставьте отдать обратно. Затем вы тут же снова подбрасываете игрушку в воздух и бурно радуетесь, когда собака ее поймает. И теперь вы на прямой дороге к получению великолепного игрока в «пчелку».

Расстояние бросков постепенно увеличивается, и собаке необходимо научиться следить за «пчелкой» и перемещаться так, чтобы поймать ее. Это требует тренировки, поэтому может понадобиться пара выходных, чтобы заставить собаку отходить на семь-восемь метров. Некоторым очень быстрым собакам удается оказываться точно на месте и ловить «пчелку» на таком большом расстоянии, на какое вы сможете ее забросить. Мне приходилось встречать необыкновенных собак, которые могли поймать «пчелку» на другом конце футбольного поля. Создавалось впечатление, что собаки получают удовольствие от точности своей оценки места падения.

Блестящий бег или фантастические захваты в прыжках с переворотом, которые вызывают восторг зрителей, — тоже доставляют собаке радость. Тем не менее, поймав «пчелку», собака несет ее вам, поскольку последнее звено цепи разучено первым и поскольку именно это действие приводит к подкреплению, будь то ваша похвала или другой бросок. Разумеется, если вы будете невнимательны и собака будет систематически не получать похвалы или следующего броска не будет, принос подвергнется затуханию. И еще, когда собака слишком устает и не хочет больше играть, она начинает все хуже и хуже приносить «пчелку», медлит с возвращением и бросает ее на полпути. Это означает, что пора остановиться — вы оба уже взяли от игры все.

Генерализованное управление с помощью стимулов

С большинством животных приходится сначала немного повозиться, чтобы установить управление их поведением с помощью стимулов, но часто к тому времени, как берете под контроль сигналов третий или четвертый тип поведения, оказывается, что животное как бы обобщает, у него появляется нечто вроде понимания идеи. Выучив три-четыре условных поведенческих акта, большинство субъектов, по-видимому, начинают распознавать определенные события в качестве сигналов, каждый из которых означает свой тип поведения, и что получение подкрепления зависит от правильного распознавания и ответа на сигналы. С этого момента введение условных сигналов становится простым. У субъекта уже имеется общая картина, и все что ему надлежит сделать — это научиться классифицировать новые сигналы и ассоциировать их с правильным поведением. Если вы, как дрессировщик, поможете питомцу, сделав это понятным, последующее обучение может идти само собой много быстрее, чем трудные начальные шаги.

У людей обобщение происходит еще быстрее. Если вы вознаградили за ответ только на одну выученную команду, люди очень скоро начинают давать ответы и на другие команды, чтобы заслужить подкрепление. Мой друг Ли, учитель математики шестого класса школы в одном из непривилегированных районов Нью-Йорка, каждый учебный год начинает с того, что обучает школьников выбрасывать жевательную резинку, как только он попросит их об этом. Никакого принуждения. Просто: «Все, внимание, жевательную резинку изо рта. Хорошо! Стоп! Подождем, у Дорин она еще есть… великолепно! Она ее вынула. Молодец, Дорин!». Он говорит детям, что после урока они могут снова взять жевательную резинку (используя в качестве подкрепления слова «Класс свободен!»). Это может показаться фривольным и даже глупым (поскольку это стоит Ли вида жующих челюстей, чего он терпеть не может), но Ли установил, что этот первый опыт подготавливает его класс к тому, что выполнение его просьб создает возможность подкрепления. Конечно, подобно хорошему дрессировщику китов, он использует разнообразные подкрепления, помимо хороших отметок и собственной похвалы, включая игры, одобрение сверстников, более ранее окончание урока, даже раздачу жевательной резинки. И конечно, сначала он уделяет много времени жевательной резинке, вместо того, чтобы уделять его десятичным дробям, дети думают, что он помешан на резинке. Но дети так же придают значение его словам и считают, что имеет смысл делать то, что хочет Ли.

Другие учителя думают, что у Ли врожденное умение поддерживать тишину в классе, а директор считает его хорошим «дисциплинщиком». Что же касается Ли, то он считает детей достаточно сообразительными, чтобы обобщить свои реакции, и любит их за это. А жевательная резинка тут ни при чем.

Провалы преднаучения и вспышки раздражения

Установление контроля над поведением с помощью стимулов часто порождает интересный феномен, который один из тренеров назвал «провалом преднаучения». Вы сформировали поведение и теперь пытаетесь сделать его управляемым с помощью стимулов. Но когда вам кажется, что субъект уже проявляет способность отвечать на стимулы, он внезапно перестает отвечать не только на стимулы, но и вообще давать нужные реакции. Он ведет себя так, будто никогда и не слышал о действиях, которые вы сформировали.

Этот момент полностью обескураживает тренера. Вот вы очень изобретательно научили цыпленка танцевать, а теперь хотите, чтобы он танцевал только, когда вы поднимаете правую руку. Цыпленок смотрит на вашу руку, но не танцует.

Или же он может стоять на месте, когда вы подаете сигналы, и начинать интенсивно отплясывать, когда никакого сигнала не было.

Если вы построите график этой последовательности, то увидите постоянно идущую кверху линию, отражающую увеличение процента правильных ответов (т. е. ответов на сигналы), которая затем резко снижается, ибо соответственно правильность ответов падет до нуля (когда вы имеете букет отсутствия ответов и неправильных ответов). Однако если вы продолжаете упорно работать, затем внезапно наступает озарение: вдруг, совершенно случайно, субъект скачком начинает отвечать на команды действительно идеально — вы поднимаете руку, цыпленок танцует. Поведение управляется стимулами.

На мой взгляд, происходит вот что: сначала субъект выучивает сигнал, не осознавая этого, дрессировщик видит только обнадеживающую тенденцию медленного нарастания правильного выполнения команд. Но затем субъект замечает (!) сигнал и осознает, что на него надо как-то отвечать, чтобы получить подкрепление. В этот период он уделяет большее внимание сигналу, чем проявляемому поведению. Конечно, при этом ответ отсутствует, так же как и подкрепление. Когда же, по случайному стечению обстоятельств, или в результате упорства тренера, субъект однажды осуществит реакцию при наличии сигнала и получит подкрепление, у него «возникнет картина». С этого момента он «знает», что означает сигнал, и отвечает на него правильно и уверенно.

Я понимаю, что говорю по этому поводу много таких слов, как «отдает себе отчет», «знает» в отношении того, что происходит в голове субъекта, которые большинство психологов считают неприменимыми к животным. Однако при дрессировке животных иногда так оно и есть, что уровень правильных ответов постепенно нарастает, хотя внешне ничего существенного не происходит; трудно сказать, с какого момента, если таковой вообще существует, животное начинает осмысленно отдавать себе отчет в том, что делает. Но наличие провала преднаучения, по моему мнению, является отражением осознания, вне зависимости от того, какие процессы в это вовлекаются. Я могла обнаружить ярко выраженное проявление провала преднаучения (а следовательно, и своего рода сдвиг осознания) в данных Мишеля Уолкера, исследователя из Гавайского университета, ставившего эксперименты по сенсорному различению у тунца, одного из наиболее разумного вида рыб, но в конце концов только рыбы.

Для субъекта провал преднаучения — время наибольших огорчений. Мы все знаем, как расстраивает борьба с тем, что понимаем только наполовину (общеизвестный пример — математические понятия), зная только то, что по-настоящему их не понимаем. Часто субъект бывает настолько расстроен, что проявляет гнев и агрессивность. Дети разражаются слезами и тычут в учебник математики карандашом. Дельфины многократно выпрыгивают из воды и шлепаются о ее поверхность со страшным шумом. Лошади размахивают хвостом и норовят лягнуть. Собаки рычат. Доктор Уолкер обнаружил, что если при выработке распознавания стимула он допускает, что его подопытные тунцы и совершают ошибки и не получают подкрепления более сорока пяти секунд, они настолько расстраиваются, что выпрыгивают из бассейна.

Я пришла к тому, что стала называть эти проявления преднаучения вспышками раздражения. Мне кажется, что вспышки раздражения возникают потому, что субъект, считавший себя всегда правым, вдруг обнаруживает, что он ошибается (раз за разом), а причина этого неясна… пока. У людей вспышки раздражения в период преднаучения, по-видимому, часто происходят в моменты, когда бросается вызов привычным представлениям, которых длительно придерживались, а где-то в глубине души субъект знает (!), что в новой информации кроется некая правда. Именно распознание того, что выученное ранее не совсем верно, по-видимому, и приводит к неистовым возражениям, чрезмерным ответам, которые намного превышают степень несогласия, спорам, скандалам, которые могут казаться по наитию наиболее подходящими и вероятными к случаю. Иногда, рассказывая о подкреплении в научных кругах, я вызывала, большую, чем предполагала, враждебность со стороны представителей других дисциплин, начиная от психологов, занимающихся познавательными процессами, кончая нейрологами и представителем высшего духовенства. Я часто подозреваю, что гневные слова являются симптомом преднаучения.

Я всегда сожалею, когда вижу приступы плохого настроения, связанного с преднаучением, даже у тунцов, потому что при определенных навыках можно провести субъекта по пути обучения, не вызывая столь большого раздражения. Однако я пришла к убеждению, что вспышки раздражения в период преднаучения являются четким индикатором того, что вот-вот произойдет истинное обучение. Если вы отойдете в сторонку и дадите ему отшуметь как ливню, то вслед за этим может появиться радуга.

Применение управления с помощью сигналов

Никому не нужно постоянно управлять или быть управляемым с помощью условных стимулов или выученных сигналов, живые существа — это не машины. В действительности реакция на выученный сигнал представляет собой усилие, причем такое усилие, которое не только не должно, но и не может поддерживаться постоянно.

Большую часть времени у начальника нет надобности держать подчиненных радом. Если дети бездельничают, а вы не очень спешите, то вы можете сами расслабиться. Служащим, которые и так уже работают с полной отдачей, не нужны приказы и инструкции. Ни нас самих, ни других людей не должны опутывать ненужные правила и регламентации: они вызывают только сопротивление.

Совершенно очевидно, что управление с помощью стимулов используется, чтобы дети стали воспитанными, домашние животные слушались, персонал был надежным и т. д.

Очень своеобразное управление с помощью стимулов необходимо также для многих видов коллективной деятельности, таких, как марширующие колонны, танцевальные ансамбли, спортивные команды. Отвечать на выработанную систему выученных сигналов доставляет определенное удовольствие, даже животным, по-видимому, это нравится. Я думаю, это происходит оттого, что стимулы становятся подкреплениями, как в поведенческой цепи, так что, когда овладеваешь всеми типами поведения и сигналами, осуществление ответов имеет сильное подкрепляющее действие. Словом, это интересно.

Отсюда то удовольствие от участия в управляемой стимулами групповой деятельности, как, например, согласованный танец, игра в футбол, хоровое пение и игра в оркестре.

Когда мы видим какой-либо пример прекрасно управляемого сигналом поведения, начиная с фигур высшего пилотажа, исполняемых группой истребителей, до класса хорошо умеющих вести себя детей, то, желая похвалить их, используем понятие дисциплины. «Они поистине хорошо дисциплинированы» или «Этот учитель знает, как поддерживать дисциплину». Однако понятие о дисциплине включает применение наказания, которое, как мы видели, совершенно не нужно при установлении управления с помощью стимулов.

В обиходе сторонниками дисциплины считаются инструктор, родитель, тренер, которые требуют совершенного исполнения и наказывают за любое отклонение, а совсем не те, кто добивается совершенства, подкрепляя улучшения в его сторону. И именно поэтому люди, задавшиеся целью установить «дисциплину», часто пытаются управлять с помощью стимулов на основе: «Делай, что я скажу, иначе…» Поскольку субъект должен ошибиться или не послушаться, чтобы узнать, что значит «иначе», и поскольку тогда становится уже слишком поздно этого не совершать, то этот распространенный подход вовсе не так хорош.

Истинное, изящное управление сигналами, установленное с помощью подкрепления, может делать то, что мы считаем дисциплиной субъекта. Однако кто должен стать действительно дисциплинированным так это тренер.

Да, но с чего начать? Что, если вы живете и работаете среди людей, которые являются закоренелыми неслухами?

Вот система Карен Прайор эффективного воздействия в тяжелом случае.

Карен Прайор (видя мокрые плавки и полотенце Юного Гостя на кушетке в гостиной): Пожалуйста, снимите свои мокрые вещи с кушетки и повесьте на сушилку.

Юный Гость: O’кей, минуточку.

К.П. (подходит к Ю. Г. и стоит рядом с ним молча).

К.П. Пожалуйста, снимите свой мокрый купальник с кушетки и повесьте на сушилку (NB: не прибавляя: «Сейчас же!», «Сию минуту!», «Я сказала» или что-нибудь в этом роде. Я обучаю этого человека выполнять просьбы с первого раза, а не ждать, когда сигнал будет усилен дальнейшими деталями ими угрозами.)

Ю.Г. Вот еще, если вы так спешите, то почему бы вам не сделать это самим?

К.П. (Любезная улыбка, но никакого ответа. Я жду момента подкрепить желаемое поведение. Препирательство со мной не является желаемым поведением, поэтому я пренебрегаю им.)

Ю.Г. Ладно, ладно (Встает, идет к кушетке, забирает вещи, бросает их в комнату, где стирают.)

Ю.Г. (Ворчит, поднимает и вешает вещи на сушку.)

К.П. (Широкая улыбка, искренне, без издевки) Благодарю вас!

В следующий раз, когда мне будет нужно попросить юного гостя что-нибудь сделать, возможно, мне потребуется всего лишь взглянуть на него, чтобы вызвать действие. Мало-помалу он станет одним из тех домочадцев, которые быстро исполняют мои просьбы, а я со своей стороны — буду платить ему тем же, буду выполнять то, что он просит, если это выполнимо, и буду стараться не просить его делать более, чем он должен.

Знание того, как добиться управления с помощью стимулов, не прибегая к крику и принуждению, в равной мере облегчает жизнь всем — воспитателю и обучаемому. Когда моя дочь Гейл поступила в высшую школу, ей пришлось ставить учебную пьесу, ежегодно для этого выбирали кого-либо из студентов.

Источник

Понятие стимула и подкрепления собак

Положительное подкрепление в дрессировке собак

Екатерина Кастрицкая, психолог, специалист по анималотерапии, консультант по поведению и благополучию животных

Для чего можно использовать положительное подкрепление?

Какие аргументы приводят противники положительного подкрепления и почему эти аргументы несостоятельны?

В чем преимущества положительного подкрепления?

Что нужно, чтобы использовать метод положительного подкрепления в дрессировке собаки?

Стимулы в качестве подкрепления: поведенческие цепи

Читайте также

Объяснения косвенного подкрепления

Режимы подкрепления

Элементы сновидения как звенья цепи

Слон на цепи

Глава 9. Разрывая цепи Свободы.

Часть 4. Разрывая цепи себя самого.

Время подачи подкрепления

Величина подкрепления

Режимы подкрепления

Исключения из правила вариативного подкрепления

Суеверия: случайные подкрепления

37. Избавьтесь от подкрепления плохого поведения

Положительные и отрицательные подкрепления собаки

Понятие стимула и подкрепления собак