ГоловнаПсихологіяВведення в професію «Психолог»
« Попередня Наступна »
Рита Л. Аткінсон , Річард С. Аткінсон, Едвард Е. Сміт, Деріл Дж. Бем, Сьюзен Нолен-Хоексема. Введення в психологію Частина 1, 2000 - перейти до змісту підручника

Оперантное обумовлення

У класичному обусловливании умовна реакція часто нагадує звичайну реакцію на безумовний стимул. Слиновиділення, наприклад, - нормальна реакція собаки на їжу. Але якщо ви хочете навчити організм чомусь новому, наприклад навчити собаку нового трюку, класичне обумовлення вам не допоможе. Який безумовний стимул змусить собаку сидіти або перекочуватися? Щоб навчити собаку, вам доведеться спочатку переконати її проробити потрібний трюк, а потім винагородити її похвалою або їжею. Якщо продовжувати так робити, собака з часом навчиться цьому трюку.

Багато чого з поведінки в реальному житті схоже на це: реакціям навчаються тому, що вони діють, або впливають на оточення. Такий тип навчання, званий оперантного обумовлення, властивий і людині, і тваринам. Залишений один в ліжечку, дитина може спонтанно брикатися, крутитися або лопотати. Собака, залишившись одна в кімнаті, може метатися взад-вперед, щось винюхувати, може підібрати м'ячик, впустити його або пограти з ним. Жоден організм не реагує на появу або зникнення конкретного зовнішнього стимулу. Всі вони впливають на своє оточення. Але якщо організм вже здійснює певну поведінку, ймовірність того, що він повторить це дія, залежить від того, що слід за останнім. Дитина буде частіше лопотати, якщо за кожним таким дією слід батьківську увагу, і собака буде частіше піднімати м'ячик, якщо за цим слід ласка або винагороду їжею. Якщо вважати, що у дитини є мета викликати батьківську увагу, а у собаки мета - їжа, то оперантное обумовлення зводиться до навчання того, що певна поведінка веде до досягнення певної мети (Rescorla, 1987).



Закон ефекту



Вивчення оперантного обумовлення почалося на рубежі нашого століття з ряду експериментів Торндайка (Е. L. Thorndike, 1898). Торндайк, на якого сильно вплинула дарвінівська теорія еволюції, прагнув показати, що научение у тварин невідривно від навчання у людини. Типовий експеримент проходив так. Голодного кота саджали в клітку, дверцята якої була закрита на просту засувку, а зовсім поряд з кліткою клали шматочок риби. Спочатку кіт намагався дістатися до риби, простягаючи лапи між прутів. Коли це не виходило, кіт переміщався по клітці, роблячи самі різні дії. У якийсь момент він випадково зачіпав засувку, виходив на свободу і з'їдав рибу. Потім кота садили назад в клітку і кидали зовні новий шматочок риби. Кот здійснював приблизно ту ж послідовність дій, поки йому знову не вдавалося відкрити засувку. Ця процедура повторювалася знову і знову. Продовжуючи проби, кіт відкидав багато марні дії, поступово досягаючи вдалого відкривання засувки і виходу на свободу, як тільки його поміщали в клітку. Цей кіт навчився відкривати засувку, щоб отримати їжу.

Все це виглядає так, як ніби кіт діє розумно, але Торндайк стверджував, що тут присутній мало «інтелекту». За весь час не було такого моменту, щоб у кота з'явилася здогадка про вирішенні цього завдання. Замість цього досягнення кота поступово поліпшувалися з продовженням проб. Кіт не здогадується, а просто поводиться по типу проб і помилок, і коли після здійснення якоїсь дії негайно слід винагороду, научение цій дії закріплюється. Це закріплення Торндайк називав законом ефекту. Він стверджував, що при оперантному навчанні в силу закону ефекту з набору випадкових реакцій вибирається та, за якою йдуть позитивні наслідки. Цей процес схожий з еволюцією, в якій закон виживання самого пристосованого вибирає з набору випадкових варіацій виду саме ті зміни, які сприяють виживанню цього виду. Закон ефекту, таким чином, проголошує виживання самих пристосованих реакцій (Schwartz, 1989).



Експерименти Скіннера



Б. Ф. Скіннер - винуватець цілої низки змін в уявленнях про те, що таке оперантное обумовлення і як його вивчати. Його метод дослідження оперантного обумовлення був простіше, ніж у Торндайка (наприклад, використовувалася тільки одна реакція), і став широко прийнятим.

<Рис. Б. Ф. Скіннер з'явився основоположником вивчення оперантного обуславливания.>

Варіації експерименту. В експерименті Скіннера голодне тварина (зазвичай щура або голуба) поміщають в ящик, подібний зображеному на рис. 7.6, з популярним назвою «ящик Скіннера».



Рис. 7.6. Пристрій для оперантного обумовлення. На фото показаний ящик Скіннера з касетою для подачі харчових кульок. Комп'ютер використовується для управління експериментом і реєстрації реакцій щури.



Ящик всередині порожній, якщо не вважати виступаючого важеля, під яким стоїть тарілка для їжі. Невелика лампочка над важелем може включатися на розсуд експериментатора. Залишена одна в ящику, щур пересувається і досліджує його. Випадково вона виявляє важіль і натискає на нього. Частота, з якою щур спочатку натискає на важіль, - фоновий рівень. Після встановлення фонового рівня експериментатор запускає в дію касету з їжею, розташовану зовні ящика. Тепер кожен раз, коли пацюк натискає на важіль, невеликий кулька їжі випадає в тарілку. Щур з'їдає його і незабаром знову натискає на важіль; їжа підкріплює натискання на важіль, і частота натискань стрімко зростає. Якщо касету з їжею від'єднати, так що при натисканні на важіль їжа більше не подається, частота натискань буде зменшуватися. Отже, оперантная обумовлена ??реакція (або просто операнта) при непідкріпленні згасає точно так само, як і класично обумовлена ??реакція. Експериментатор може встановити критерій диференціювання, подаючи їжу тільки тоді, коли пацюк натискає на важіль при палаючій лампочці, і тим самим виробляючи умовну реакцію у пацюка шляхом виборчого підкріплення. У цьому прикладі світло служить дифференцировочного стимулом, який контролює реакцію.

Отже, оперантное обумовлення підвищує ймовірність деякої реакції, коли певна поведінка супроводжується підкріпленням (зазвичай у вигляді їжі або води). Оскільки в ящику Скіннера важіль присутній завжди, щур може натискати на нього так часто або не часто, як сама вибере. Таким чином, частота реакції служить зручною мірою сили операнти: чим частіше відбувається реакція за даний часовий інтервал, тим більше її сила.

Слід вказати на відношення між термінами «винагороду» і «покарання», з одного боку, і «позитивне» і «негативне підкріплення», з іншого. Термін «винагороду» може використовуватися синонімічно з терміном «позитивний підкріплювальний фактор» - подія, яка збільшує ймовірність тієї чи іншої форми поведінки, якщо воно йде за даною формою поведінки. Проте покарання - це не те ж саме, що негативний підкріплювальний фактор. Термін «негативне підкріплення» означає припинення настання небажаних подій, наступних за тією або іншою формою поведінки; як і позитивне підкріплення, воно збільшує ймовірність відповідної форми поведінки. Покарання ж має протилежний ефект: воно зменшує ймовірність караного поведінки. Покарання також може бути як позитивним (вплив неприємного стимулу), так і негативним (позбавлення позитивного стимулу) (див. табл. 7.3).



Таблиця 7.3.

Типи підкріплення і покарання





Застосування до виховання дітей. Хоча в оперантном обусловливании улюбленими експериментальними тваринами були пацюки і голуби, воно застосовується до багатьох біологічних видів, включаючи нас самих. Дійсно, воно може багато що сказати нам про виховання дітей. Особливо яскравим прикладом цьому слугує такий випадок. У маленького хлопчика були спалахи гнівного роздратування, якщо він не отримував достатньо уваги від батьків, особливо перед сном. Оскільки батьки рано чи пізно відгукувалися, проявляемое ними увагу підкріплювала гнів дитини. Щоб зняти цю гнівну дратівливість, батькам порадили виконувати звичайний ритуал укладання спати, а потім ігнорувати протести дитини, хоча це і може бути болісно. При утриманні від підкріплення (приділення уваги) спалахи гніву повинні згасати; саме це і сталося. Всього за 7 днів час, протягом якого цей дитина плакала в ліжку, скоротилося з 45 хвилин до нуля (Williams, 1959).

<Рис. Схильність дітей до істерик можна послабити, якщо їх поведінка не підкріплювати батьківською увагою.>

Ще одне застосування оперантного обумовлення до виховання дітей стосується часового співвідношення між реакцією і її підкріпленням. Лабораторні експерименти показали, що негайне підкріплення ефективніше, ніж затримане; чим більше часу проходить між оперантной реакцією і підкріпленням, тим менше сила реакції. Багато фахівців з психології розвитку відзначали, що затримка підкріплення - важливий фактор догляду за маленькими дітьми. Якщо дитина по-доброму ставиться до домашньої тварини, його дії найкраще можна закріпити винагородою (похвалою, наприклад) негайно, не відкладаючи це на потім. Подібним чином, якщо дитина б'є-кого без провокації на свою адресу, то така агресивна поведінка буде виключено з більшою ймовірністю, якщо його покарати негайно, не відкладаючи на потім.

Формування. Припустимо, ви хочете використовувати оперантное обумовлення, щоб навчити вашу собаку трюку - наприклад, натискати носом на дзвінок. Ви не можете чекати, поки собака зробить це сама собою (і тоді підкріпити це), оскільки чекати можна вічно. Якщо необхідну поведінку дійсно нове, ви повинні зумовити його, використовуючи перевагу природних варіації в діях тварини. Щоб навчити собаку натискати дзвінок носом, можна давати їй харчове підкріплення кожного разу, коли вона наближається до зони дзвінка, змушуючи її з кожним підкріпленням підходити ближче і ближче до потрібного місця, поки нарешті ніс собаки не торкнеться дзвінка. Така техніка, коли підкріплюються тільки ті відхилення в реакціях, які потрібні експериментатору, називається формуванням поведінки тварини.

Застосовуючи метод формування, тварин можна навчити відпрацьовувати трюки і послідовності дій. Два психолога з співробітниками підготували тисячі тварин багатьох видів для телевізійних шоу, реклами та окружних ярмарків (Breland & Breland, 1966). В одному популярному шоу брала участь «Прісцилла, вибаглива свинка». Прісцилла включала телевізор, їла сніданок за столом, підбирала брудний одяг і клала її в. кошик, пилососила підлогу, вибирала свою улюблену їжу (серед продуктів, що конкурують з продукцією її спонсора!) і брала участь у вікторині, відповідаючи на питання аудиторії натисканням на вимикачі лампочок, які показували «так» чи «ні». Вона не була особливо обдарованої свинею: насправді, оскільки свині ростуть дуже швидко, нову «Прісциллу» готували кожні 3-5 місяців. Справжньою винахідливістю відрізнялися все ж таки не свині, а експериментатори, які використовували оперантное обумовлення і формували поведінку, щоб домогтися бажаного результату. Шляхом формування оперантних реакцій голубів тренували знаходити людей, що загубилися в море (рис. 7.7), а морських свинок тренували знаходити підводне обладнання.

<Рис. Оперантное обумовлення і формування поведінки використовуються в дресируванню тварин для навчання їх виконанню різного роду трюків.
>



Рис. 7.7 Пошук і порятунок з допомогою голубів. Берегова охорона використовувала голубів для пошуку людей, які загубилися в море. Застосовуючи методи формування, голубів тренували розпізнавати помаранчевий колір - міжнародний колір рятувальних жакетів. Три голуби пристебнуті в ящику з оргскла, прикріпленому до днища вертольота. Ящик поділений на секції, так що кожен птах дивиться у своєму напрямку. Коли голуб виявляє помаранчевий об'єкт або будь-який інший об'єкт, він клює ключ, і у пілота дзвенить дзвінок. Тоді пілот розгортається в напрямку, вказаному зреагувати птицею. Для виявлення віддалених об'єктів в море голуби підходять більше, ніж люди. Вони можуть дивитися на воду протягом довгого часу, не страждаючи від втоми очей: у них чудове колірний зір, а зона фокусування у них 60-80 градусів, тоді як у людини - 2-3 градуси (по: Simmons, 1981).



Феномени та їх застосування



Існує ряд явищ, що значно розширюють сферу дії оперантного обумовлення і вказують на можливе його застосування до поведінки людини.

Умовне підкріплення. Більшість з розглянутих нами підкріплень називаються первинними, оскільки, як і їжа, вони задовольняють основні потреби. Якби оперантное обумовлення відбувалося тільки з первинними підкріпленнями, воно не було б таким поширеним в нашому житті, оскільки первинні підкріплення не настільки часті. Проте практично будь-який стимул може стати вторинним, або умовним, підкріпленням, якщо його послідовно поєднувати з первинним підкріпленням; умовні підкріплення значно розширюють діапазон оперантного обумовлення (так само як обумовлення другого порядку значно розширює діапазон класичного обумовлення).

Невелика варіація типового експерименту з оперантного обумовлення ілюструє роботу умовного підкріплення. Коли щур в ящику Скіннера натискає на важіль, моментально звучить тон, за яким незабаром дається їжа (їжа - первинне підкріплення; звук стане умовним підкріпленням). Після того як у тварини виробилася умовна реакція, експериментатор переходить до її угашенію, так що коли пацюк натискає на важіль, що не з'являється ні їжі, ні звуку. Через якийсь час щур перестає натискати на важіль. Потім поновлюється звук, але не їжа. Коли тварина виявляє, що при натисканні важеля включається звук, частота натискань помітно зростає, долаючи згасання, хоча ніякої їжі за цим не слід. Звук придбав якість підкріплення сам по собі шляхом класичного обумовлення; стійко поєднуючись з їжею, він сам став сигналом їжі.

  Наше життя рясніє умовними підкріпленнями. Домінують з них два: гроші і похвала. Імовірно, гроші є сильним підкріпленням тому, що вони часто поєднуються з первинними підкріпленнями: можна купити їжу, випивку, зручності - це тільки кілька очевидних прикладів. І похвала - навіть без обіцянки первинного підкріплення - може багато в чому підтримувати діяльність.

  <Рис. Похвала є ефективним підкріплювальним фактором для багатьох людей.>

  Генералізація і диференціювання. Те, що було вірно для класичного обумовлення, вірно і для оперантного: організми генерализуется те, що вони вивчили, і генералізацію можна обмежити тренуванням на диференціювання. Якщо батьки підкріплюють маленької дитини за пещення домашньої собачки, він незабаром генерализуется цю реакцію ласки на інших собак. Оскільки це може бути небезпечно (сусідська собачка може виявитися лютим сторожовим псом), батьки дитини можуть провести деяку дифференцировочного тренування, так щоб він пестив свою собаку, але не сусідську.

  Дифференцировочного тренування буде ефективна в тій мірі, в якій присутній диференційовних стимул (або набір стимулів), що дозволяє чітко відрізняти випадки, де реакція повинна мати місце, від випадків, де її потрібно придушити. Вищезазначеного маленькій дитині буде легше навчитися, яку собаку пестити, якщо його батьки зможуть вказати на ознака собаки, що сигналізує про її дружності (виляння хвостом, наприклад). Взагалі, диференціювальний стимул буде корисний у тій мірі, в якій його присутність пророкує, що за реакцією послідує підкріплення, а його відсутність пророкує, що за реакцією підкріплення не послідує (або навпаки). Так само, як і в класичному обусловливании, предсказательная сила стимулу має вирішальне значення для обумовлення.

  Режими підкріплення. У реальному житті окремі епізоди поведінки підкріплюються рідко; іноді за старанну роботу хвалять, але часто вона залишається невизнаною. Якби оперантное обумовлення відбувалося тільки при постійному підкріпленні, його роль в нашому житті була б обмеженою. Виявляється, однак, що після того як поведінка виникло, воно може підтримуватися, якщо його підкріплювати тільки частина всього часу. Це явище відоме як часткове підкріплення, і його можна проілюструвати в лабораторії на прикладі голуба, який навчається клювати ключ, щоб отримувати їжу. Після того як ця операнта сформувалася, голуб продовжує клювати ключ з високою частотою, навіть якщо він отримує підкріплення тільки від випадку до випадку. Іноді голуби, винагороджуються їжею в середньому один раз за 5 хвилин (12 разів на годину), клювали ключ 6000 разів на годину! Крім того, згасання, наступне за підтриманням реакції на часткове підкріплення їжею, йде набагато повільніше, ніж згасання, наступне за підтриманням реакції на безперервне підкріплення. Це явище відоме як ефект часткового підкріплення. Даний ефект зрозумілий на чисто інтуїтивному рівні, оскільки якщо підкріплення для підтримки реакції є лише частковим, випадки згасання і підтримки реакції важче відрізнити один від одного.

  Коли підкріплення здійснюється тільки частина всього часу, нам потрібно знати, який в точності його розпорядок: після кожної третьої реакції? або кожні п'ять секунд? Виявляється, що режим підкріплення визначає схему реагування. Деякі розкладу підкріплення називають пропорційним режимом, тому що при цьому підкріплення залежить від числа скоєних реакцій. Це як на заводі, коли робітнику платять за певний обсяг роботи. Коефіцієнт пропорційності може бути фіксованим або змінним. При режимі з фіксованою пропорцією (його називають режимом ФП) число реакцій, які повинні здійснитися, одно певній величині. Якщо це число становить 5 (ФП 5), то це означає, що підкріплення послідує по скоєнні 5 реакцій, якщо воно дорівнює 50 (ФП 50), буде потрібно здійснити 50 реакцій, і т. д. Взагалі, чим вище пропорція, тим з більшою частотою організм реагує, особливо якщо його спочатку тренували при відносно низькому коефіцієнті (скажімо, ФП 5), а потім безперервно збільшували коефіцієнт до величини, скажімо, ФП 100. Це як якщо б на заводі робітникові спочатку платили по 5 доларів за кожні 5 зошитах швів, але потім настали важкі часи, і йому довелося за ті ж 5 доларів робити 100 швів. Але, мабуть, сама примітна особливість поведінки при режимі з ФП полягає в тому, що відразу після чергового підкріплення у зростанні реакцій настає пауза (див. ліву частину рис. 7.8). Заводському робітникові важко почати нову серію швів відразу після того, як він зробив їх достатньо, щоб отримати винагороду.





  Рис. 7.8.

 Типові схеми реакцій на чотири основні режиму підкріплення

 . Кожна крива відображає сукупне число реакцій тварини залежно від часу; нахил кривої відображає частоту його реакцій. Криві зліва відносяться до пропорційного режиму. Зверніть увагу на горизонтальні ділянки кривої для режиму з ФП: вони відповідають паузам (немає зростання сукупного числа реакцій). Криві праворуч відображають умови інтервального режиму. Крива для режиму з фіксованим інтервалом (ФМ) знову містить горизонтальні ділянки, відповідні паузам (по: Schwartz, 1989). ФП - фіксована пропорція; ПП - мінлива пропорція, ФІ - фіксований інтервал; ПІ - змінний інтервал.



  При режимі з змінної пропорцією (ПП) підкріплення також дається після вчинення певної кількості реакцій, але їх число варіюється непередбачувано. Так, при режимі ПП 5 кількість реакцій, необхідних для підкріплення, іноді становить 1, іноді 10, а в середньому 5. На відміну від поведінки при режимі з ФП, при режимі з ПП не спостерігається пауз у зростанні реакцій (див. ліву частину рис. 7.8), імовірно тому, що у організму немає можливості визначити, що підкріплення з'явиться нескоро. Хороший приклад режиму з ПП в повсякденному житті - робота ігрового автомата. Кількість реакцій (ігор), необхідний для видачі підкріплення (виграшу), весь час змінюється, і у гравця немає способу передбачити, коли піде підкріплення. Режим ПП може породжувати дуже високу частоту реакцій (як, мабуть, і розрахували власники казино).

  Крім пропорційних існують інтервальні режими, в яких підкріплення видається тільки після певного часу. Такі режими теж бувають фіксованими і змінними. При фіксованому інтервалі (ФМ) організм отримує підкріплення за першу реакцію після певного часу з моменту її останнього підкріплення. Наприклад, при режимі ФІ 2 (2 хвилини) підкріплення дається тільки після закінчення 2 хвилин після останньої підкріпленої реакції; реакції протягом цього двохвилинного інтервалу проходять без наслідків. Особливість реагування при режимі ФИ - пауза, що виникає відразу після підкріплення (вона може бути навіть довше, ніж пауза при режимі ФП). Ще одна особливість реагування при режимі ФМ - це зростання частоти реакцій у міру наближення закінчення періоду (див. праву частину рис. 7.8). Хороший приклад режиму ФИ в повсякденному житті - доставка пошти, яка приходить тільки раз на день (ФИ 24 години) або, в деяких місцях, двічі на день (ФИ 12 годин). Так, відразу після доставки пошти ви не будете її перевіряти знову (у вас пауза), але в міру наближення закінчення інтервалу доставки пошти ви знову починаєте її перевіряти.

  При режимі з перемінним інтервалом (ПІ) винагорода все ще залежить від прошествия певного інтервалу, але його тривалість коливається непередбачувано. При розкладі ПІ 10 (10 хвилин), наприклад, критичний інтервал іноді може бути 2 хвилини, іноді 20 і т. д. при середній величині 10 хвилин. Якщо при режимі ФИ частота реакцій змінюється, то при режимі ПІ 1 організми реагують з однаково високою частотою (див. праву частину рис. 7.8). Як приклад режиму ПІ в повсякденному житті можна навести дозванивание по зайнятому номеру. Щоб отримати підкріплення (додзвонитися), треба почекати якийсь час після останньої реакції (набору номера); скільки доведеться чекати в цілому - непередбачувано (див. табл. 7.4).



  Таблиця 7.4.

 Режими підкріплення





  Обумовлювання неприємними стимулами



  Ми говорили про підкріплення так, ніби воно завжди позитивне (їжа, наприклад). Але негативні або неприємні події, наприклад удар струмом або нестерпний шум, теж часто використовуються для обумовлення. Існують різні види обумовлення неприємними стимулами, залежно від того, чи застосовуються вони для ослаблення наявної реакції або для заучування нової. [Варто звернути увагу на співвідношення термінів винагорода і покарання, з одного боку, і позитивне і негативне підкріплення, з іншого.
 Винагорода може використовуватися як синонім позитивного підкріплення - події, поява якого слідом за реакцією підвищує ймовірність цієї реакції. Але покарання - це не те ж саме, що негативне підкріплення. Останнє означає припинення неприємної події слідом за реакцією. Покарання має протилежний ефект: воно зменшує ймовірність реакції. - Прим. автора.]

  Покарання. При тренуваннях з покаранням за реакцією слід неприємний стимул або подія, що веде до ослаблення реакції або придушення наступних її проявів. Припустимо, маленька дитина, яка вчиться користуватися кольоровими олівцями, починає малювати на стіні (це небажана реакція); якщо його шльопають по руці, коли він це робить (покарання), він навчаються так не робити. Подібним чином, якщо пацюк, яка навчається проходити лабіринт, отримує удар струмом кожен раз, коли вона йде не туди, вона скоро навчиться уникати минулих помилок. В обох випадках покарання використовується для зниження ймовірності небажаного поведінки. [Іншими словами, відбувається згасання орієнтовної реакції на безумовний стимул. - Прим. ред.]

  Покарання може придушити небажану реакцію, але у нього є кілька недоліків. По-перше, його ефект не настільки передбачуваний, як ефект винагороди. Винагорода, по суті, говорить: «Повтори те, що ти вже зробив»; покарання каже «Перестань!» І не може запропонувати альтернативу. У результаті організм може замінити карають реакцію ще менш бажаною. По-друге, побічні результати покарання можуть виявитися шкідливими. Покарання часто веде до антипатії або страху перед мстився людиною (батьком, вчителем або наймачем) і перед самою ситуацією (будинком, школою або офісом), де відбувалося покарання. Нарешті, вкрай суворе або хворобливе покарання може викликати агресивну поведінку, більш серйозне, ніж первинне небажане.

  Ці застереження не означають, що покарання ніколи не повинно застосовуватися. Воно може ефективно знімати небажану реакцію, якщо інша реакція винагороджується. Щури, які навчилися знаходити більш короткий з двох шляхів в лабіринті, щоб дістатися до їжі, швидко переключаються на більш довгий, якщо в короткому шляху їх б'є струмом. Тимчасове приховування, що викликається покаранням, дає щура можливість навчитися йти довгим шляхом. У цьому випадку покарання служить ефективним засобом переорієнтувати поведінку, оскільки воно інформативно, а це і є ключ до гуманного і ефективному застосуванню покарання. Дитина, яка отримав удар струмом від електроприладу, може навчитися тому, які з'єднання безпечні, а які - ні.

  <Рис. Загроза покарання - ефективний засіб мотивації. Напис на дорожньому знаку: НЕ сигналів. Штраф 50 $.>

  Уникання і запобігання. Неприємні події можуть також використовуватися при научении нових реакцій. Організм може навчитися реагувати так, щоб припинити неприємна подія, наприклад, коли дитина навчається закривати кран, щоб гаряча вода не лилася в його ванну. Це називається научением избеганию подій. Організм може реагувати і так, щоб запобігти неприємна подія до його початку, наприклад, коли ми навчаємося зупинятися на червоне світло, щоб запобігти нещасним випадкам (і отримання штрафних квитанцій). Це називається научением запобігання подій.

  Научение избеганию часто передує навченню запобігати події. Це ілюструє наступний експеримент. Щура поміщають в ящик, що з двох відділень, розділених бар'єром. У кожній пробі тварина поміщають в одне з відділень. У деякий момент лунає попереджувальний звук, а п'ять секунд по тому до підлоги цього відділення подається струм; щоб піти від удару струмом, тварина повинна перестрибнути через бар'єр в інше відділення. Спочатку тварина робить це, коли струм вже включений, - тут має місце научение избеганию. Але в міру тренування тварина навчаються стрибати, почувши попереджувальний звук, і тим самим цілком уникає удару струмом - це научіння запобіганню.

  Научение запобігання викликало широкий інтерес, почасти тому, що в ньому є щось вельми загадкове. Що являє собою підкріплення реакції запобігання? У вищевикладеному дослідженні - що підкріплює стрибок щури через бар'єр? Інтуїтивно здається, це - відсутність роздратування струмом, але відсутність чогось можна розглядати як неподій. Як може неподій служити підкріпленням? В одному з рішень цієї загадки передбачається, що в такому научении є дві стадії. На першій стадії відбувається класичне обумовлення: при неодноразовому поєднанні попередження (УС) і наказующего події, тобто удару струмом (БУС), тварина заучивает реакцію страху на попередження. На другій стадії відбувається оперантное обумовлення: тварина навчаються, що певна реакція (перестрибування бар'єру) усуває неприємна подія, то є страх. Коротше, те, що спочатку здається неподій, насправді - страх, і запобігання можна представляти як припинення страху (Rescorla & Solomon, 1967; Mowrer, 1947).



  Контроль і когнітивні фактори



  У нашому аналізі оперантного обумовлення підкреслювалася роль факторів оточення: за реакцією незмінно слід було підкріплювальне подія, і організм учився асоціювати дану реакцію з даними підкріпленням. Але в когнітивної теорії запобігання, про яку ми говорили, передбачається, що в оперантном обусловливании, так само як і в класичному, важливу роль відіграють когнітивні фактори. Як ми побачимо, іноді корисно розглянути ситуацію оперантного обумовлення організму як придбання ним нового знання про взаємозв'язок між реакцією і підкріпленням.

  Одночасність або контроль? Як і у випадку класичного обумовлення, ми хочемо знати, який фактор є вирішальним, щоб відбулося оперантное обумовлення. Знову-таки один з варіантів - збіг за часом: операнта стає умовною, коли підкріплення негайно слід за поведінкою (Skinner, 1948). Більш когнітивний варіант відповіді, близько пов'язаний з передбачуваністю, - це фактор контролю: операнта стає умовною, тільки коли організм інтерпретує підкріплення як подія, контрольоване його реакцією. Деякі важливі експерименти (Maier & Seligman, 1976) більше говорять на користь фактора контролю, ніж на користь фактора збігу за часом (див. також обговорення контролю і стресу в гол. 15).

  Основний експеримент складається з двох стадій. На першій стадії деякі собаки дізнаються, що роздратування струмом або його відсутність залежить від їхньої поведінки (або контролюється ним), а інші собаки навчаються з того, що у них немає контролю над роздратуванням струмом. Собак відчувають парами. Обидва члени пари знаходяться в упряжі, що обмежує їх руху, і несподівано вони отримують удар струмом. Один член пари - «провідна» собака - може вимкнути електрику, натиснувши носом на поруч розташований вимикач; інший член пари - «ведена» собака - ніяк не може контролювати удар струмом. Кожен раз, коли ведуча собака отримує удар, то ж дістається і веденої собаці; і кожен раз, коли ведуча собака вимикає струм, у веденої собаки він теж припиняється. Таким чином, і ведуча і ведена собаки отримують однакову кількість ударів струмом.

  Щоб дізнатися, що вивчили собаки на першій стадії, потрібна друга стадія, на якій експериментатор поміщає обох собак в новий пристрій - ящик, розділений бар'єром на дві половини. Це такий же пристрій для тесту на запобігання події, яке ми розглядали трохи вище. Як і раніше, в кожній пробі спочатку звучить тон, який вказує, що відділення, займане зараз тваринам, ось-ось піддасться впливу електрики; щоб уникнути подразнення, тварина повинна навчитися при попереджуючому звуці стрибати через бар'єр в інше відділення. Провідні собаки швидко навчаються цієї реакції. Але з веденими собаками відбувається зовсім інше. Вони з самого початку не роблять руху через бар'єр, і в міру продовження проб їх поведінка стає все більш пасивним, поки собака під кінець не впадає в повну безпорадність. Чому? Тому що на першій стадії ведені собаки дізналися, що удари струмом - поза їх контролю, і це переконання в безконтрольності зробило обумовлення на другій стадії неможливим. Якщо переконання в безконтрольності унеможливлює оперантное обумовлення, то, може бути, саме переконаність у контролі робить його можливим. Багато інших експерименти свідчать на користь того, що оперантное обумовлення відбувається, тільки коли організм сприймає підкріплення як щось, що він може контролювати (Seligman, 1975). Детальніше про придбаної безпорадності буде сказано в гол. 15.

  Научение залежності. Про наведених результатах молено говорити і в термінах залежностей. Можна сказати, що оперантное обумовлення відбувається тільки тоді, коли організм сприймає залежність між своїми реакціями і підкріпленням. На першій стадії згаданого вище дослідження відповідна залежність мала місце між натисканням вимикача і закінченням роздратування струмом; сприйняття цієї залежності рівнозначно з'ясуванню того, що, коли вимикач натиснутий, ймовірність закінчення роздратування більше, ніж коли він не натиснуто. Собаки, які не сприймають цієї залежності на першій стадії експерименту, не шукають ніяких залежностей і на другій стадії. У світлі фактора залежності ясно, що ці результати вивчення оперантного обумовлення сходяться з даними про роль передбачуваності в класичному обусловливании: знання, що УС пророкує БУС, можна інтерпретувати як вираження того, що організм виявив залежність між цими двома стимулами. Таким чином, і в класичному, і в оперантном обусловливании організм засвоює саме залежність між двома подіями. У класичному обусловливании поведінка визначається конкретними стимулами; в оперантном обусловливании поведінка визначається конкретними очікуваними реакціями.

  Наша здатність впізнавати залежності розвивається дуже рано, як показує наступне дослідження 3-місячних немовлят. Всі немовлята в експерименті лежали у своїх ліжечках, голови на подушках. Під кожною подушкою був вимикач, який замикався кожен раз, коли немовля повертав голову. Для досліджуваних контрольної групи кожен раз, коли вони повертали голову і замикали вимикач, на протилежній стороні ліжечка включалася рухома іграшка. Для цих немовлят мала місце залежність між поворотом голови і рухом іграшки: з поворотом голови рух іграшки було більш імовірним, ніж без нього. Ці немовлята швидко навчилися повертати голову і реагували на рух іграшки знаками радості (вони посміхалися і лопотіли). Зовсім інша картина була у випробовуваних експериментальної групи. Для цих немовлят іграшка приводилася в рух приблизно так само часто, як і у контрольних випробовуваних, але рухалася вона чи ні - було поза їх контролю: тут була відсутня залежність між поворотами голови і рухом іграшки. Ці немовлята не навчилися рухати головою більш часто. Крім того, через якийсь час вони вже не демонстрували ознак задоволення від руху іграшки. За відсутності контролю над нею іграшка, мабуть, втратила частину своєї підкріплювальної функції. 
« Попередня Наступна »
= Перейти до змісту підручника =
 Інформація, релевантна "Оперантное обумовлення"
  1.  Б. Скіннер: ПСИХОЛОГ АБО ПЕДАГОГ?
      Моя розповідь про корифеїв психології буде неповним, якщо я нічого не скажу і Б. Ф. Скіннера, одному з творців нового напрямку в психології - біхевіоризмі, що отримав велике поширення. Вся освітня система в США побудована на ідеях біхевіоризму. Широко використовуються ці прийоми при лікуванні психічних хворих (поведінкова терапія). Біхевіористи розробили дуже багато
  2.  Научіння і обумовлення
      Навченням [Научение (learning) слід відрізняти від навчання (teaching) і освіти (education), як це буде ясно з подальшого викладу. - Прим. ред.] наповнене наше життя. З ним пов'язано не тільки освоєння нового навику або навчального предмета, але також і емоційний розвиток, соціальну взаємодію і навіть розвиток особистості. Ми вчимося різному: чого боятися, що любити, як бути ввічливим,
  3.  Біологічні обмеження
      Як і у випадку класичного обумовлення, біологія накладає обмеження на те, що можна вивчити шляхом оперантного обумовлення. Ці обмеження стосуються співвідношень між реакцією і підкріпленням. Для ілюстрації розглянемо голубів у двох експериментальних ситуаціях: научение з винагородою, коли тварина набуває реакцію, що підкріплюється їжею, і научіння з припиненням, коли
  4.  Комплексне научение
      Згідно когнітивному підходу, основне питання навчення - і інтелекту взагалі - лежить у здатності організму до уявного поданням різних аспектів світу і оперування цими уявними репрезентаціями, а не самим світом. У багатьох випадках уявні репрезентації складаються з асоціацій між стимулами чи подіями; ці випадки відповідають класичному і оперантного обумовлення. У
  5.  Нейронний базис навчення
      Біологія нейронів і їх сполук, роль яких була продемонстрована при аналізі відчуттів і сприйняття, відіграє важливу роль також у дослідженнях процесів навчання, особливо - класичного обумовлення і таких простих форм навчання, як звикання. Далі ми коротко розглянемо деякі ключові ідеї, що лежать в основі цієї активно розвивається області досліджень. Структурні
  6.  Соціальне научіння і обумовлення
      Оперантное обумовлення. На поведінку індивіда значно впливають інші люди - одержувані від них винагороди і покарання. Відповідно, один з найважливіших принципів теорії соціального навчання - це оперантное обумовлення і пов'язані з ним процеси, які ми обговорювали в главі 7. Люди поводяться так, щоб з найбільшою ймовірністю отримати підкріплення, а індивідуальні відмінності в
  7.  Бихевиористский портрет людської поведінки
      Подібно психоаналітичному підходу, бихевиористский підхід до особистості сповнений детермінізму. Однак, на відміну від психоаналітичного підходу, в ньому приділяється дуже мало уваги біологічним детерминантам поведінки; він зосереджений виключно на детерминантах оточення. На нього також сильно вплинули ідеї Дарвіна. Так само як еволюція шляхом природного відбору формує у видів адаптацію до
  8.  Управління стресом
      До цих пір ми в основному говорили про внутрішньоособистісних факторах, що впливають на сприйняття і про вплив на нього стресових подій. Емоційна підтримка та участь інших людей також допомагають перенести стрес. Розлучення, смерть коханої людини або тяжка хвороба зазвичай більш спустошливі, коли доводиться переносити їх поодинці. При обстеженні ізраїльських батьків, які втратили свого сина
  9.  Розлади тривожності
      Більшість з нас, зустрічаючись зі стресовими або загрозливими подіями, відчувають тривогу і напруженість. Такі почуття - нормальна реакція на стрес. Аномальної тривожність вважається тільки тоді, коли виникає в ситуаціях, з якими більшість людей справляється без праці. Розлад тривожності - це група розладів психіки, при яких тривожність або є основним симптомом
  10.  Фобії
      Про фобії говорять тоді, коли людина реагує сильним страхом на стимули, які більшість людей не вважають особливо небезпечними. Така людина зазвичай усвідомлює ірраціональність свого страху, але все одно відчуває занепокоєння (від сильної тривоги до паніки), пом'якшити яке можна тільки уникненням небезпечного об'єкта або ситуації. У багатьох людей є один-два ірраціональних страху,
© medbib.in.ua - Медична Бібліотека