Позитивне та негативне підкріплення в оперантному навчанні
Передумови
Навчання може проявлятися у безлічі форм, одним з notable методів є явище, відоме як оперантне навчання, також зване інструментальним навчанням. У цьому контексті підкріплення служить для зміцнення дії, асоціюючи її з наслідком, що, в свою чергу, трансформує цю дію в умовне підкріплювач.
Розгляньте ситуацію, в якій мета – змусити дитину прибрати свою кімнату. Практичний підхід може полягати в тому, щоб стимулювати цю поведінку, надаючи їй щотижневу грошову винагороду щоразу, коли вона виконує завдання. Постійна винагорода (грошова винагорода), пов’язана з дією (прибирати), допомагає дитині впровадити і усвідомити цю поведінку з часом.
Нaturа підкріплення, що застосовується, суттєво впливає на швидкість, з якою має формується поведінка, та загальну силу реакції.
Розуміння підкріплення
У сфері оперантного навчання “підкріплення” означає будь-який елемент, що підсилює ймовірність повторення конкретної реакції. Ця концепція була вперше введена психологом Б.Ф. Скіннером у 1937 році.
Наприклад, можна спостерігати підкріплення через негайну похвалу (підкріплювач) після того, як дитина прибрала свої іграшки (реакція). Асоціюючи бажану дію з усною похвалою, ймовірність того, що дитина повторить цю поведінку в майбутніх випадках, значно зростає.
Умовний підкріплювач може включати будь-який об’єкт, що підсилює або сприяє певній поведінці. У навчальних середовищах підкріплення може проявлятися у вигляді нагород, зменшення неприємних завдань або фізичних винагород, таких як солодощі, додатковий відпочинок або приємні активності.
Первинне та вторинне підкріплення
Первинне підкріплення
Первинне підкріплення, іноді відоме як безумовне підкріплення, відбувається природно. Такі підкріплювачі часто мають еволюційні основи, виконуючи важливі функції виживання для видів, що означає, що вони діють без необхідності попереднього навчання.
Звичайні приклади первинних підкріплювачів включають:
- Кисень
- Харчування
- Репродукція
- Відпочинок
- Гідратація
Генетичні фактори також можуть відігравати роль у первинному підкріпленні. Емпіричні дослідження свідчать, що індивіди можуть обирати своїх партнерів, частково на основі певних генетичних характеристик, які їм здаються привабливими.
Вторинне підкріплення
Вторинне підкріплення стосується стимулів, які здобувають статус винагороди через асоціацію з іншим підкріплюючим стимулом. Цю концепцію також обговорюють у сфері прикладного аналізу поведінки (АПП) як умовне підкріплення.
Наприклад, під час дресирування собак можуть використовувати людську похвалу та ласощі як первинні підкріплювачі. Звук клацалка може бути введено як вторинний підкріплювач. З часом простий звук клацання може стати умовним підкріплювачем сам по собі.
Позитивне та негативне підкріплення
У межах оперантного навчання є дві основні категорії підкріплення, які формують поведінку через різні механізми. Ці категорії:
- Позитивне підкріплення: Це передбачає введення стимулу для посилення реакції, таке як надання солодощів дитині після того, як вона прибрала свою кімнату.
- Негативне підкріплення: Навпаки, це стосується зняття стимулу для покращення реакції, таке як скасування контрольної роботи при умові, що студенти подадуть усі свої домашні завдання на тиждень. Убираючи ненависну контрольну, викладач прагне збільшити бажану поведінку виконання домашніх завдань.
Незважаючи на те, що ці терміни названо позитивними та негативними, важливо розуміти, що Скіннер не мав на увазі, що це означає “добре” або “погано”. Як і в математичній термінології, “позитивний” означає додавання чогось, тоді як “негативний” вказує на віднімання елемента з ситуації.
Приклади умовних підкріплювачів у реальному світі
Позитивне підкріплення
Розгляньте ситуацію під час тренування команди з софтболу, коли тренер вигукує: “Відмінний кидок!” після вашого кидка. Це заохочення, ймовірно, змусить вас повторити техніку кидка. Такий досвід є прикладом позитивного підкріплення.
Більш того, уявіть ситуацію на роботі, де перевищення цілей продажу вашого менеджера призводить до бонусу, включеного у ваш платіж. Грошова винагорода діє як потужний умовний підкріплювач, збільшуючи ймовірність того, що ви будете прагнути перевищити цілі продажу в наступні місяці.
Негативне підкріплення
Коли ви відвідуєте лікаря для щорічної вакцинації від грипу, ви обираєте укол в надії уникнути грипу. Тут дія отримання вакцинації служить для уникнення небажаного наслідку, ілюструючи негативне підкріплення.
Ще одним прикладом є нанесення гелю алое вера на сонячний опік для зменшення дискомфорту. Ця поведінка зменшує негативні відчуття (біль), тим самим демонструючи негативне підкріплення. Займаючись цією дією, ви зменшуєте неприємний досвід, підвищуючи ймовірність використання алое вера в подібних ситуаціях у майбутньому.
Підкріплення та сила реакції
Метод і час введення підкріплення можуть значно вплинути на загальну силу реакції. Існує кілька характеристик, які можна використовувати для оцінки сили реакції, такі як:
- Точність: Чи дало підкріплення бажаний ефект?
- Тривалість: Як довго зберігалася реакція?
- Частота: Яка була регулярність випадків реакції?
- Стійкість: Чи проявлялася реакція послідовно в кожному випадку?
Графіки підкріплення
Час, коли застосовується підкріплення, можна стратегічно змінювати. На початкових етапах навчання часто застосовується система безперервного підкріплення. Це передбачає підкріплення реакції щоразу, коли вона виконується, наприклад, винагорода цуценятка ласощами за те, що воно успішно помочилося на вулиці.
Після того як поведінка була засвоєна, можна впровадити частковий графік підкріплення. Основні типи часткового підкріплення включають:
- Фіксовані інтервальні графіки: Підкріплення поведінки після того, як пройшов визначений період часу.
- Фіксовані раціональні графіки: Підкріплення поведінки після того, як зафіксовано певну кількість реакцій.
- Змінні інтервальні графіки: Пропонування підкріплення після непередбачуваного періоду часу.
- Змінні раціональні графіки: Надання підкріплення після непередбачуваної кількості реакцій.
Слово від фахівців
Підкріплення виконує важливу функцію в парадигмі оперантного навчання. Коли воно використовується з розумом, це ефективний навчальний інструмент, який сприяє бажаним поведінкам і зменшує менше бажані.
Важливо усвідомлювати, що підкріплення може суттєво варіюватися від індивіда до індивіда. Наприклад, у класі одна дитина може вважати солодке підкріпленням, тоді як інша може бути байдужою. Крім того, якщо дитина отримує увагу батьків переважно коли погано себе поводить, така увага може ненавмисно підкріплювати небажану поведінку.
Глибше розуміння процесу підкріплення може прояснити способи, якими різні типи підкріплення впливають на навчання і поведінку.
