オペラント条件づけとは?日常例は?応用行動分析や行動療法について解説

スキナーは、レバーを押すと餌が出る箱の中にラットを入れました。すると、ラットは、次第にレバーを押せば餌が出るということを学習し、自発的にレバーを押すようになります。
この実験に代表されるような理論を、オペラント条件づけと呼びます。
こちらの記事では、
- オペラント条件づけとは?
- オペラント条件付けの日常例
- ソーンダイクとスキナーの実験
- オペラント条件づけがベースの行動療法
気になるところから読む
オペラント条件づけとは?
オペラント条件づけとは、自発的な行動のあとに報酬(罰)を与えることによって、その直前の行動をする頻度が高くなる(低くなる)現象のことをさします。
たとえば、レバーを押すとエサが出てくることを学習したラットは、その後頻繁にレバーを押すようになります。
オペラント条件づけの日常例
オペラント行動は、日常生活の中で毎日おこっています。
- のどが乾くと水を飲む
- 朝8時に学校に行く
- ジュースを飲むために自動販売機のボタンを押す
- 携帯電話が故障すると、電話会社に連絡する
これらは全て、オペラント条件づけによって学習されたものだと言えます。
ソーンダイク(Thorndike, E. )の効果の法則
1898年、アメリカの実験・教育心理学者であるソーンダイク(Thorndike, E. )により初めてオペラント条件づけの実験が行われました。
問題箱を使った実験
ソーンダイクの実験では、『問題箱』という装置が用いられました。
問題箱には、「猫が箱の中のひもを引くと、外に出てエサの魚を食べることができる」という仕掛けをしています。
箱の外にエサを置いた状態で、空腹の猫を問題箱に入れることを繰り返すと、最初は外に出るまでに時間がかかりますが、だんだんと「ひもを引けば外に出て、エサを食べることができる」ことを学習し、すぐに外に出るようになります。
これを、試行錯誤学習と呼びました。
効果の法則とは?
ソーンダイクは、試行錯誤によって学習する仕組みを『練習の法則』と『効果の法則』という言葉を用いて説明しました。
練習の法則とは、「ある状況で同じ反応が何度も行われると、その反応は同じ状況に再び遭遇したときに行われやすくなる」という法則のことです。
また、効果の法則とは、「問題を解決するために効果のある反応を行うと、その反応を引き出した刺激とその反応との結合が強められる」という法則のことです。
ソーンダイクは、満足をもたらすような行動は、状況との結合が強められ、不快をもたらすような行動は、状況との結合が弱められると考えました(ただし、「不快をもたらすような行動は、状況との結合が弱められると言えない」ということで、ソーンダイクによりその箇所については除外されました)。
その後、ソーンダイクの「効果の法則」を引き継ぎ、強化の概念として確立したのはスキナー(Skinner, B. )でした。
スキナーの研究
スキナーは、新行動主義とよばれる立場を確立した人物として知られています。
スキナーは、箱の中に空腹のラットを入れて、反応と強化子(報酬:エサ)の関係について観察しました。箱の中には、レバーが1本あり、ラットがそれを押すと、エサが1つ出るようになっていました。
はじめて箱の中に入ったラットは、偶然レバーを押し、エサをゲットします。その偶然が何度か重なると、ラットは能動的にレバーを押すようになります。
3項随伴性
これを、3項随伴性と言い、この3つの条件がそろえばオペラント条件づけの学習が成立すると言われています。
例えば、「ブザー音が鳴ったとき、レバー押しをするとエサが出る」ということを学習させたいときは、
- 弁別刺激(先立つ刺激)→ブザー音
- オペラント反応→レバー押し
- 強化子→エサ
他にも、「おはよう」と朝に言ったら褒められるけど、夜に言うと褒められないとなると…
- 弁別刺激(先立つ刺激)→朝
- オペラント反応→「おはよう」
- 強化子→褒められる
という風になります。
『弁別刺激』ってちょっとややこしい概念ですが、こんな風に例を考えてみると簡単ですね。
強化と罰
自分にとって好ましいものは、報酬、逆に自分にとって嫌なものは、罰です。
心理学では、報酬と罰を、強化と罰という言葉で表現しています。正・負の強化、正・負の罰があります。
- 正の強化
- 負の強化
- 正の罰
- 負の罰
正と負…強化と罰…わけがわからぬ…
ねこモン
ここは紛らわしくて、勘違いも多いところだよ!
なぎさ
強化
強化は、正・負とも、望ましい行動の出現頻度を増加させます。
正の強化
正の強化とは、オペラント行動に強化子(報酬刺激)を与え、行動が出現する頻度を増やす方法です。
たとえば、お手伝いをしてもらったとき、お小遣いを与えて、さらによくお手伝いをするようになってもらうことを指します。
負の強化
負の強化とは、嫌な刺激を減らすことで、行動の出現頻度を増やす方法です。
たとえば、子供に叱っているとき(嫌な刺激)に、子供が反省した態度をとると、叱るのをやめる(嫌な刺激を減らす)ことで、反省した態度の出現頻度が増えることを指します。
罰
罰にも正と負があり、どちらも望ましくない行動の出現頻度を減少させます。
正の罰
正の罰とは、罰となる刺激を与えることで、行動の出現頻度を減らす方法です。
たとえば、子どもがいたずらをしたときに、叱るという罰を与えることで、いたずらをしなくなることを指します。
負の罰
負の罰とは、報酬となる刺激を減らすことで、行動の出現頻度を減らす方法です。
たとえば、子供がいたずらをしたときに、お小遣いを減らすことで、いたずらをしなくなることを指します。
定義 | 効果 | 例 | |
正の強化 | 望ましい行動の後、報酬を与える | 望ましい行動を増やす | お手伝いをしたらお小遣いをわたす |
負の強化 | 望ましい行動の後、嫌な刺激をなくす | 望ましい行動を増やす | 子供が反省したら叱るのをやめる |
正の罰 | 望ましくない行動の後、嫌な刺激を与える | 望ましくない行動を減らす | いたずらした子を叱る |
負の罰 | 望ましくない行動の後、報酬をなくす | 望ましくない行動を減らす | いたずらした子のお小遣いを減らす |
応用行動分析
応用行動分析は、オペラント条件づけを背景にして考案された技法です。応用行動分析では、『弁別刺激ーオペラント反応ー強化子』の3項随伴性を、ABC分析という3つの枠組みで捉えます。
- 先行条件(A:どういった状況で)
- 行動(B:どのような行動が起こり)
- 結果(C:どのような結果になったか)
知的障害や発達障害の支援
ABAは、知的障害や発達障害の支援の現場でも多く活用されています。
ABAの考え方を用いることで、適切な行動が起こりやすいように、環境を整える・周囲の人の対応を変えるなどの工夫ができます。
行動だけに目を向けず、環境や状況を操作可能と捉えることが重要なのです。
教育場面などでは、『(A)宿題が出される-(B)宿題をする-(C)褒められる』や『(A)月曜日は登校すると約束する-(B)登校をする-(C)シールをもらえる』という枠組みを基本とし、(C)に本人にとっての報酬を用意することで、学習を成立させようとします。
オペラント条件づけ(応用行動分析)をベースとした行動的技法
オペラント条件づけをベースとした行動的技法には、下のようなものがあります。
- シェイピング法
- トークンエコノミー法
- アサーション・トレーニング(自己主張訓練)
- ソーシャルスキル・トレーニング(社会的技能訓練)
シェイピング法
シェイピング法は、スキナーによって提唱された方法です。最終的に目指す行動をスモールステップで段階的に形成していく方法です。
まず、手がかりとなる刺激を呈示し、適応的な行動を定着させた後に、手がかりとなる刺激を除去します。
この手続きをとることで、刺激を呈示しなくても、適応的な行動がとれるようになります。
トークンエコノミー法
トークンと呼ばれる報酬を与え、適応的な行動を定着させます。たとえば、登校できた日にシールを与え、シールを10枚集めたら、子供が決めたご褒美を与える、というようにします。
アサーション・トレーニング(自己主張訓練)
アサーション・トレーニングとは、周囲に気遣いながらも自分の主張をするトレーニングです。実際に人前で自己主張する体験を通して、緊張や不安を感じても、自己主張は可能であることを学習してもらいます。
ソーシャルスキル・トレーニング(SST:社会的技能訓練)
ソーシャルスキル・トレーニングは、リバーマン(Liberman, L. )によって提唱された訓練で、社会的なスキルの獲得を目指す方法です。
心理的な安全性が保たれている集団の中で、不足しているスキルを実行し、他者から強化されることで、スキルを獲得していきます。
さいごに
古典的条件づけは、反射と深く関わっていましたが、オペラント条件づけは能動的な行動と深く関わっています。
応用行動分析をベースにした心理療法も多く活用されているので、合わせて活用していきたいですね。