学習理論の基礎、オペラント条件付けの紹介
目次
オペラント条件付け
古典的条件付けにみられた条件反応に対して、オペラント条件付けは道具的条件付けとも呼ばれ、環境に対しての自発的な行動をとる仕組みを説明する理論です。バラス・スキナーのスキナー箱に代表される考えで、エドワード・ソーンダイクの試行錯誤学習が基になっています。
オペラント条件付けは、自発的な行動とその前後の出来事による関係性から現象を説明しているのですが、行動そのものを何かの結果を得るために利用した「道具」と考えることから道具的条件付けと呼ばれます。行動主義や行動分析の基礎となっています。
オペラント行動とは
環境に対して自発的な行動をとることです。また、行動を起こしたことにより起こった結果(刺激)に応じて、その自発的行動の頻度が変化する学習の仕組みがオペラント条件付けです。
スキナー箱
オペラント条件付けを代表するスキナー箱の紹介
1.レバーを押すとエサが出てくる仕掛けをしたケージにネズミを入れます
2.ネズミは、たまたまレバーを押したときにエサが手に入った経験をする
3.同じ経験を繰り返すうちに、意図的にレバーを押すことを覚えました
②のたまたま起きたレバーを押すという行動がオペラント行動です。③のエサを得たとう結果がこの行動を強化してオペラント行動が増えました。
この一連の行動を理論的に説明しているのが次の三項随伴性(ABC分析)の図です。
三項随伴性
※図の中の矢印にどんな認知があろうが取り扱いません。行動だけを観察し行動だけに働きかけるのが学習理論(行動療法)です。
スキナー箱を例にすると、Aの先行刺激がレバーを目にしたこと、Bの行動がたまたまレバーを押したこと、Cの結果がエサが出てきたことです。エサが出てきたのでBの行動が増えました。Cの結果によってBの行動頻度が変化することを随伴性といいます。
「三項随伴性は学習理論の中心概念であり、基本的にすべての行動を三項随伴性で説明しています。」
A:先行刺激(分別刺激)
⇒行動よりも先か、同伴して提示されることでBの行動が自発されるきっかけとなる刺激
※行動の出現に何の変化も起こさない刺激を「中性刺激」と言います。
C:強化子(結果/強化刺激)
⇒自発的な行動をしたことで起きた結果によって、行動の出現頻度を変化させる刺激
強化子は、正の強化子と負の強化子に分けられます
・正の強化子:与えることで行動の頻度が増加する結果
・負の強化子:取り除くことで行動の頻度が増加する結果
強化と罰:4つの行動随伴
人間の行動は4つのパターンに分類されます。
- 正の強化:与えられた(+)ことで行動が増える↑
- 正の罰(弱化):与えられた(+)ことで行動が減る↓
- 負の強化:取り除かれた(-)ことで行動が増える↑
- 負の罰(弱化):取り除かれた(-)ことで行動が減る↓
4つの行動パターン(行動随伴性)の例
①正の強化
望ましい結果を得たことで行動が増えたパターン
A:晴れた休日
B:テニスに出かけた
C:気持ちがいい
●Cで気持ちのよさを得られた(+)のでBの行動が増加↑
②正の罰(正の弱化)
嫌な結果を得たことで行動が減ったパターン
A:犬を見た
B:触る
C:噛まれた(痛みを与えられる)
●Cで痛みを与えられ(+)たことでBの行動が減少↓
③負の強化
不快なことが取り除かれたことで行動が増えるパターン
A:外から帰宅
B:手を洗う
C:不安が減った
●Cで不安を取り除いた(-)ことでBの行動が増加↑
④負の罰(負の弱化)
楽しみを奪われたことで行動が減ったパターン
A:クレヨンがある
B:壁にらくがき
C:おやつ抜き
●Cでおやつを奪われ(-)たことでBの行動が減少↓
オペラント条件付けの「汎化」
先行刺激(A)が別の似たような刺激に対しても起こること。
例:警察を見て速度を落とす、警備員でも速度を落とす
オペラント条件付けの「分別」
似たような2つ以上の先行刺激(A)に対してそれぞれ異なる反応をする。同時分別と継時分別がある。
例:信号を見て赤なら止まる、青なら進む
オペラント条件付けの「消去」
オペラント条件付けによって獲得した行動を消去するには、強化刺激になっている行動に伴う結果が出現しないようにする(強化子を与えない)。古典的条件付けと同じで消去は再学習したことによる新しい行動の獲得。
例:レバーを押してもエサが出てこない
さまざまな学習
試行錯誤学習
偶然の行動を繰り返すことによって必要な行動だけが強化され残ること
例:「ネコの問題箱」ソーンダイクの実験
- 1.紐を引くと扉が開きエサが取れる箱にネコを入れる
- 2.ネコは見えているエサを取ろうとするが取れない(誤反応)
- 3.偶然に紐を引いて扉が開きエサを得る(正反応)
ネコはさまざまな行動を繰り返すことで、誤反応(取り得る行動)が少なくなり正反応(望む行動)に達する時間が短くなります。この過程が試行錯誤学習です。
洞察学習
試行錯誤学習に対して、洞察学習は目的を達成するために考えて行動をすること。試行錯誤した偶然の反応ではなく、状況を判断し目的の行動をとる。ケーラー(kohler)のチンパンジーの実験で導かれた。
例:高い場所にあるエサを見て、木箱を重ね踏み台をつくる
潜在学習
報酬(強化)が無くても知らず知らずのうちに起こる学習。
例:ブロジェット(Blodgett/1929)の実験
- 1.ネズミをグループ分けし一日一回迷路に入れる
- 2.1群はゴールにエサを用意、2群には何もなし
- 3.これを繰り返す
7日たったころ1群はゴールまで道を誤ることなく進むようになった、2群は初日と変わらずでたらめに迷路を進んでいた。しかし、7日目に2群のゴールに餌を用意したところ1群が7日かけて覚えた道を2日で誤りなく進むようになった。報酬を得たことで急激に変化がみられた2群は、強化子(エサ)が無い状態でも潜在的に学習が進んでいたことが分かった。
※実際は4群に分けて実験している
迷信行動
行動(B)と結果(C)の間に因果関係は存在していないが、偶然おこった強化によって条件づけが成立し維持される行動。
例:「ハトの迷信行動」スキナーの実験
- 1.スキナー箱に空腹のハトを入れる
- 2.ハトの行動とは無関係に15秒間隔で5秒間エサを与える
- 3.すると、エサのない15秒間に決まった行動をするようになった
この実験では8羽のハトで実験し、6羽のハトに「ぐるぐる回る」「頭を上げる」など独自の動作がみられました。ハトは自らの行動によってエサが与えられたのだと勘違いし、その行動が強化され維持された例です。
逃避と回避の学習
- 逃避:不快な経験をしている状況から逃れる行動
- 回避:不快な経験をした状況を事前に避ける行動
学習性無力感
嫌悪刺激に対して、逃避することも回避することもできない状況に置かれること、なんの行動も起こさなくなる。これは、嫌悪刺激を受け入れてしまった状態。あきらめの心理。
罰の効果
強化されたオペラント行動に対して罰を与えたらどうなるのか?
スキナーは、動物の強化されたオペラント行動に対して電撃や殴打の罰を与えて実験をしていますが、結果、オペラント行動の抑止は一時的でした。罰を与え続けても、罰を受けていない群とオペラント行動の頻度にほとんど差がなかったのです。
このことから、強化された行動は強化子がある限り苦痛を伴ってでも実行され、人間に置き換えて考えても行動を抑制するための体罰はほぼ効果が無いと言えます。
オペラント条件付けを応用した治療技法
主にオペラント条件付けを利用した治療法を応用行動分析といい、現在では学校などの公共機関で利用されることが多い行動療法です。
シェイピング法(行動形成)
ある行動目標を達成するために、小さなステップに分けて目標の行動を獲得するプログラム
●シェイピング法の詳細はこちら⇒シェイピング法
トークンエコノミー法
特定の行動を強化する方法。強化したい行動が起きた時に「ごほうび」(強化子)を与えるプログラム。
●トークンエコノミー法の詳細はこちら⇒トークンエコノミー法
強化スケジュール
どのようなタイミングで強化子を与えると効率的な強化ができるのかといった強化プログラムの分類
●強化スケジュールの詳細はこちら⇒強化スケジュール
まとめ
オペラント条件付けは、よくペットのしつけや子供の教育に引用される理論です。良いことをすれば「褒める」「ご褒美をあげる」といった具合に、理論を知らなくてもオペラント条件付けを利用した行動の強化を私たちは日常的におこなっています。
今回は、オペラント条件付けの概要と三項随伴性に、いくつかの学習法を紹介させていただきました。ここで一番に強調したいのは「三項随伴性」です。
三項随伴性は、学習理論(行動療法)の中心概念です。学習理論=三項随伴性といっても過言ではないところですのでAとBとCの関係はいつでも説明できるくらい理解を深めておくといいですよ。
オペラント条件付けの次は「行動療法」を解説していきたいと思います。
▼ 次の記事へ ▼