オペラント条件づけ
オペラント条件付けは学習の一形態である。その中で、個人は行動の結果(結果)のためにその行動を変える。
人や動物は、その行動には結果があることを学びます。その結果は
- 強化:ポジティブな出来事や報酬を与える出来事。これにより、その行動がより頻繁に起こるようになる。
- 罰:ネガティブな出来事や罰を与えること。これにより、その行動の発生頻度が低くなる。
- 絶滅:イベントが続かないので、その行動は結果を伴わない。行動が結果を伴わない場合、その行動の発生頻度は低くなります。
オペラント条件付けには、4つの異なる文脈があります。ここでは、「ポジティブ」と「ネガティブ」という言葉は基本的な意味では使われていません。ポジティブは何かが追加されることを意味し、ネガティブは何かが取り除かれることを意味します。
- 正の補強(多くの場合、単に「補強」)は、ある行動の形に対して報酬がある場合に発生します。これにより、その行動が発生する頻度が高まります。スキナーボックスの実験では、ラットがレバーを押すと、報酬は食べ物の形である。
- 負の補強(時に「逃避」)は、回避的な刺激が取り除かれたときに起こります。これにより、その行動が発生する頻度が高くなります。スキナーボックスの実験では、大きな音がしていましたが、ラットがレバーを押すとそれが取り除かれました。
- 正罰は、刺激が追加されることで、その結果、その行動の発生頻度が減ることを意味します。刺激の例としては、大きな音、電気ショック(ネズミ)、スパンキング(子供)などがあります。
- 負の罰は、刺激が取り除かれたときに発生し、その結果、その行動の発生頻度が減ることを意味します。例としては、子供が望ましくない行動をした後に子供のおもちゃを取り上げることが考えられます。
オペラント条件付けの考え方は、エドワード・ソーンダイクによって最初に発見され、B.F.スキナーによって分析されました。
オペラント条件付けは、パブロフの古典的条件付けとは異なる。オペラント条件付けは、行動の自発的な変更を扱っています。
ソーンダイクの効果の法則
オペラント条件付けは、機器学習と呼ばれることもありますが、最初に研究されたのはエドワード・L・ソーンダイク(1874-1949)です。彼は、自家製のパズルボックスから逃げようとする猫の行動を観察しました。最初に箱に入れられたとき、猫は脱出するのに長い時間がかかりました。経験によって、成功した反応はより頻繁に発生し、猫はより短い時間で脱出することができます。ソーンダイクは効果の法則の中で、満足のいく結果に続く行動は繰り返される傾向があり、不快な結果をもたらす行動は繰り返される可能性が低いと理論化しました。要するに、いくつかの結果は行動を強化し、いくつかの結果は行動を弱めた。ソーンダイクはこの手順によって最初に知られている学習曲線を作り出した。
B.F.スキナー(1904-1990)は、オペラント条件付けのより詳細な分析に取り組みました。スキナーはオペラント条件付けチャンバーを発明しました。彼は、レバーを押すか、キーを押すかの記録を使用しました。
オペラント条件付けの原理。
- 差別、一般化、文脈の重要性。
- 学習は文脈の中で行われます。
- ほとんどの行動は刺激制御下にあります:特定の反応は、適切な刺激が存在する場合にのみ発生します。
- 刺激コントロールは、回答者にとって意味のない刺激であっても効果があります。
- 消滅:強化が止まるとオペラント行動は消滅します。
- 強化は、適切な反応があったときにのみ発生し、そのときにも発生しないことがあります。そのために行動が弱くなったり消滅したりすることはありません。
- 結果は、補強を受ける頻度にも依存します。
- 補強のスケジュール:補強のタイミングが重要です。
- 固定間隔のスケジュール: 適切な応答がなされることを条件に、一定の時間帯に強化物質が提示されます。
- 可変間隔スケジュール:最後の強化から期限切れになった平均時間に基づいて行動が強化される。比率のスケジュール:強化に対する応答の比率に基づいています。
- 固定間隔スケジュール: 特定の数の応答が行われた後に補強が提供されます。各応答の後に補強を提示する特殊なケースは、継続的な補強と呼ばれます。
- 可変間隔スケジュール:特定の平均的な回答数に基づいて配信強化を行います。
質問と回答
Q:オペラント条件付けとは何ですか?
A:オペラント条件付けとは、個人が行動の結果(結果)によって行動を変化させる学習の一形態です。
Q: オペラント条件付けの4つの文脈とは何ですか?
A:オペラント条件付けの4つの文脈は、正の強化、負の強化、正の罰、負の罰です。
Q:正の強化はどのように作用するのですか?
A:正の強化は、ある行動に対して報酬が与えられることで、その行動が起こる頻度が高くなることです。
Q: 負の強化はどのように作用するのですか?
A: 負強化は、嫌な刺激が取り除かれたときに起こり、その行動が起こる頻度を高めます。
Q: 陽性の罰はどのように作用するのですか?
A:正の罰は、刺激を加えることで、行動の発生頻度が低くなることを指します。
Q: 負の罰はどのように機能するのですか?A: 負の罰は、刺激が取り除かれることによって、その行動の頻度が減ることです。
Q: オペラント条件付けを最初に発見したのは誰ですか?
A:エドワード・ソーンダイクがオペラント条件付けを最初に発見し、その後B.F.スキナーによって分析されました。