負の強化:オブジェクトを置き換える方法?


18

私のボースシェパードは生後9ヶ月になりました。私たちはいくつかの行動教育のクラスをパーソナルトレーナーで受講し、すべてが順調に進みました。犬が望んでいるようになる前に、今、彼は本当に良い音を聞いています!

トレーナーの提案に対して、いくつかの行動は積極的に強化され、いくつかは否定的に強化されました。私たちが現在抱えている問題は、私たちが否定的に強化した行動にあります。私たちは音を出すために金属製の箱を使用していますが、犬はそれを嫌って従います。2番目の制裁として「no」の後に常に使用されます。すべてが完璧に機能し、ボックスが正しく動作するため、ボックスを使用する必要がなくなりました。

問題は、私たちが箱を持っていない場合は音が出ないため、彼が望まない動作に従事することを学んだので、箱を別のものに交換する必要があると思うことです。箱をどこにでも持ち運ぶ必要があるので、問題になり始めています。もし持っていなければ、機会を使うからです。

箱を私たちの体か何かに置き換えることでこれを修正する方法はありますか?

注:彼は1か月前に亡くなっており、私たちを少し勇気づけていますが、便利な箱がない場合でもそれを行います。

ありがとうございました


1
おそらくトレーナーにこの質問をする必要がありますが、マイナスの強化(金属ボックス)が彼の望ましくない行動を抑制するのに働いたら、今は良い行動を強化し始めてはいけませんか?例として、私の犬がソファの上に上がり続けた場合、私は(1)金属製の箱を振ってそれを落胆させ、そして彼がソファに行くことは望ましくないと知ったら、私は(2)彼がいつでも寛大に賞賛し、治療するソファなどの近くの床に置いてください。
スティーブD

1
:)いくつかの観察の後、犬がどうやってそれらのことを学ぶことができるかが大好きです... :) :) :)
woliveirajr

回答:


10

オペラント条件付けについて議論するときはいつも、同じ言語を話すのに役立ちます:

  • 強化:行動の頻度を増やすように設計されたアクション
  • 罰:行動の頻度を減らすように設計されたアクション
  • ポジティブ:刺激の存在
  • ネガティブ:刺激の欠如

これらの用語は、4つの異なる組み合わせを形成できます(注意:括弧内の例は、アドバイスではなく例です!):

  • 積極的な強化:行動の頻度を増やすための刺激を提示します(例:犬が命令に従って座ったときにおやつを与える)
  • 負の強化:行動の頻度を増やすために刺激を削除します(例:郵便配達員は犬がbarえた後に消えます)
  • 積極的な罰:行動の頻度を減らすための刺激を提示します(たとえば、犬がカーペットの上で排尿されたときに犬にぶつかる)
  • 負の罰:刺激を削除して行動の頻度を減らします(たとえば、犬があなたに飛びついたときに部屋を出る)

実際には、これらは混乱する可能性があります。たとえば、ボックスで音を立てるのは、行動の頻度を減らすように設計された刺激であるため、技術的には正の罰の例ですが、犬が正しい行動を実行した後に音を止めると、刺激も削除されます正しい振る舞いの頻度を増やしてください、否定的な補強です。

しかし、それはあなたの犬が実行するための正しい行動があることを前提としています。望ましくない動作が何であるか、または強化しようとしている望ましい代替動作があるかどうかを指定しません。あなたが騒音でやることが彼が何かをするのを止めようとしているなら、あなたは否定的な補強ではなく罰を提供しています。

どちらの場合でも、あなたの問題の一部はおそらくあなたが一次強化者と罰者、すなわち犬が学ぶ必要のないものだけを使用していることです。たとえば、食物は主要な強化剤です。犬は食べ物を学ぶ必要なしに良いことだと知っています。犬が聞くのは不快なので、ひいては騒音が主な罰者です。対照的に、二次強化者と罰者は、犬が学んだものです。

古典的な例は、パブロフの鐘で、犬に餌を与えるたびに鳴ります。一次強化剤と刺激を一貫して組み合わせることにより、刺激は二次強化剤として機能し始めることができます。つまり、犬はベルが食物の到着を知らせ、それに応じて反応することを学習します。

あなたは、雑音とともにあなたの犬を告げるとき、あなたが「いいえ」という言葉を使用することを言います(うまくいけば厳しい声で、犬は識別力のある抑揚に熟達しています)。「いいえ」は二次的な罰者として振る舞うべきです。同じように、賞賛は二次的な強化者として働くことができます。しかし、実際にノイズを段階的に削除できなかったのは、「いいえ」とだけ言うこともあり、ノイズを出さないこともあるからです。

問題は、今のところ、あなたの犬は、ボックスなしの「いいえ」が主要な罰者を意味しないという事実を拾い上げていることです。

落胆させたい実際の行動を説明する新しい質問を開くことをお勧めします。オペラント状態のスペクトル全体を使用して、あなたの犬にあなたが望むものを学ぶようにする方法を見つけるのを助けることができるかもしれませんする。


5

@ThomasHは優れた答えであり、非常に正確な方法で二次罰者を使用するという問題に触れます。

ここでは、問題の2つの側面に関するコメントを追加します。

間違った行動を罰するvs正しい行動を強化する

「理論」が「強化者側」と「罰者側」で同じように作用し、効果が同じくらい効果的である場合でも、行動を抑制することは犬に代わりに何をすべきかを教えておらず、主に焦点を当てていることを忘れてはならないトレーニングの「いいえ」の部分はミクロ管理につながります。犬にすべきでないことを常に教える必要があります。犬が特定の状況でXを行うべきではないことを知ったとしても、Y、Zなどを実行することは自由です。代わりにWを行うことを積極的に教える(彼を強化する)場合、何らかの悪循環を止め、みんなを幸せにします。

変動金利の強化/罰

@ThomasHは、二次的な強化または罰の概念を説明しました。

覚えておくべき1つの側面は、一次強化者/罰とは異なり、二次的なものは可変スケジュールを使用して(何らかの方法で)報酬を与える必要があるということです

食物は主要な強化剤です。犬は食べ物を食べるたびに強化されます。

しかし、「はい」やクリックなどのキーワードは、二次的な強化子になる可能性があります。それは、後続の一次強化子にリンクされています。重要な点は、犬が一次強化者によって二次強化者に報酬が与えられることを知ったために機能することです。これを学んだら、実際の報酬でリンクを維持する必要があります。開始時(トレーニング中)に毎回報酬が提供され、その後、さまざまなスケジュールで報酬を受け取ることができます。可変スケジュールは実際にリンクを強化しているため、犬は主な報酬がいつ届くかを予測できません。

これは通常、三次強化子に適用されることに注意してください。キュー「座る」は実際に強化子であり、実際の報酬につながる別の強化子(たとえばクリック)につながる可能性があるためです。

通常、二次強化因子(クリック)を一次強化因子(食物報酬など)から分離することはありません。これにより、2つの間のリンクが非常に強力になり、キュー(3次強化子)とクリックの間に可変レートが適用されます。

ただし、罰の場合、実際の「三次罰」はないため、「強化」の変動率(この場合は罰として理解されます)は、二次罰(「いいえ」)と実際の罰(ボックス)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.