回答:
長期的にポジティブな強化で最良の結果を得るには、高額から中額、低額、報酬なしのさまざまな価値の報酬を提供する必要があります。最初は、振る舞い(または一般的にはポジティブな強化)が新しい場合に、高価値の報酬を使用します。次に、ランダムに高価値または低価値の報酬を提供するように切り替えて、確立された行動に対して徐々に価値なしまたは通常は価値の低い報酬に移行する必要があります。それはスロットマシンのようなもので、通常は何も返さないか、数枚のコインしか返されませんが、たまに巨大なジャックポットが手に入るので、退屈することはありません。
報酬スケールで「良い犬」があなたの犬に適しているとは言えません。私には、確実に最高の報酬の1つである犬と、報酬が来るかもしれないというマーカー(つまり、スロットホイールが回転するような)である犬がいました。しかし、重要なのは可変補強です。
Dog Scouts of Americaトレーニングページには、ポジティブトレーニングに関する多くの良い情報があります。