私は統計学に比較的慣れていないので、私の質問は完全に誤解されているかもしれません。私は自分のアルゴリズムを他のものと比較してテストしています。出力は同一ではありませんが、違いが「統計的に取るに足らない」ことを示したいと思います。私の主張をするために、これをどのように定量化できますか?
それは、扱うデータの種類とサンプルの大きさによって異なります。投稿を編集して、より詳細な回答を含めることができますか?
—
naught101 2012年
同等性テストは、非同等性を拒否するように粉末化されています。それはあなたに力を与えるのに十分な大きさのサンプルサイズを選ぶことを強います。小さなサンプルで帰無仮説と対立仮説を逆にしないと、差がないという帰無仮説を棄却する変更はほとんどありません。しかし、拒否しないことは、力がないために受け入れることと同じではありません。そのため、Blackwelderは非等値を帰無仮説とし、同値を示すにはnullを拒否する必要があります。
—
マイケルR.チェニック、
帰無仮説は、平均値の差が指定されたデルタ(等価のウィンドウ)よりも大きいということに注意してください。
—
マイケルR.チェニック、