特定のバイナリの結果を予測するための5つの異なる方法の有効性を評価しています(「成功」と「失敗」と呼びます)。データは次のようになります。
Method Sample_Size Success Percent_Success
1 28 4 0.14
2 19 4 0.21
3 24 7 0.29
4 21 13 0.61
5 22 9 0.40
これら5つの方法の中で相対的な優位性を評価するためのテストを行いたいと思います。つまり、メソッドをパフォーマンスの順にメソッド1>メソッド2> ...メソッド5の順に並べたいのです。複数の比較の問題を回避するために、次のように順列テストを実行する予定です。
ステップ1:すべてのデータをプールして、全体のサンプルサイズが114になり、全体で37の成功を収めます。
ステップ2:データをランダムに5つのグループに分割し、対応するサンプルサイズを28、19、24、21、22にします。
手順3:手順2で観察されたPercent_Successの順序がデータの順序と一致している場合は、カウンターを増分します。
手順4:手順2と3を何度も繰り返します(たとえば10000)。
望ましいp値=最終カウンター値/ 10000。
質問:
上記の手順は大丈夫ですか?
上記のテストを実行できるようにするRの要素はありますか?
改善や代替方法の提案があれば役に立ちます。