複数のランク付けリストからの総合ランク


13

このフォーラムを含め、オンラインで入手可能な多くの文献を調べましたが、幸運なしに、現在直面している統計上の問題を誰かが助けてくれることを望んでいます。

ランク付けされたデータの5つのリストがあり、各リストには、位置1(最高)から位置10(最悪)までの10個のアイテムが含まれています。コンテキストのために、各リストの10個の項目は同じですが、ランクを決定するために使用される手法が異なるため、ランクの順序が異なります。

サンプルデータ:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

上記のデータを解釈および分析して、各テストとその位置に基づいて各アイテムの全体的なランクを示す最終結果を取得する方法を探しています。

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

これまで、ピアソンの相関、スピアマンの相関、ケンドールタウのB、およびフリードマンテストの実行からこの情報を解釈しようとしました。しかし、これらの結果は通常、リストとペアになっている(つまり、リスト1とリスト2を比較し、リスト1とリスト3を比較するなど)か、カイ2乗、P値などの結果を生成していることがわかりましたデータ。

統計的に健全な方法で(大学院/博士号適用レベルで)このデータをどのように解釈できるかを誰もが知っているので、5つのテストでリストの各項目の重要性を示す全体的なランクを理解できますか?または、別の種類の手法または統計テストがある場合は、ヒントやガイダンスをいただければ幸いです。

(注目に値するかもしれませんが、合計、平均、最小-最大テストなどの単純な数学的手法も実行しましたが、これらはこのレベルで統計的に十分に重要だとは感じていません)。

どんな助けやアドバイスも大歓迎です、あなたの時間をありがとう。


1
stats.stackexchange.com/search?q=valuation+rankという2つの質問がありますが、それらは適切に解釈され、重複しているように見えます(したがって、すでに回答が提供されています)。これらは適切ですか?そうでない場合は、あなたの状況について特別なことを理解してください。
whuber

お返事をありがとうございます。私はこれらの記事を見てきましたが、私が探しているものではないのか、それとも間違った理解なのかはわかりません。これらの記事では、各データセットにはさまざまな意味の多くの変数があり、ランクは異なる場合があり、ランクよりも詳細な整数値を持つ場合があるという印象を受けます。統計的に証明された方法で、「最も重要なアイテムは全体でアイテムX、次にY ...、最後に(または最も重要度の低い)アイテムZ」と言うことができる方法を探しています。私はほとんどこれらは1-10のように、プレーン番号ランク分析検討している
リアム・

1
これらのスレッドの1つの主要なポイントは、そのような「統計的に証明された方法」が存在しないことです。それは評価の問題です。結果の統計的な組み合わせは、結果間のトレードオフの感覚を反映しています。たとえば、「オブジェクト」は車であり、「技術」はさまざまな属性(コスト、燃費、パワー、快適さなど)に従ってランク付けされる場合があります。あなたの両方が正しいでしょう。
whuber

答えを得ましたか?ここにコメントを残してくださいstats.stackexchange.com/questions/347336/...
レイ・コーダ

回答:


7

なぜ相関関係や類似の測定値を見ているのか分かりません。相関するものはないようです。

代わりに、いくつかのオプションがありますが、どれも本当に他のオプションより優れているわけではありませんが、あなたが望むものに依存しています

平均ランクを取得してから、平均をランク付けします(ただし、これはデータを間隔として扱います)

中央値ランクを取得し、中央値をランク付けします(ただし、これは同点になる可能性があります)

各アイテムが獲得した1位の投票数を取得し、これに基づいてランク付けします

最終順位の投票数を取得し、それに基づいて(明らかに、逆に)ランク付けします。

妥当と思われるものに応じて、ランクの重み付き組み合わせを作成します。


4
私がコメントで参照したスレッドでの重要なポイント-そしてこれが問題全体の核心だと思う-これらのメソッドはすべて任意であるということです。客観的な方法は存在しますが、データに固有ではない情報を使用する必要があります。これが、統計ではなく評価の問題となっています。
whuber

ランクのどの加重組み合わせを提案しますか?
アーチー

4

他の人が指摘したように、あなたが追求するかもしれない多くのオプションがあります。私が推奨する方法は、平均ランク、つまりPeterの最初の提案に基づいています。

この場合、最終ランキングの統計的重要性は、2段階の統計検定で調べることができます。これは、フリードマン検定と対応する事後検定であるNemenyi検定で構成されるノンパラメトリック手順です。両方とも平均ランクに基づいています。フリードマン試験の目的は、帰無仮説を棄却し、そこにあると結論することであるアイテムの間にいくつかの違いが。その場合は、Nemenyiテストを続行して、実際にどのアイテムが異なるかを調べます。(偶然に発見された重要性を避けるために、事後テストから直接開始するわけではありません。)

これらの両方のテストの重要な値などの詳細は、Demsarの論文に記載されています


2

Tau-xを使用します(「x」は「eXtended」Tau-bを指します)。Tau-xは、Kemeny-Snell距離メトリックに相当する相関です。距離メトリックのすべての要件を満たすランク付けされたアイテムのリスト間の一意の距離メトリックであることが証明されています。KemenyとSnellによる「社会科学の数学モデル」の第2章、「コンセンサスランキング問題への適用を伴う新しいランク相関係数」、Edward Emond、David Mason、Journal of Multi-Criteria Decision Analysis、11:17- 28(2002)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.