Kappa()統計は、2人の評価者間の一致を測定するために、コーエン[1]によって1960年に導入されました。しかし、その分散はかなり長い間矛盾の原因でした。
私の質問は、大きなサンプルでどの分散計算を使用するのが最適かについてです。私は、Fleiss [2]によってテストおよび検証されたものが正しい選択であると信じていますが、これが正しいと思われる唯一の公開されたものではないようです(かなり最近の文献で使用されています)。
現在、漸近の大きなサンプル分散を計算する2つの具体的な方法があります。
- Fleiss、Cohen、Everittが公開した修正済みメソッド[2]。
- Colgaton、2009 [4](106ページ)の本に記載されているデルタ方式。
この混乱の一部を説明するために、ここに強調鉱山のFleiss、CohenおよびEveritt [2]による引用があります。
多くの人間の努力は、最終的な成功が達成される前に繰り返される失敗に呪われています。エベレスト山のスケーリングはその一例です。北西航路の発見は2番目です。kappaの正しい標準誤差の導出は3番目です。
そのため、ここで何が起こったのかを簡単に要約します。
- 1960:Cohenは、論文「名目スケールの一致係数」[1]を発行し、と呼ばれる2人の評価者間の偶然修正された一致の尺度を紹介します。ただし、彼は分散計算の誤った式を公開しています。
- 1968年:エヴァーリットはそれらを修正しようとしますが、彼の式も間違っていました。
- 1969:Fleiss、CohenおよびEverittは、論文「KappaおよびWeighted Kappaの大きなサンプル標準誤差」[2]で正しい式を公開しています。
- 1971:Fleiss は、同じ名前で別の統計(ただし、別の統計)を公開しますが、分散の式は正しくありません。
- 1979:Fleiss NeeとLandisは、Fleissの修正された式を公開しています。
最初に、次の表記法を検討します。この表記は、ドットが置かれている次元のすべての要素に加算演算子が適用されることを意味します。
これで、カッパを次のように計算できます。
その中で
は観察された合意であり、
はチャンス合意です。
これまでのところ、Cohenのの正しい分散計算は次のようになります。
帰無仮説では、次のようになります。
Congaltonの方法は、分散を取得するためのデルタ法に基づいているようです(Agresti、1990; Agresti、2002)。ただし、デルタ方式が何であるか、なぜ使用する必要があるのかはわかりません。この方法での分散は、次の式で与えられます。
その中で
(Congaltonはではなく添え字を使用しますが、同じことを意味しているようです。さらに、はカウント行列、つまりサンプル数で除算される前の混同行列であると仮定しています関係式)
別の奇妙な部分は、コルガトンの本がコーエンによるオリジナルの論文を参照しているように見えるが、彼が重み付きカッパについて議論し続けるまでは、フリースらによって公開されたカッパ分散の修正を引用していないようです。おそらく彼の最初の出版物は、カッパの真の公式が混乱して失われたときに書かれたのでしょうか?
誰かがそれらの違いの理由を説明できますか?または、なぜ誰かがFleissによる修正版の代わりにデルタ法の分散を使用するのでしょうか?
[1]:フライス、ジョセフL。コーエン、ジェイコブ; エブリット、BS; カッパと加重カッパの大きなサンプル標準誤差。Psychological Bulletin、Vol 72(5)、1969年11月、323-327。土井:10.1037 / h0028106
[2]:コーエン、ジェイコブ(1960)。公称スケールの一致係数。教育および心理測定20(1):37–46。DOI:10.1177 / 001316446002000104
[3]:Alan Agresti、Categorical Data Analysis、第2版。ジョンワイリーアンドサンズ、2002年。
[4]:ラッセルG.コンガルトンとグリーン、K。リモートセンシングデータの精度の評価:原則と実践、第2版。2009年。