「ゴールドスタンダード」と「グラウンドトゥルース」の違いは何ですか?


9

「ゴールドスタンダード」と「グラウンドトゥルース」の違いは何ですか?

2つのWiki記事(つまり、ゴールドスタンダードグラウンドトゥルース)は、モデルの精度/精度の点で両方の概念を相互に関連付けています。それは一つの可能​​性です。しかし、これらの概念は、ラベル付きデータセットについて話すときに交換可能に使用されることもわかりました。

実際のラベル(グラウンドトゥルースまたはゴールドスタンダードとも呼ばれます)を取得できない場合もあります。(ソースpdf


、ELUに釈明されるためには、」これらの表現によって理解されているものについての詳細は必要である。また、ファウラーのように辞書やその他の関連作品を使用してのようないくつかの先行研究示す:ELU上の私のコメントは、ここでそれをしなかった。現代英語を使用法(オンラインで見つけることができます)は良いでしょう。その調査ですべての質問に答えられない場合 ELUはおそらく解明できます。」
Andrew Leach

10
問題は、機械学習の文献で使用されている用語についてのようです。なぜそれがここで話題から外れているのかわかりません。
Juho Kokkala 14

4
私には完全にトピックについてのようです。私は統計の文脈で使用される両方の用語を見てきました。どちらも「私たちが真実ではないとしても、真実を突き刺すための最善の手段として取る測定」の味を持っています。経済学と財政学におけるその明白な起源にもかかわらず、私が医学統計文献で主に見た「ゴールドスタンダード」。コンテキストは、新しいものと比較して、多くの場合、正確ではあるが困難または高価な方法です。対照的に、私がリモートセンシングの説明で見た「グラウンドトゥルース」では、「グラウンド」には必要なアースの意味合いが含まれています。間違いなく他の多くの文献に用途があります。
Nick Cox

回答を追加することはできませんが、このWikipediaの記事によれば、「グラウンドトゥルースという用語は、根本的な情報の絶対的な状態を指します。ゴールドスタンダードは、グラウンドトゥルースをできる限り厳密に表すように努めています。ゴールドスタンダードは、真実を取得するための最善の努力。グラウンドトゥルースは通常、直接の観察によって収集されます。機械学習と情報検索では、分類が不完全な場合でも「グラウンドトゥルース」が優先される用語です。ゴールドスタンダードはグラウンドトゥルースと見なされます。」
confused00

回答:


2

より完全な引用

場合によっては、実際のラベル(グラウンドトゥルースまたはゴールドスタンダードとも呼ばれます)を取得することが不可能であり、ラベルに反対することが多い少数の専門家の主観的な意見から推定されます[14、29]。

それは私をいくつかのレベルで狂気のように感じます。たとえば、コンセンサスを形成するために複数の主観的意見を使用する場合、その裁定された意見を参照標準と呼び、調査できる統計的特性がないとありません。たとえば、汚いコインと3人の裁判官を見てください。したがって、絶対的な真実を確認することはできませんが、基準がいかに優れているかを調査し、分析したいものの測定として使用するのに十分な水準になるまで、基準を改善することができます。別のケースでは、否定的な結果しか得られません。コンテキストが何であれ、私たちの責任は、測定の精度と精度の限界を述べることです。

「ゴールドスタンダード」とは、医学・関連分野に共通の用語です。正当な理由で決して発行されない用語を使用して提出された多くの論文があります。ほとんどの場合、これは「仮定を立ててからその仮定が行われたことを証明する」タイプの循環推論によるものであり、その領域は、同じ大量のばかげたエラーを作らずには複製できない空想的な結果で構成されています。

自己妄想の機会を減らすために、他の用語を使用することをお勧めします。残念ながら、ウィキペディアのエントリCriterion Standardと呼ばれるAMAの優先用語は、ゴールドスタンダードの同義語ではなく、疾患の発生報告を指します。これは、作成者が金色の比較を適切に使用するという悪い習慣を持っている状況ではほとんどありません。

ほとんどのコンテキストでより適切な用語は、はるかに重要な参照標準です。たとえば、「標準キログラム」を参照する場合、その標準がどのような意味でも正しいと言っているのではなく、「標準」として使用したので、それが利用可能でした。参照標準として何かを使用しているからといって、作成できる優れた標準がないという意味ではなく、ジャーナル記事では「真の標準」という単語の後に「true」という単語が頻繁に続くという意味でも優れています。 "、または"真実 "は、いわゆる"ゴールドスタンダード "の仮定に対して1桁の頻度で頻度が増加することがよくあります。

例として、参照標準のプラチナイリジウム(つまり、金よりも良い)キログラムは、19世紀に最初に鋳造されて以来、徐々に質量が減少しています(合計50マイクログラム)。2019年5月20日の時点で、その標準はプランク定数で定義されたキログラムの質量標準に置き換えられます。これは、現在の参照キログラムほど大きくは変更されない可能性があります。

基準の標準と同様に、グラウンドトゥルースは頻繁にjargonesqueです。それは時々、誰かが地面に立っている間に少なくとも比喩的に撮られた写真から得られた結果と比較した、すなわちより直接的な観察の照合によって、リモートセンシング分析結果を指します。繰り返しますが、より一般的な用語は参照標準です。これは、確立された実践とその精度、正確さ、批評、評価、改善、および展開に関する規則という形で、はるかに堅固な科学的根拠があることをお勧めします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.