「ゴールドスタンダード」と「グラウンドトゥルース」の違いは何ですか?
2つのWiki記事(つまり、ゴールドスタンダードとグラウンドトゥルース)は、モデルの精度/精度の点で両方の概念を相互に関連付けています。それは一つの可能性です。しかし、これらの概念は、ラベル付きデータセットについて話すときに交換可能に使用されることもわかりました。
実際のラベル(グラウンドトゥルースまたはゴールドスタンダードとも呼ばれます)を取得できない場合もあります。(ソースpdf)
「ゴールドスタンダード」と「グラウンドトゥルース」の違いは何ですか?
2つのWiki記事(つまり、ゴールドスタンダードとグラウンドトゥルース)は、モデルの精度/精度の点で両方の概念を相互に関連付けています。それは一つの可能性です。しかし、これらの概念は、ラベル付きデータセットについて話すときに交換可能に使用されることもわかりました。
実際のラベル(グラウンドトゥルースまたはゴールドスタンダードとも呼ばれます)を取得できない場合もあります。(ソースpdf)
回答:
より完全な引用は
場合によっては、実際のラベル(グラウンドトゥルースまたはゴールドスタンダードとも呼ばれます)を取得することが不可能であり、ラベルに反対することが多い少数の専門家の主観的な意見から推定されます[14、29]。
それは私をいくつかのレベルで狂気のように感じます。たとえば、コンセンサスを形成するために複数の主観的意見を使用する場合、その裁定された意見を参照標準と呼び、調査できる統計的特性がないとありません。たとえば、汚いコインと3人の裁判官を見てください。したがって、絶対的な真実を確認することはできませんが、基準がいかに優れているかを調査し、分析したいものの測定として使用するのに十分な水準になるまで、基準を改善することができます。別のケースでは、否定的な結果しか得られません。コンテキストが何であれ、私たちの責任は、測定の精度と精度の限界を述べることです。
「ゴールドスタンダード」とは、医学・関連分野に共通の用語です。正当な理由で決して発行されない用語を使用して提出された多くの論文があります。ほとんどの場合、これは「仮定を立ててからその仮定が行われたことを証明する」タイプの循環推論によるものであり、その領域は、同じ大量のばかげたエラーを作らずには複製できない空想的な結果で構成されています。
自己妄想の機会を減らすために、他の用語を使用することをお勧めします。残念ながら、ウィキペディアのエントリでCriterion Standardと呼ばれるAMAの優先用語は、ゴールドスタンダードの同義語ではなく、疾患の発生報告を指します。これは、作成者が金色の比較を適切に使用するという悪い習慣を持っている状況ではほとんどありません。
ほとんどのコンテキストでより適切な用語は、はるかに重要な参照標準です。たとえば、「標準キログラム」を参照する場合、その標準がどのような意味でも正しいと言っているのではなく、「標準」として使用したので、それが利用可能でした。参照標準として何かを使用しているからといって、作成できる優れた標準がないという意味ではなく、ジャーナル記事では「真の標準」という単語の後に「true」という単語が頻繁に続くという意味でも優れています。 "、または"真実 "は、いわゆる"ゴールドスタンダード "の仮定に対して1桁の頻度で頻度が増加することがよくあります。
例として、参照標準のプラチナイリジウム(つまり、金よりも良い)キログラムは、19世紀に最初に鋳造されて以来、徐々に質量が減少しています(合計50マイクログラム)。2019年5月20日の時点で、その標準はプランク定数で定義されたキログラムの質量標準に置き換えられます。これは、現在の参照キログラムほど大きくは変更されない可能性があります。
基準の標準と同様に、グラウンドトゥルースは頻繁にjargonesqueです。それは時々、誰かが地面に立っている間に少なくとも比喩的に撮られた写真から得られた結果と比較した、すなわちより直接的な観察の照合によって、リモートセンシング分析結果を指します。繰り返しますが、より一般的な用語は参照標準です。これは、確立された実践とその精度、正確さ、批評、評価、改善、および展開に関する規則という形で、はるかに堅固な科学的根拠があることをお勧めします。