私は統計学者ではありませんが、私の研究作業には統計が含まれます(データの分析、文献の読み取りなど)。ここに投稿された質問の1つに対するコメントから、統計の分野で十分に実践されている人にとって特に特定の意味または意味をもつ一般的な単語があることを思い出しました。
このような単語のリストを用意しておくと役立ちます。コメントと一緒にフレーズを追加することもできます。
私は統計学者ではありませんが、私の研究作業には統計が含まれます(データの分析、文献の読み取りなど)。ここに投稿された質問の1つに対するコメントから、統計の分野で十分に実践されている人にとって特に特定の意味または意味をもつ一般的な単語があることを思い出しました。
このような単語のリストを用意しておくと役立ちます。コメントと一緒にフレーズを追加することもできます。
回答:
「重要」-ここでの単語の一般的な使用は、「重要」または「意味のある」ようなものを意味することです。統計的な意味は、「nullに関するランダムな変動から識別できる」に非公式に近いです。違いが問題になるほど大きいことを意味するものではありません。
この区別が混乱の原因となった可能性があるいくつかの例を次に示します。1 2
「パラメータ」-統計学者が「変数」という単語を使用する方法で「パラメータ」という単語が使用されることは、特に科学実験でしばしば起こるようです。ウィキペディアはこう言っています:
統計パラメーターは、確率分布のファミリーにインデックスを付けるパラメーターです。母集団またはモデルの数値的特徴とみなすことができます
これが問題になる可能性がある例:1-おそらくこの質問につながった投稿。(私は最近別のものを見ましたが、今それを見つけることができません)
「エラー」-統計では、多くの場合、観測値と予測値の偏差を意味します。実際には、それは間違いを意味します。
「正常」 -一般的なスピーチでは、正常とは通常のことではなく、予想どおりのことです。統計では、変数が正規分布している場合、それはガウス分布を参照しています。「普通」という単語を大文字にして、一般的なスピーチの意味と区別するのが標準だとは思いません。
「正規化/標準化」 -統計では、変数を正規化するとは、平均を減算して標準偏差で割ることを意味します。
「標準偏差対標準誤差」 -標準偏差は通常、母集団全体を使用して計算されますが、標準誤差はサンプルを使用して計算されます。
推定 -統計では、計算の結果です。たとえば、サンプル平均は母平均の推定値であり、平均の信頼区間は母平均の区間推定です。これらは両方とも正確な計算の結果です。「推定」とは、サンプルのデータから母集団について推論しようとすることの正確な一般化です。
通常の使用では、単語の推定は、情報に基づいた推測または予測、または近似計算の結果を意味します。
サンプル:統計ではこれはケースのセットを指しますが、他の多くの分野では、サンプルは1つの物理的な標本です。もちろん、サンプルサイズもあいまいであり、統計サンプルのケース数または標本の物理サイズ(質量、体積など)のいずれかを指します。
感度:医療診断では、テストで認識される病気の症例の割合。分析化学の場合:検量線の傾き(以下を参照)。
特異性:医療診断では、これがテストによって正しく認識される非疾患症例の割合。分析化学では、交差感度がない場合の方法は特定です。
キャリブレーション:実際には、Wikiの記事で統計の2つの意味が既にリストされています。化学および物理学では、逆回帰の意味は通常のものです。ただし、混乱が生じます。
検証セット:ここで、別の統計関連のフィールド内で既に生じていると思われる用語の混乱を招く可能性のある使用に注意を喚起したいと思います。ネスト/二重検証または最適化対検証/テストのコンテキストでは、用語の1行でトレーニング-検証-を分割し、ハイパーパラメーターの最適化のために「検証」セットをテストおよび使用します。
例えば、統計学習の要素、p。第2編の222。:
...データセットを3つの部分に分割します:トレーニングセット、検証セット、およびテストセット。トレーニングセットは、モデルの適合に使用されます。検証セットは、モデル選択の予測誤差を推定するために使用されます。テストセットは、最終的に選択されたモデルの一般化エラーの評価に使用されます。
これとは対照的に、例えば分析化学の検証では、モデルは(実際には、最終モデルの評価は、分析法のバリデーションの一部でしかありません)アプリケーションに適していますし、そのパフォーマンスを測定することを実証する手順である、例えば参照ジョンK. Taylor:分析法の検証、Analytical Chemistry 1983 55(6)、600A-608A、
またはFDAなどの機関によるガイドライン。これは、「検証」が実際に最適化に使用される用語の別の行の「テスト」になります。
重要な違いは、「最適化検証」の結果を使用してモデルを変更(選択)するのに対して、検証済みの分析メソッド(データ分析モデルを含む)を変更する必要があることです。再検証 (つまり、メソッドが正常に機能することを証明します)。
化学者と話をしなければならない場合、分析化学用語の適切なリファレンスは、Danzer:Analytical Chemistry-Theoretical and Metrological Fundamentals、DOI 10.1007 / b103950です。