タグ付けされた質問 「terminology」

統計における特定の専門用語/概念の使用法と意味。

2
この離散分布には名前がありますか?
この離散分布には名前がありますか?以下のためのi∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} この分布に出くわしたのは次のとおりです。ユーティリティ機能によってランク付けされたアイテムのリストがあります。リストの先頭にバイアスをかけながら、アイテムの1つをランダムに選択します。そこで、最初に1とNの間のインデックスjを一様に選択します。次に、インデックス1とjの間のアイテムを選択します。このプロセスにより上記の分布が得られると思います。NNNjjjNNNjjj


6
記述統計と推測統計の違いは何ですか?
私の理解では、記述統計はデータサンプルの特徴を定量的に記述し、推論統計はサンプルが抽出された母集団について推論しました。 ただし、統計的推論に関するウィキペディアのページには次のように記載されています。 ほとんどの場合、統計的推論は、ある種のランダムサンプリングを介して対象の母集団から抽出されたデータを使用して、母集団に関する命題を作成します。 「大部分」のために、おそらくこれらの概念を適切に理解していないと思うようになりました。人口について提案しない推論統計の例はありますか?




1
通常、相関係数は大文字の記述されますが、そうでない場合もあります。r 2とR 2の間に本当に違いがあるのだろうか?缶R相関係数よりも、他の平均何か?RRRr2r2r^2R2R2R^2rrr

4
「ランダム変数の合計」の概念を誰でも明確にできますか
私の確率クラスでは、「ランダム変数の合計」という用語が常に使用されています。しかし、私はそれが正確に何を意味しているのでしょうか? ランダム変数からの多くの実現の合計について話していますか?もしそうなら、それは単一の数字になりませんか?ランダム変数実現の合計はどのようにして分布、またはあらゆる種類のcdf / pdf /関数につながるのでしょうか?そして、ランダム変数の実現ではない場合、正確に何が追加されていますか?

4
学習と推論の違いは何ですか?
機械学習の研究論文では、多くの場合、学習と推論を2つの別々のタスクとして扱いますが、その区別が何であるかは明確ではありません。では、本書例えば、彼らは、タスクの両方の種類のベイズ統計を使用しますが、その区別のための動機を提供していません。私はそれが何であるかについていくつかのあいまいなアイデアを持っていますが、堅実な定義と、おそらく私のアイデアの反論または拡張を見たいと思います: 特定のデータポイントの潜在変数の値を推測することと、データに適したモデルを学習することとの違い。 (入力空間/プロセス/ワールドのダイナミクスを学習することで)分散を抽出できるように、分散を抽出(推論)と不変を学習することの違い。 神経科学の類推は、短期増強/うつ病(記憶の痕跡)対長期増強/うつ病である可能性があります。


4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
モデルはデータに適合していますか、またはデータはモデルに適合していますか?
モデルをデータに適合させることとデータをモデルに適合させることの間に概念的または手順上の違いはありますか?最初の文言の例はhttps://courses.washington.edu/matlab1/ModelFitting.htmlに、2番目の例はhttps://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.htmlにあります。。

2
名前の意味:精度(分散の逆数)
直感的には、平均は単なる観測の平均です。分散は、これらの観測値が平均値とどれだけ異なるかです。 分散の逆数が精度として知られている理由を知りたいです。これからどのような直観が得られますか?そして、なぜ精度行列は多変量(正規)分布の共分散行列と同じくらい有用なのでしょうか? 洞察してください?

5
経験的CDFとCDF
経験累積分布関数について学んでいます。しかし、私はまだ理解していません なぜ「経験的」と呼ばれるのですか? Empirical CDFとCDFに違いはありますか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.