タグ付けされた質問 「terminology」

統計における特定の専門用語/概念の使用法と意味。

3
相互作用は回帰のコンテキストでのみ有用ですか?
私は常に、回帰という文脈で相互作用という用語を読みました。また、knnやsvmなどの異なるモデルとの相互作用も考慮する必要がありますか? ある場合は、またはさらに多くの機能をしてすることができます言う便利な相互作用を見つけるための通常の方法は何か観測を?すべての組み合わせを試しますか?または、意味のある組み合わせのみを使用しますか?100 1000505050100100100100010001000

1
PCAとPLSの「読み込み」と「相関読み込み」の違いは何ですか?
主成分分析(PCA)を実行するときに行う一般的なことの1つは、2つの負荷を互いにプロットして、変数間の関係を調べることです。主成分回帰とPLS回帰を行うためのPLS Rパッケージに付属するペーパーには、相関負荷プロットと呼ばれる別のプロットがあります(ペーパーの図7および15ページを参照)。相関負荷は、それが説明するように、(PCAからまたはPLS)スコアとの相関関係と実際の観測データです。 ローディングと相関ローディングは、スケーリングが少し異なることを除いて、かなり似ているように思えます。組み込みのデータセットmtcarsを使用したRでの再現可能な例は次のとおりです。 data(mtcars) pca <- prcomp(mtcars, center=TRUE, scale=TRUE) #loading plot plot(pca$rotation[,1], pca$rotation[,2], xlim=c(-1,1), ylim=c(-1,1), main='Loadings for PC1 vs. PC2') #correlation loading plot correlationloadings <- cor(mtcars, pca$x) plot(correlationloadings[,1], correlationloadings[,2], xlim=c(-1,1), ylim=c(-1,1), main='Correlation Loadings for PC1 vs. PC2') これらのプロットの解釈の違いは何ですか?そして、(もしあれば)実際に使用するのに最適なプロットはどれですか?


3
ベイジアン事後確率の均一性事前確率の平均
場合p∼p∼p \sim制服(0,1)(0,1)(0,1)、及びX∼X∼X \simビン(n,p)(n,p)(n, p)、その後の事後平均pppで与えられるX+1n+2X+1n+2\frac{X+1}{n+2}。 この推定者の一般的な名前はありますか?私はそれが多くの人々の問題を解決することを発見しました、そして私は人々に参照を示すことができるようにしたいのですが、それに適切な名前を見つけることができませんでした。 統計101の本では「+ 1 / + 2推定量」のように呼ばれていたことを漠然と覚えていますが、これはあまり検索可能な用語ではありません。

1
ACF、PACF機能に関する「カットオフ」および「テールオフ」という用語
ACFとPACFの時系列プロットにおけるカットオフとテールオフの意味を理解しようとしています。 「ラグ後にカットオフ」とはどういう意味ですか?これは限界について? 「テールズオフ」とはどういう意味ですか? 上記の例では、私が勉強に使用している本、それがARプロセスだと言っています。 しかし、「切り捨て」と「引き下げ」の意味がわかりません


1
分散、歪度、尖度を超える高次キュムラントとモーメントの名前
x (t )x(t)x(t) デリバティブのスナップ、クラックル、ポップを7次まで提案している人もい ます。 機械物理学と弾性理論から発想を得たモーメントは統計学においても重要です。確率分布の「モーメント」について、「モーメント」とは何ですか。K.ピアソンの作品の初期の言及。 000 5次または6次のキュムラント/モーメント、およびそれ以降(「高次のモーメント」を除く)に一般に受け入れられている名前や採用されている名前はありますか? Numerical Recipes 3rd Edition:Art of Scientific Computing、p。723: 歪度(または3番目のモーメント)および尖度(または4番目のモーメント)は注意して使用する必要があります。 これは、ポートフォリオのリスク分析における7次または8次までのモーメントの明らかな使用によって確認されているようです。 その他の注意事項: SE.maths:超歪度の解釈はありますか? スキューを引き起こす際のテールとセンター(モード、ショルダー)の相対的な重要性

3
「モデルを学ぶ」という用語はどこから来たのですか
ここのデータマイナーがこの用語を使用することをよく耳にします。分類の問題に取り組んだ統計学者として、「分類子を訓練する」という用語をよく知っており、「モデルを学習する」と同じことを想定しています。「分類子を訓練する」という言葉は気にしません。これは、トレーニングデータを使用してモデルパラメータの適切な「改善された」推定値を取得するため、モデルの当てはめのアイデアを描いているようです。しかし、それは知識を得るための手段を学ぶでしょう。わかりやすい英語で「モデルを学ぶ」とは、それが何かを知ることを意味します。しかし、実際にはモデルを「知る」ことはありません。モデルは現実に近似していますが、正しいモデルはありません。それはボックスが「モデルは正しくないが、いくつかは有用である」と言ったようです。 データマイナーの応答を聞きたいです。この用語の由来は?それを使うなら、なぜそれが好きですか?

2
なぜネイマン・ピアソンの補題は定理ではなく補題であるのですか?
これは、技術的な質問というよりは、歴史的な質問です。 「ネイマン・ピアソンの補題」が定理ではなく補題であるのはなぜですか? ウィキへのリンク:https : //en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma 注意:問題は、補題とは何か、および定理を証明するために補題がどのように使用されるかではなく、ネイマン・ピアソン補題の歴史についてです。それは定理を証明するために使用されましたか、それからそれはたまたまもっと有用でしたか?これが事実であったという疑いを超えてこれの証拠はありますか?

4
「ランダムプロジェクション」は厳密にはプロジェクションではありませんか?
ランダム射影アルゴリズムの現在の実装は、からそれらをマッピングすることにより、データサンプルの次元を減らすに用い射影行列を持つエントリからインスタンスに適した分布(からIIDさを):RdRd\mathbb R^dRkRk\mathbb R^kd× kd×kd\times kRRRN(0 、1 )N(0,1)\mathcal N(0,1) バツ』= 1k√x Rx′=1kxRx^\prime = \frac{1}{\sqrt k}xR 便利なことに、このマッピングがペアワイズ距離をほぼ維持することを示す理論的な証明が存在します。 しかし、最近私はこれらのメモを見つけました。著者は、ランダムマトリックスを使用したこのマッピングは、単語の厳密な線形代数的意味での射影ではないと主張しています(6ページ)。そこに与えられた説明から、これは、そのエントリがから独立して選択される場合、の列は厳密に直交しないためです。したがって、の列の直交性が強制された以前のバージョンのRPは、投影と見なすことができます。RRRN(0 、1 )N(0,1)\mathcal N(0,1)RRR (1)この厳密な意味での射影の定義は何か、(2)なぜこの定義の下ではRPが射影にならないのかについて、より詳細な説明を提供できますか?



2
バイアスは、推定者の特性ですか、それとも特定の推定値ですか?
例として、観察されたが母集団R 2の偏った推定量であることを知っている学生によく遭遇します。次に、レポートを作成するときに、次のように言います。R2R2R^2R2R2R^2 「私が観察算出及び調整R 2が、それらは、観察されたバイアスの少量のみを示唆し、かなり類似していたR 2、我々が得た値」。R2R2R^2R2R2R^2R2R2R^2 一般的に、バイアスについて話すときは、通常、特定の推定値ではなく、推定量の特性について話していると思います。しかし、引用されたステートメントは、用語の誤用より上にありますか、それとも問題ありませんか?

1
lmモデルのスチューデント化された残差対標準化された残差
「学習された残差」と「標準化された残差」は回帰モデルで同じですか?Rで線形回帰モデルを構築し、スチューデント化された残差v / s近似値のグラフをプロットしたいのですが、Rでこれを行う自動化された方法が見つかりませんでした。 モデルがあるとしましょう library(MASS) lm.fit <- lm(Boston$medv~(Boston$lstat)) 次に、を使用plot(lm.fit)しても、スチューデント化された残差と近似値のプロットは提供されませんが、標準化された残差と近似値のプロットは提供されます。 私はplot(lm.fit$fitted.values,studres(lm.fit)それを使用して、目的のグラフをプロットします。したがって、正しい方向に進んでいて、スチューデント化された残差と標準化された残差が同じではないことを確認したいだけです。それらが異なる場合は、それらとそれらの定義を計算するためのガイドを提供してください。ネットを検索したところ、少しわかりにくいことがわかりました。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.