タグ付けされた質問 「terminology」

統計における特定の専門用語/概念の使用法と意味。


9
統計と生物統計の違いは何ですか?
私は、統計と生物統計学の違いについて長年にわたっていくつかのアイデアをつなぎ合わせてきたが、正式な説明を聞いたことがないことに気付いた。これら2つの分野の違いは何ですか(現在)。そして、なぜこの区別が最初に始まったのですか? 編集:私は元の質問で十分に具体的ではありませんでした。私は、生物統計学が生物医学分野における統計学の応用と発展であることを理解しています。しかし、区別のいくつかの具体的な例は何ですか?たとえば、2つの分野で大学院教育を区別するものは何ですか?2つの分野に異なる学部を設ける目的は何ですか(他の分野では見られない区別)。


3
回帰におけるnullモデルとは何ですか?またnull仮説とどのように関係しますか?
回帰におけるnullモデルとは何ですか?nullモデルとnull仮説の関係は何ですか? 私の理解のために、それは意味します 「応答変数の平均」を使用して連続応答変数を予測しますか? 離散応答変数の予測に「ラベル分布」を使用していますか? その場合、帰無仮説間の関係が欠落しているようです。

1
ニューラルネットワーク文献のテンソル:最も単純な定義は何ですか?
ニューラルネットワークの文献では、「テンソル」という言葉に遭遇することがよくあります。 ベクターとは違うのですか?そして、マトリックスから?その定義を明確にする具体的な例はありますか? 私はその定義について少し混乱しています。ウィキペディアは役に立たず、時々、その定義は使用されている特定の機械学習環境(TensorFlow、Caffee、Theano)に依存するという印象を受けます。

2
なぜ「標準」偏差と呼ばれるのですか?
私は簡単な、そしておそらく些細な質問を持っています:なぜ標準偏差はそれだけで「標準」と呼ばれるのですか?それは、分散に関してデータセットと結果の比較を標準化するためですか? Stack Exchangeでの検索ではこの質問が見つかりませんし、用語の語源での Google検索でも多くの価値がありません。


3
Thetaはどういう意味ですか?
私は統計の初心者で、これを見つけました。 統計では、小文字のギリシャ文字「シータ」であるθは、一般的な確率分布のパラメータ(のベクトル)の通常の名前です。一般的な問題は、シータの値を見つけることです。この方法でパラメーターに名前を付けることには意味がないことに注意してください。他の名前を付けることもできます。実際、多くのディストリビューションには、通常他の名前が付けられたパラメーターがあります。たとえば、正規分布の平均と偏差にμ(読み取り: 'mu')と偏差σ( 'sigma')をそれぞれ付けるのが一般的な使用法です。 しかし、私はまだそれが平易な英語で何を意味するのか分かりませんか?

2
「プールデータ」とはどういう意味ですか?
「データをプールする」とは、単に以前にカテゴリに分割されたデータを結合することを意味すると考えました。これは、統計の適用というよりも用語に関する質問だと思います。 たとえば、2つのサイトを比較し、各サイト内に2つの年タイプ(良いと悪い)があります。2つのサイトを「全体」比較する(つまり、年の種類を無視する)場合、各サイト内のデータをプールしていると言うのは正しいですか?それに加えて、数年のデータは良い年と悪い年のタイプで構成されているので、各サイト内で「良い年」と「悪い年」のデータセットを達成するために年のデータをプールしていると言っても正しいですか?ご協力いただきありがとうございます!モグ


2
マルコフ連鎖とマルコフ過程の違いは何ですか?
マルコフ連鎖とマルコフ過程の違いは何ですか? 私は矛盾する情報を読んでいます:時々、定義は状態空間が離散的であるか連続的であるかに基づいており、時にはそれは時間が離散的であるか連続的であるかに基づいています。 このドキュメントのスライド20: 状態空間が離散的、すなわち有限または可算空間である場合、すなわち有限または可算である場合、マルコフ過程はマルコフ連鎖と呼ばれます。 http://www.win.tue.nl/~iadan/que/h3.pdf: マルコフ過程は、マルコフ連鎖の連続時間バージョンです。 または、マルコフ連鎖とマルコフプロセスを同義的に使用して、時間パラメータが連続的か離散的か、および状態空間が連続的か離散的かを正確に判断できます。 更新2017年3月4日:同じ質問がで頼まれたhttps://www.quora.com/Can-I-use-the-words-Markov-process-and-Markov-chain-interchangeably


2
周辺分布/周辺確率が「周辺」と表示されるのはなぜですか?
限界とは一般に、小さなシステムの外にある小さな効果を指します。「限界」と呼ばれるものの重要性を低下させる傾向があります。 それでは、それが確率変数のサブセットの確率にどのように適用されるのでしょうか? 言葉の意味のために言葉が使われると仮定すると、数学では危険な命題になる可能性があるため、ここに必ずしも答えがあるとは限りませんが、この種の質問に対する答えは、真の洞察を得るのに役立つことがあります。お願いします。

2
イベントが「最終的に発生する」とはどういう意味ですか?
整数の1次元ランダムウォークを検討ZZ\mathbb{Z}初期状態でx∈Zx∈Zx\in\mathbb{Z}: Sn=x+∑i=1nξiSn=x+∑i=1nξi\begin{equation} S_n=x+\sum^n_{i=1}\xi_i \end{equation} 増分は、ここでξiξi\xi_i IIDがそのようなことであるP{ξi=1}=P{ξi=−1}=12P{ξi=1}=P{ξi=−1}=12P\{\xi_i=1\}=P\{\xi_i=-1\}=\frac{1}{2}。 それを証明することができます(1) Px{Sn reaches +1 eventually}=1Px{Sn reaches +1 eventually}=1\begin{equation} P^x{\{S_n \text{ reaches +1 eventually}\}} = 1 \end{equation} ここで、添え字は初期位置を示します。 してみましょうττ\tau状態への最初の通過時間が。つまり、です。次のことも証明できます(2)+1+1+1τ:=τ(1):=min{n≥0:Sn=1}τ:=τ(1):=min{n≥0:Sn=1}\tau:=\tau(1):=\min\{n\geq0:S_n=1\} Eτ=+∞Eτ=+∞\begin{equation} E\tau = +\infty \end{equation} 両方の証明はhttp://galton.uchicago.edu/~lalley/Courses/312/RW.pdfにあります。記事を読んで、私は両方の証拠を理解しています。 しかし、私の質問は、「最終的に」の意味が最初の文だけでなく一般的に何であるかです。「最終的に」何かが発生した場合、有限時間で発生する必要はありませんか?もしそうなら、実際に発生しないものと、「最終的に」発生しないものの違いは何ですか?ステートメント(1)および(2)は、ある意味で私自身と矛盾しています。このような他の例はありますか? 編集 質問の動機付けを追加したい、つまり、「最終的に」発生するものの単純な例ですが、待機時間は有限です。 P{walker eventually moves left}=1−P{walker never moves left}=1−limn→∞12n=1P{walker eventually moves left}=1−P{walker never moves left}=1−limn→∞12n=1\begin{split} P\{\text{walker eventually moves left}\} …

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.