タグ付けされた質問 「terminology」

統計における特定の専門用語/概念の使用法と意味。

3
2つのドットが接続された行を持つこのプロットの名前は何ですか?
私はEIAレポートを読んでおり、このプロットは私の注目を集めました。同じ種類のプロットを作成できるようになりたいと思います。 2年間(1990〜2015年)のエネルギー生産性の進化を示し、この2つの期間の間に変化値を追加します。 このタイプのプロットの名前は何ですか?Excelで同じプロットを(異なる国で)作成するにはどうすればよいですか?

1
分散の反意語
「分散の逆数」を意味する言葉はありますか?つまり、分散が大きい場合、は低くなりますか?近い反意語(「同意」や「類似性」など)には興味がありませんが、具体的には意味しますか?バツバツXバツバツX……\dots1 / σ21/σ21/\sigma^2

5
名前に含まれるもの:ハイパーパラメーター
したがって、正規分布では、平均と分散つのパラメーターがあります。本「パターン認識と機械学習」では、エラー関数の正則化項にハイパーパラメーターが突然現れます。μμ\muσ2σ2\sigma^2λλ\lambda ハイパーパラメーターとは何ですか?なぜそのような名前が付けられているのですか?そして、それらは一般的にパラメーターとどのように直感的に異なっていますか?

6
データマイニングと統計分析の違いは何ですか?
データマイニングと統計分析の違いは何ですか? ある程度の背景として、私の統計教育はかなり伝統的だったと思います。特定の質問が提起され、調査が設計され、データが収集および分析されて、その質問に関する洞察が得られます。その結果、私は常に「データed」、つまり大規模なデータセット内のパターンを探し、これらのパターンを使用して結論を​​出すことを検討していました。私は後者をデータマイニングに関連付ける傾向があり、これは常に(アルゴリズム変数選択ルーチンのようなものとともに)いくぶん無原則だと考えてきました。 それにもかかわらず、データマイニングに関する大規模で成長中の文献があります。多くの場合、このラベルは、クラスタリング、ツリーベースの分類などの特定の手法を指します。しかし、少なくとも私の観点からは、これらの手法は、データのセットに対して「緩め」またはアドレス指定に構造化された方法で使用できます質問。前者をデータマイニング、後者を統計分析と呼びます。 私は学術行政で働いており、問題や機会を特定するために「データマイニング」を行うように頼まれています。私の背景と一致して、私の最初の質問は次のとおりでした:あなたは何を学びたいですか、あなたは問題に貢献すると思うものは何ですか?彼らの回答から、私と質問をする人は、データマイニングの性質と価値について異なる考えを持っていることが明らかでした。

1
James-Stein推定量が「収縮」推定量と呼ばれるのはなぜですか?
James-Stein推定量について読んでいます。このノートでは、次のように定義されています θ^=(1−p−2∥X∥2)Xθ^=(1−p−2‖X‖2)X \hat{\theta}=\left(1 - \frac{p-2}{\|X\|^2}\right)X 私は証明を読みましたが、次の声明を理解していません: 幾何学的に、James–Stein推定量は、各成分を原点に向かって縮小します...XXX 「各成分を原点に向かって縮小する」とはどういう意味ですか?私はようなものを考え ていました。(p + 2)<\ | X \ | ^ 2、 \ | \ hat {\ theta} \ | = \ frac {\ | X \ | ^ 2-(p + 2)} {\ | X \ | ^ 2} \ | X \ |。‖ θ …

5
「転移学習」と「ドメイン適応」の違いは何ですか?
「転移学習」と「ドメイン適応」の間に違いはありますか? コンテキストについては知りませんが、私の理解では、いくつかのデータセット1があり、その上でトレーニングを行い、その後、最初から再トレーニングせずにモデルを適応させたい別のデータセット2があります。 「ドメイン適応」は、この問題の解決に役立ちます。 畳み込みニューラルネットワークの分野によると: 「転移学習」とは、「微調整」を意味します[1] この場合[2]は教師なしですが、「ドメイン適応」は常に教師なしにする必要がありますか?

1
「バイアス」という言葉は、を意味するように造られたのはいつですか?
「バイアス」という言葉は、を意味するように造られたのは いつですか?E [ θ^- θ ]E[θ^−θ]\mathbb{E}[\hat{\theta}-\theta] 私が今このことを考えている理由は、ジェーンズの確率論のテキストで、この式を説明するのに使用される「バイアス」という言葉の使用を批判し、代替案を示唆しているようだからです。 Jaynesの確率理論、セクション17.2「不偏推定量:」 正統派の人々がなぜそのような誇張を強調しているのでしょうか?私たちは、主な理由は、彼らが自分自身の精神心理学的なtrapに捕らえられているからだと考えています。量「バイアス」と呼ぶと、ひどく非難できる何かのように聞こえますが、それは何としても取り除く必要があります。(17.2)のピタゴラス形式で示唆されているように、代わりに「分散に直交する誤差の成分」と呼ばれていれば、誤差に対するこれら2つの寄与は等しい立場にあることが明らかでした。他方を増やすことを犠牲にして一方を減らすことは愚かです。これは、感情的な負荷を伴う技術用語を選択するために支払う価格であり、価値判断を意味します。正統性は常にこの戦術的な誤りに陥ります。(⟨ β⟩ − α )(⟨β⟩−α)(\langle\beta\rangle-\alpha)

11
行列の「列数」の用語
行列の「列数」を示す単一の英語の単語はありますか? たとえば、行列の「次元」はです。この例では用語が必要です。もちろん、「列の数」と言うことはいつでもできますが、一言でもいいですか。2 × 32×32\times 32 × 32×32\times 3333

3
結果を「非常に重要」と呼ぶのは間違っていますか?
値が従来のレベルのはるかに下回る場合、統計学者が結果を「非常に重要」と呼ぶことを思いとどまらせるのはなぜですか?α 0.05pppαα\alpha0.050.050.05 99%()の確率しか得られない結果よりも、タイプIエラー()ではない確率が99.9%の結果を信頼することは本当に間違っていますか?p = 0.01p = 0.001p=0.001p=0.001p = 0.01p=0.01p=0.01

1
PCAで「プリンシパルコンポーネント」と正確に呼ばれるものは何ですか?
仮定デザイン行列とのデータの投影の分散最大化するベクトルである。uuuXXX ここで、uuuをデータの(最初の)主成分として参照する資料を見ました。これは最大の固有値を持つ固有ベクトルでもあります。 ただし、データの主成分はXuXuX u。 明らかに、uuuとXuXuXuは異なるものです。誰でもここで私を助けて、主成分のこれら2つの定義の違いを教えてもらえますか?

5
独立に関連するこの数量には名前がありますか?
明らかにイベントAとBは、PrのIFF独立している(A∩B)(A∩B)(A\cap B) = Prの(A)(A)(A)のPr (B)(B)(B)。関連する数量Qを定義しましょう: Q≡Pr(A∩B)Pr(A)Pr(B)Q≡Pr(A∩B)Pr(A)Pr(B)Q\equiv\frac{\mathrm{Pr}(A\cap B)}{\mathrm{Pr}(A)\mathrm{Pr}(B)} したがって、AとBは、Q = 1の場合に独立しています(分母が非ゼロであると仮定)。Qには実際には名前がありますか?今私を逃れている基本的な概念を指しているように感じます。

4
「ランダムサンプル」と「iidランダム変数」は同義語ですか。
「ランダムサンプル」と「iidランダム変数」の意味を理解するのに苦労しています。私はいくつかの情報源から意味を見つけようとしましたが、ますます混乱しました。私がここに投稿したのは、私が試し、知ったものです: Degrootの確率と統計によると: ランダムサンプル/ iid /サンプルサイズ:pfまたはpdfいずれかで表すことができる実線上の特定の確率分布を考慮します。これは、と言われての確率変数、これらのランダム変数が独立しており、それぞれの周辺のpfまたはpdfが場合、この分布からランダムサンプルを形成します。このようなランダム変数は、独立しており、同じように分布していると言われています。略してiidランダム変数の数nをサンプルサイズと呼びます。nはX 1、。。。、X n ffffnnnX1,...,XnX1,...,XnX_1 , . . . , X_nfff しかし、私が言っている他の統計書の1つ: ランダムサンプリングでは、母集団内のすべてのユニットが選択される確率(確率)が等しくなることを保証します。 したがって、iidはランダムサンプルを構成する要素であり、ランダムサンプルを取得する手順はランダムサンプリングであると感じています。私は正しいですか? PS:私はこのトピックについて非常に混乱しているので、私は精巧な返事を感謝します。ありがとう。

3
「正規化」とは何を意味し、サンプルまたは分布が正規化されていることを確認する方法は何ですか?
一様分布()が正規化されているかどうかを確認する質問があります。Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) 1つは、分布が正規化されるとはどういう意味ですか? 2つ目は、分布が正規化されているかどうかを確認する方法です。 X−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} を計算 することで、正規化されたデータを取得することがわかりますが、ここでは、分布が正規化されているかどうかを確認しています。

4
「時系列分析」と「縦断的データ分析」という用語の違いは何ですか
縦断的データについて話すとき、同じ被験者/学習ユニットから繰り返し収集されたデータを参照する場合があります。したがって、同じ被験者内の観察、つまり被験者内の類似性には相関があります。 時系列データについて話すとき、一連の時間にわたって収集されたデータも参照します。これは、上記の縦断的設定と非常によく似ています。 誰かがこれらの2つの用語の間の明確な説明を提供できるかどうか疑問に思っています、関係とは何ですか、違いは何ですか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.