タグ付けされた質問 「intuition」

統計についての概念的または非数学的な理解を求める質問。

28
主成分分析、固有ベクトル、固有値を理解する
今日のパターン認識クラスでは、私の教授がPCA、固有ベクトル、固有値について話しました。 私はそれの数学を理解しました。固有値などを見つけるように求められたら、機械のように正しく行います。しかし、私はそれを理解しませんでした。目的がわからなかった。私はそれを感じませんでした。 私は次の引用を強く信じています: あなたはそれをあなたの祖母に説明できない限り、あなたは本当に何かを理解していません。 - アルバート・アインシュタイン まあ、私はこれらの概念を素人やおばあちゃんに説明することはできません。 なぜPCA、固有ベクトル、固有値なのか?これらの概念の必要性は何ですか? これらを素人にどのように説明しますか?

11
ベータ配布の背後にある直感とは何ですか?
免責事項:私は統計学者ではなく、ソフトウェアエンジニアです。統計に関する私の知識のほとんどは独学から得たものなので、ここでは他の人にとってはささいな概念の理解にまだ多くのギャップがあります。したがって、回答に具体性の低い用語とより多くの説明が含まれていれば、非常に感謝します。おばあちゃんと話していると想像してください:) 私が把握しようとしている自然のベータ分布をどのようにそれぞれの場合に、それを解釈することはのために使用すべきかと- 。たとえば、正規分布について話している場合、電車の到着時間として説明することができます。最も頻繁にちょうど間に合うように到着し、少し少ない頻度で1分早くまたは1分遅れて、非常にまれに差で到着することはありません平均から20分。均一配布は、特に、宝くじの各チケットのチャンスを説明します。二項分布は、コインフリップなどで説明できます。しかし、ベータ分布のそのような直感的な説明はありますか? たとえば、およびとしましょう。この場合のベータ分布は、次のようになります(Rで生成):α=.99α=.99\alpha=.99β=.5β=.5\beta=.5B(α,β)B(α,β)B(\alpha, \beta) しかし、実際にはどういう意味ですか?Y軸は明らかに確率密度ですが、X軸には何がありますか? この例または他の例を使用して、説明をいただければ幸いです。

11
自由度を理解する方法は?
ウィキペディアから、統計の自由度の3つの解釈があります。 統計では、自由度の数は、統計の最終計算で自由に変化できる値の数です。 統計パラメータの推定は、さまざまな量の情報またはデータに基づいて行うことができます。パラメーターの推定値に入る独立した情報の数は、自由度(df)と呼ばれます。一般的に、パラメータの推定値の自由度は、に等しい推定に入る独立したスコアの数マイナスパラメータ自体の推定における中間ステップとして使用されるパラメータの数(標本分散です、 1つは、サンプル平均が唯一の中間ステップであるためです)。 数学的には、自由度はランダムなベクトルの領域の次元、または本質的に「自由な」コンポーネントの数です。ベクトルが完全に決定されるまでに必要なコンポーネントの数。 大胆な言葉は私がよく理解していないものです。可能であれば、いくつかの数学的定式化が概念の明確化に役立ちます。 また、3つの解釈は互いに一致しますか?

16
統計的検定におけるp値とt値の意味は何ですか?
統計コースを受講してから仲間の学生を助けようとした後、頭を大きく叩くような刺激を与える1つの主題が統計仮説テストの結果を解釈していることに気付きました。学生は、与えられたテストに必要な計算を実行する方法を簡単に学びますが、結果を解釈することに夢中になっているようです。多くのコンピューター化されたツールは、「p値」または「t値」の観点からテスト結果を報告します。 統計の最初のコースを受講する大学生に次の点をどのように説明しますか: テスト対象の仮説に関して、「p値」とはどういう意味ですか?高いp値または低いp値を探す必要がある場合はありますか? p値とt値の関係は何ですか?


10
平均のみを理解している人に共分散をどのように説明しますか?
...分散についての知識を直感的に増やすことができると仮定して(「分散」を直感的に理解する)、または「平均」からのデータ値の平均距離であり、分散は平方であるため単位、平方根を使用して単位を同じに保ちます。これは標準偏差と呼ばれます。 これが「レシーバー」によって明確に表現され、(できれば)理解されると仮定しましょう。共分散とは何ですか?数学用語/式を使用せずに単純な英語でどのように説明しますか?(つまり、直感的な説明。;) 注意してください:私は概念の背後にある式と数学を知っています。私は、数学を含めずに、同じことを分かりやすい方法で「説明」できるようにしたいと考えています。すなわち、「共分散」とはどういう意味ですか?

7
中心極限定理にはどのような直感的な説明がありますか?
いくつかの異なるコンテキストで、中央限界定理を呼び出して、採用したい統計的方法を正当化します(たとえば、二項分布を正規分布で近似します)。私は定理が真である理由に関する技術的な詳細を理解していますが、中央極限定理の背後にある直感を本当に理解していないことに気づきました。 それでは、中心極限定理の背後にある直観は何ですか? レイマンの説明が理想的です。技術的な詳細が必要な場合は、pdf、cdf、ランダム変数などの概念を理解しているが、収束の概念、特性関数、または測定理論に関係する知識はないと仮定してください。

15
標準偏差を計算するときにで除算するための直感的な説明
あなたがで二乗誤差の合計を割り、なぜ私はクラスで今日聞かれた代わりにとの、標準偏差を計算します。n − 1n−1n-1nnn 私は、私は(私は公平な推定に行きたいしませんでしたので)クラスでそれに答えるつもりはありませんと述べたが、その後、私は疑問に思った- があり、このための直観的な説明は?

9
マハラノビス距離の一番下の説明?
私はパターン認識と統計を研究しており、マハラノビス距離の概念にぶつかる主題について私が開くほとんどすべての本です。本は一種の直観的な説明を提供しますが、それでも私が実際に何が起こっているのかを実際に理解するには十分ではありません。誰かが「マハラノビス距離とは何ですか?」私は答えることしかできませんでした:「それはある種の距離を測定するこの素晴らしいことです」:) 定義には通常、固有ベクトルと固有値も含まれていますが、マハラノビス距離との接続には少し問題があります。固有ベクトルと固有値の定義を理解していますが、それらはマハラノビス距離とどのように関係していますか?線形代数などでベースを変更することに関係していますか? 私はまた、主題に関するこれらの以前の質問を読みました: マハラノビス距離とは何ですか?パターン認識でどのように使用されますか? ガウス分布関数とマハラノビス距離の直感的な説明(Math.SE) 私もこの説明を読みました。 答えは素晴らしく良いと絵ですが、まだ私はしていない、本当に私はアイデアを持っているが、それは暗闇の中で、まだだ...それを得ます。誰かが「おばあちゃんにそれをどのように説明しますか」という説明を与えることができますか?:)それはどこから来たのですか、何で、なぜですか? 更新: マハラノビスの式を理解するのに役立つものを次に示します。 https://math.stackexchange.com/questions/428064/distance-of-a-test-point-from-the-center-of-an-ellipsoid

3
なぜ確率空間を定義するためにシグマ代数が必要なのですか?
サンプル空間形成するさまざまな結果を使用したランダムな実験があり、イベントと呼ばれる特定のパターンに興味を持って調べますシグマ代数(またはシグマフィールド)は、確率測定を割り当てることができるイベントで構成されています。nullセットとサンプル空間全体の包含、ベン図表との結合と交点を記述する代数など、特定のプロパティが満たされています。 Ω,Ω,\Omega,F。P ∅ F.F.\mathscr{F}. PP\mathbb{P}∅∅\varnothing 確率は、代数と区間間の関数として定義されます。全体で、トリプルは確率空間を形成します。σσ\sigma[0,1][0,1][0,1](Ω,F,P)(Ω,F,P)(\Omega, \mathscr{F}, \mathbb{P}) 誰かが代数を持っていなかった場合に確率構造が崩壊する理由を簡単な英語で説明できますか?それらは、その書道「F」がありえないほど真ん中に押し込まれています。それらが必要だと信じています。イベントは結果とは異なることがわかりますが、\ sigma-代数がなければ何がおかしくなりますか?σσ\sigmaσσ\sigma 問題は、どのタイプの確率問題において、σσ\sigma代数を含む確率空間の定義が必要になるかです。 ダートマス大学のWebサイトにあるこのオンラインドキュメントは、わかりやすい英語の説明を提供します。アイデアは、単位周囲の円上で反時計回りに回転する回転ポインターです。 まず、図に示すように、単位円の円とポインターで構成されるスピナーを作成します。円上の点を選択してにラベルを付け、次に、円上の他のすべての点に、から反時計回りに測定した距離(など)のラベルを付けます。実験では、ポインターを回転させ、ポインターの先端にあるポイントのラベルを記録します。ランダム変数にこの結果の値を示します。サンプル空間は明らかに間隔000xxx000XXX[0,1)[0,1)[0,1)。各結果が等しく発生する可能性がある確率モデルを構築したいと思います。可能性のある結果の数が限られている実験で[...]のように進めた場合、可能性のある結果のすべてについて確率の合計がそうでないため、確率を各結果に割り当てる必要があります等しい1(実際、数え切れない数の実数を合計するのは難しい仕事です;特に、そのような合計が何らかの意味を持つためには、せいぜい数え切れないほどの被加数の多くがと異なる場合があり。)割り当てられた確率の全ては、その後、合計があり、 ではなくそれがあるべきように、。000000000000111 したがって、各ポイントに確率を割り当て、(数え切れないほど)無限の数のポイントがあるとすると、それらの合計はます。>1>1> 1

9
期待値最大化を理解するための数値例
EMアルゴリズムを十分に把握して、実装して使用できるようにしています。私は丸1日、理論と、レーダーからの位置情報を使用して航空機を追跡するためにEMが使用される論文を読みました。正直なところ、私は根本的なアイデアを完全に理解しているとは思わない。簡単な問題(ガウス分布や正弦波系列のシーケンスの推定、線のフィッティングなど)のためのEMの数回の反復(3-4)を示す数値例を誰かに教えていただけますか。 誰かが(合成データを使用して)コードの一部を指し示すことができたとしても、そのコードをステップスルーしてみることができます。

3
ユニットルートの直感的な説明
ユニットルートテストのコンテキストで、ユニットルートとは何かを直感的にどのように説明しますか? 私はこの質問で設立したように説明する方法で考えている。 ユニットルートの場合は、ユニットルートテストが時系列の定常性をテストするために使用されることを(少しだけですが)知っていますが、それだけです。 素人に、または非常に基本的な確率と統計学のコースを学んだ人にどのように説明しますか? 更新 ここで尋ねたことを最も反映しているので、私はwhuberの答えを受け入れました。しかし、私はここに来たすべての人に、パトリックとマイケルの答えも読むことをお勧めします。彼らはユニットルートを理解する上で自然な「次のステップ」だからです。数学を使用しますが、非常に直感的な方法です。

4
カーネルとは何ですか?
多くの機械学習分類子(サポートベクターマシンなど)では、カーネルを指定できます。カーネルとは何かを説明する直観的な方法は何でしょうか? 私が考えていた1つの側面は、線形カーネルと非線形カーネルの違いです。簡単に言えば、「線形決定関数」と「非線形決定関数」について言えます。しかし、カーネルに「決定関数」を呼び出すことが良いアイデアかどうかはわかりません。 提案?



弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.