一部の統計記号に「平方」があるのはなぜですか(例:分散)


7

統計で、「2乗」されたシンボルに遭遇することがあります。他の領域では、たとえば力学のように、通常の文字に関心のある数量を指定してから、式を定義して、関心のある数量が通常の文字として左側に並ぶまで並べ替えることができます。式。例は、時間と速度移動した後の位置です。xtv

x=vt

ただし、統計では、2乗された数量が左側に表示されることがあります。これは、結果をさらに解釈するために使用されるためです。

  1. 期待値がE [X] = µの確率変数の分散:σX2XE[X]=µ

    σX2=E[(Xµ)2]

    ここでは、四角形のエンティティが数式の左側に立っています。

  2. 統計学者によって常に「R 2乗」と呼ばれることさえある決定係数R2。頻繁に使われるのに、なぜ「普通の」手紙を送らないのですか?

  3. 遺伝率は、遺伝学に起因する変動量と環境に起因する変動量との比をとる場合に、遺伝学に採用される尺度です。量的形質P(たとえば、成長の高さ)は、遺伝子型効果Gおよび環境効果E(すべての確率変数)に応じて、次のようにモデル化されます。

    P=G+E

    広義の遺伝率H2が定義されていますH2=Var(G)/Var(P) [ソース]

    誰もHに興味がなく、H ^ 2だけH2です。

この慣習の意味は何ですか?それは統計学者に何を伝えますか?または、いくつかの無関係な原因がありますか?


5
必要に応じて、分散ではなく標準偏差を報告できます。stats.stackexchange.com/questions/118/…stats.stackexchange.com/questions/83347/…を参照してください。四角には魔法はありません。単純にいくつかの二乗値は意味があり、操作に適しています。さらに、たとえばではなくを使用する方が直接的なため、 ...σ2ξ=σ2ξ=σ
Tim

6
表記法は、論理ではなくエチケットの一部であり、専用の履歴が示すように、乱雑に進化しました。特に便利なアルファベットはすでに過負荷になっているので、可能な限り少ない表記法を使用することが明確な基準です(同じ議論で確率、予測子の数、および値に取り組む必要がありましたか?)。歴史的に、相関は、その二乗が有用で興味深いという認識に先行しました。また、(ほとんど)分散に対するストレスは、標準偏差またはその倍数に対するストレスに続きました。したがって、それらの場合、既存のシンボルに四角を追加することは理にかなっています。P
Nick Cox

回答:


6

一方で我々は、多くの異なる式を分析するかもしれない、我々は統計で見つけること、第二モーメントは特別な場所を持っていることがわかり...

物理学におけるよりも統計で...多分もっと特別な場所(また時には「回転半径」例えば、同様に簡単にするために正方形の用語を使用する。そしてまた、「のような用語瞬間慣性のは」どちらも完全です単純化された用語であり、統計用語がその起源の二乗を含むのと同じように、その起源モーメントを含みます。さらに、物理学者はような単純さをますが、統計学者も同様です...)rg2=h2π

しかし、これらの平方項を使用する理由(たとえば、、次の場合に代わりに「定数」を含むと簡単に見なされます。括弧から外します)。歴史的な理由で簡単に見つけることができます(xσ)2σ2σ


h2およびR2

この初期のCV質問に対するニックコックスの回答を介して、決定係数(R-squared)の作成者または発明者は誰ですか?歴史が今期に大きな影響を与えたことがわかります。そして、これはだけの問題ではなく、という用語は同じ人物によって「発明」されたものです。グーグルで記事検索をご覧ください:R2h2

https://scholar.google.com/scholar?q="degree+of+determination"&as_ylo=1918&as_yhi=1924

Sewall Wrightが「決意の度合い」の概念の最初の説明に多くのことをしたことがわかります。彼はそれをと両方を別の乗で表現しました1)相関係数、および2)遺伝または同等の相関係数(Nick Cox:Wright 1920で言及されたものより前の出典を参照) 。R2h2Rh

Mordecai Ezekiel 1929のような記事では、相関係数の意味と意義について、かなり長い間、あらゆる種類の式を相関係数とともに使用していることがわかります(特定のサンプル記事では、、、、脇からの明示的な表記作られ、の重要な(私たちはどのような種類のを考慮する必要があり、選択のこの自由を、提供していない物理学をモーメント、ファースト、セカンド、サード、またはそれらの関数、または中央値のような何かが、特定の分布または状況を説明するのに最適です)。r2r1r211r2r2r2

ライト1934からのすばらしい概観で「経路係数の方法」は彼が提案します

「二乗された経路係数は、したがって、決定係数と呼ばれることがある。そのような係数は、経路係数という用語が平方根に適用される前に使用された。」

人々は二乗の定義を使い続けましたが。たぶん、この「経路係数の方法」はあまり好まれなかったでしょう。なぜなら、誰が最近これを教えているのか、そして他のどのような統計学の達人がこれらの定義を使っているのでしょうか?

1934年のライトのこの概要では、相関係数の2乗を使用しているが、「決定」に関連する用語はまだ使用していない1918年の記事への参照も見つかります。


σ2

この用語は、そのように使用されることはほとんどありません。そして代わりにそれが使用されます

  • 方程式の左辺に四角なしσ=E[(Xμ)2]
  • または「分散」という用語に置き換えられます。典型的な式はです。Var(X)

    もう1つの既存の式は(古いテキストで広く使用されています)です。下付き文字はモーメントの順序を示します。したがって、(またはより良い)は最初の生モーメントまたは平均であり、下付き文字2は二次モーメント(中央の二次モーメントの場合の分散)を意味し、下付き文字3は三次モーメントを意味します、....、などμ2μ1=μμ1=μ

    (この記号問題は、 vsがrawと中央を区別するために存在する場合でも、モーメント、たとえば中央または未加工が定義されている時点が不明確であることです。記号 for平均は実際には同じ問題を抱えていますが、あいまいさはほとんどの場合それほど関連がないように非常に標準になっています)μ2μμμ

まあ、この項目の下のこの大きなテキストは、が多くの科学者や統計学者にとってより簡単である理由を少し説明しています。それでもやに、歴史的な起源があります。興味深い読み物:σ2h2R2

  • ピアソン1894数学的進化論への貢献。ある時点で、標準偏差は実際にはとして記述されσ=μ2
  • Airy 1861(代わりに文字を使用し、平均二乗の説明エラーを使用しますが、異なる、非二乗、概念の平均エラー推定エラーとも比較しますcσ
  • フィッシャーは1920年に、との違いを、最初の中心モーメント「平均誤差」または2番目の中心モーメント「平均二乗誤差」のいずれかで推定された未知のを調べます。σ1σ2σ
  • ウィキペディア(2017年10月19日)によると、フィッシャーは最初に「分散」という用語を使用しました。

    「したがって、変動の原因を分析するには、標準偏差の2乗を変動の尺度として扱うことが望ましい。この量を分散と呼ぶことにする」

    記事を読むと、彼はしばしば方程式の左辺に分散を置き、それを文字表していることがわかります。の文字の使用は、数学統計学の研究において、今日でもまだ一般的です。この記事では、彼はしばしばを使用していますが、それは簡単にするためです。Fermatの定理が代わりにような項で書かれたと想像してください。このようにして、方程式の単純化により、が強化されます。をで置き換えることが必ずしも有用であるとは限らないことに注意してください。計算が約ことを示す必要がある場合がありますVVσ2c=an+bnncn=an+bnσ2σ2Vσ2。例えば1918年の記事で式1より明確である、場合、何それはについてですが、式の中で明示的に書かれています。σ2=a2V=a2σ

  • フィッシャーよりも前に、「変動性」についての言及があります:1916ジェームズジョーストン(有機変動の数学理論)は、ガウス分布に関連した変動の概念を説明しています。「偏差の二乗」または「二乗の偏差」に関連して、以前のソースがいくつか見つかります。「二乗偏差」の初期の使用における興味深い参照の1つは、フランシスイシドロエッジワース(1917)で、脚注で代わりに「変動」について語っています。σ2


1

狭義の遺伝率が示されため人(ないように注意してください誰が、Felsenstein、2016章。IX、問題7を参照)最初のシンボルに導入添加遺伝的効果との相関のためにと表現型、 加法成分と表現型h2hxz=x+e

h=corr(x,z)=Cov(x,z)Var(x)Var(z)=Cov(x,x+e)Var(x)Var(z)=Var(x)Var(x)Var(z)=Var(x)Var(z)
xzが共に正常である場合、表現型(ブリーダー方程式に現れる選択への応答を決定する遺伝率) での加法遺伝成分または育種値の回帰の勾配は、。xz
βx|z=Cov(x,y)Var(z)=Var(x)Var(z)=h2.
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.