Thetaはどういう意味ですか?


16

私は統計の初心者で、これを見つけまし

統計では、小文字のギリシャ文字「シータ」であるθは、一般的な確率分布のパラメータ(のベクトル)の通常の名前です。一般的な問題は、シータの値を見つけることです。この方法でパラメーターに名前を付けることには意味がないことに注意してください。他の名前を付けることもできます。実際、多くのディストリビューションには、通常他の名前が付けられたパラメーターがあります。たとえば、正規分布の平均と偏差にμ(読み取り: 'mu')と偏差σ( 'sigma')をそれぞれ付けるのが一般的な使用法です。

しかし、私はまだそれが平易な英語で何を意味するのか分かりませんか?


10
θは単なる数学記号であり、異なるコンテキストで異なることを意味します。推定されるパラメータを参照するためにが使用されることもありますが、「とは何ですか?」という質問に対する本当の答えはありません。それは「文字Aとは何ですか?」と尋ねるようなものです。リンクは、「この方法でパラメーターに名前を付けることに意味がないことに注意してください。他の名前を付けることもできます。」θθθ
マクロ

統計パラメーター(この「パラメーター」に関連付けられた数量の分布を定義する)に特殊文字(英字以外)を付ける単なる方法です。
Stat-R

4
私たちのほとんどはこの引用を非常に単純な英語とみなしますが、進歩を進めるためには、質問が英語の読み方に関するものではないことを受け入れなければなりません。それでは、それは何でしょうか?私は、引用文の技術用語を説明するように求めていることを提出します。それは、統計的に開始されていない人にとってどれほど奇妙であるかがわからないほど慣れている用語です。これには、分布パラメーターの意味に対応する必要があります(分布の; 適合曲線または他の決定論的モデルではありません)。
whuber

回答:


31

これは慣習ではありませんが、多くの場合、は分布のパラメーターセットを表します。θ

これは普通の英語の場合でした。代わりに例を示しましょう。

例1.昔ながらの画thumb(丸い底の大きな画t)のスローを勉強したいとします。それが落ちる確率は、と呼ぶ未知の値であると仮定します。ランダム変数を呼び出して、画が下に下がると、上に下がるとと言うことができます。モデルを書きますθXX=1X=0

Pバツ=1=θPバツ=0=1θ

そして、あなたは推定に興味があるでしょう(ここでは、画thumbが落ちる可能性が低下しています)。θ

例2.放射性原子の崩壊を調べたいとします。文献に基づいて、放射能の量が指数関数的に減少することがわかっているので、指数関数的な分布で崩壊までの時間をモデル化することにします。が崩壊までの時間である場合、モデルはt

ft=θeθt

ここで、は確率密度です。つまり、原子が時間間隔崩壊する確率はです。繰り返しますが、(ここでは、崩壊率)を推定することに興味があります。T T + D T F T D 、T θfttt+dtftdtθ

例3.計量機器の精度を調べたいとします。文献に基づいて、測定値がガウス分布であることがわかっているので、標準の1 kgの物体の重量を次のようにモデル化することにします。

fバツ=1σ2πexp{バツμ2σ2}

ここで、はスケールで与えられる尺度、f x は確率密度、パラメーターはμσであるため、θ = μ σ です。パラメーターμはターゲット重量(μ 1の場合はスケールにバイアスがかかります)、σはオブジェクトを計量するたびのメジャーの標準偏差です。繰り返しますが、θ(ここでは、スケールのバイアスと不正確さ)の推定に興味があります。バツfバツμσθ=μσμμ1σθ


1
+1 FWIW、私は最近stats.stackexchange.com/a/34894で同じ行に沿って実際の例を投稿しました。「平易な英語」と解釈するのは誤解を招くかもしれませんが、専門用語を使用することを恥ずかしがりません。パラメータ化された分布ファミリと連携して、データに基づいた推定値を生成します。一部の人にとっては、これはあなたの答えへの有益な補助かもしれません。
whuber

1
素晴らしい答えです!ただし、mu!= 1の場合、スケールにバイアスがかかっていると述べると混乱します。実際、「正規化」すると、標準正規分布はx〜N(0、1)になります。または、英語では、mu = 0および分散= 1です。たとえば、en.wikipedia.org / wiki /…を
マイクウィリアムソン

1 kgの物体を測定するときに1 kg以外の何かを示す場合、その機器にはバイアスがあるということです。「スケール」という言葉は紛らわしいかもしれません。ここでは、機器を指定するだけです。
gui11aume

3

を参照して、使用しているものをモデルに依存します。たとえば、通常の最小二乗回帰では、従属変数(通常Yと呼ばれる)を1つ以上の独立変数(通常Xと呼ばれる)の線形結合としてモデル化し、θ

Y=b0+b1バツ1+b2バツ2++bpバツp

ここで、pは独立変数の数です。ここでは、推定すべきパラメータはあるθは、すべての名前であるβ 。しかし、θはより一般的であり、推定する任意のパラメーターに適用できます。βsθβsθ


3
ピーター、あなたはこれを正確に言わなかったが、この答えは、シンボル常にパラメーターベクトルを参照するという誤った印象を初心者に与える可能性があり、逆に、これがパラメーターを参照する唯一の方法であると思う値。上記の私のコメントが示すように、答えは「θは数学記号」にすぎず、実際には統計的な問題ではないと思います。θθ
マクロ

1
@Macroこの文脈では、これがカミルスキーが望んだの意味であることは明らかだと思います。確かに、どのシンボルも何でも参照できます。しかし、この段落では、マクロは経済学のコースではなく、SASの一部ではなく、あなたを意味します。θ
ピーターフロム-モニカの復職

1
わかりました、私は類推が本当に適切であるとは思いませんが、誇張の試みとしてそれを取ります。いずれにせよ、数学の初心者はしばしば表記を本質的に意味のあるものとは異なるもの、つまり単なるラベルと誤解するという、非常に基本的なものを本当に参照しています。私のポイントは、この答え(意図せずに考えている)はその考えを払拭するものではないということでした。ご存じのように、は統計学者が遭遇する可能性のある他のものを指すことができます。たとえば、角度はしばしばθで示されます。θθ
マクロ

4
この説明は明確で技術的には正しいものの、いかなる分布も明示的に含んでいないため、質問の引用には関係がないように見えます。
whuber

1

平易な英語で:

統計分布は数学関数であり、分布fを持つランダム変数Xの異なる値の確率を示します。つまり、f x xの確率を出力します。さまざまなそのような関数がありますが、今はfをある種の「一般的な」関数と考えてみましょう。f バツffバツバツf

ただし、ユニバーサル、つまり異なるデータ(類似のプロパティを共有する)に適用できるものであるためには、異なるデータに適合するように形状を変更するパラメーターが必要です。このようなパラメーターの簡単な例は、正規分布のμです。これは、この分布の中心(平均)がどこにあるかを示すため、異なる平均値を持つランダム変数を記述することができます。正規分布には別のパラメーターσがあり、他の分布にもそのようなパラメーターが少なくとも1つあります。パラメーターはよくθと呼ばれます。正規分布では、θμσの両方の省略形です。fμσθθμσ(つまり、2つの値のベクトルです)。

重要な理由 統計分布は、データの経験的分布を近似するために使用されます。あるグループの年齢のデータセットがあり、平均して50歳であり、正規分布を使用して年齢の分布を概算するとします。正規分布が異なるμの値を許可しなかった場合(たとえば、このパラメーターの固定値、たとえばμ = 0)、このデータには役に立たないでしょう。ただし、μは固定されていないため、正規分布はμの異なる値を使用でき、μ = 50がその1つです。これは簡単な例ですが、より複雑な場合には、θμμ=0μμμ=50パラメータはそれほど明確ではないため、統計ツールを使用して θ値を推定(最適な値を見つける)する必要があります。θθ

したがって、統計は、データが与えられたときに最適な値を見つけるθことに関するものであると言えます(ベイジアンは言う:データと事前分布が与えられた場合)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.