統計的および数学的概念はまったく同じであり、「家族」はさまざまな状況に適応した技術的なバリエーションを含む一般的な数学用語であると理解しています。
パラメトリックファミリは、すべての分布の空間内の曲線(または表面またはその他の有限次元の一般化)です。
この投稿の残りの部分では、その意味を説明します。余談ですが、これについては、数学的にも統計的にも論争の的になるとは思いません(以下で説明する小さな問題は別として)。この意見を支持して、私は多くの参考文献(主にウィキペディアの記事)を提供しました。
この「ファミリ」という用語は、関数のクラスをセットYまたは「マップ」に学習するときに使用される傾向があります。ドメインを考えるとX、家族F上のマップのXはパラメータいくつかのセットでΘ(「パラメータ」)は関数でありますCYYX FX Θ
F:X×Θ→Y
(1)それぞれについて、、関数Fは、 θ:X → Yで与えられるF θ(X )= F(X 、θは)であるC Y及び(2)F自体は、特定の"ナイス"特性を有します。θ∈ΘFθ:X→YFθ(x)=F(x,θ)CYF
「スムーズ」または制御された方法でからYに関数を変更するという考え方です。プロパティ(1)手段各そのθ指定するような機能、性質の詳細(2)中の「小さな」変化センス捕捉する一方θ誘導に十分に「小さい」変化Fの θを。XYθθFθ
質問で言及されたものに近い標準的な数学的例はホモトピーです。この場合、はトポロジ空間Xからトポロジ空間Yへの連続マップのカテゴリです。Θ = [ 0 、1 ] ⊂ Rは、その通常のトポロジーを有する単位間隔である、と我々は必要Fがあること連続トポロジカル製品からマップX × ΘにY。「マップFの連続的な変形」と考えることができます。CY XYΘ=[0,1]⊂RFX×ΘYに F 1。」 X = [ 0 、1 ]の間隔自体は、そのようなマップは、カーブにおける Yとホモトピーは、1つの曲線から別へのスムーズな変形です。F0F1X=[0,1]Y
統計的用途のために、 上のすべてのディストリビューションの集合であるR(又は、実際には、上のR nは、いくつかのためのN、私はに焦点を当てる暴露簡単保つために、N = 1)。我々は、すべての非減少のセットでそれを識別してもよい右連続左極限の機能R → [ 0 、1 ]、それらの範囲の閉鎖は、両方を含む0と1:これらは累積分布関数、または単に分布関数。したがって、X = RおよびCYRRnnn=1R→[0,1]01X=R。Y=[0,1]
分布のファミリーは、サブセットです。CY 家族の別名は統計モデルです。 観測を支配すると思われるすべての分布で構成されていますが、それ以外の場合は実際の分布であるかはわかりません。
- 家族は空にすることができます。
- 自体は家族です。CY
- ファミリは、単一のディストリビューションで構成される場合と、有限数のディストリビューションで構成される場合があります。
これらの抽象的な集合論的特性は、比較的興味や実用性がほとんどありません。この概念が有用になるのは 、追加の(関連する)数学的構造を考慮するときだけです。しかし、C Yのどのプロパティが統計的に重要ですか?頻繁に表示されるものは次のとおりです。CYCY
ある凸集合:与えられた二つの分布 F、 G ∈ C Y、我々は形成していてもよい混合分布(1-T) F +T G ∈Yの全てに対してT∈[0、1]。これはFからGまでの一種の「ホモトピー」です。CYF,G∈CY (1−t)F+tG∈Yt∈[0,1]FG
大部分は、Kullback-Leibler発散や密接に関連するFisher Informationメトリックなど、さまざまな疑似メトリックをサポートしています。CY
添加物の構造を有する任意の二つの分布に対応するFとGはそれらの合計であり、 F ⋆ G。CYFGF⋆G
は、多くの場合「プロパティ」と呼ばれる多くの便利で自然な機能をサポートします。これらには、任意の固定分位数(中央値など)およびキュムラントが含まれます。CY
は関数空間のサブセットです。 このように、それは、次のような多くの有用なメトリック、継承のsupノルム( L ∞によって与えられた規範を) | | F−G | | ∞ = SUP のx ∈ R | F(x)−G(x) | 。CYL∞
||F−G||∞=supx∈R|F(x)−G(x)|.
Rに対する自然なグループアクションは、C Yに対するアクションを誘発します。最も一般的なアクションは、翻訳T μ:X → X + μとスケーリングS σ:X → X σためのσ > 0。分布に対するこれらが持つ効果は、送信することであるFをで与えられる分布Fのμ 、σ(X )= F ((X - μ )RCY Tμ:x→x+μ Sσ:x→xσσ>0F。これらは、ロケーションスケールファミリとその一般化の概念につながります。(詳細なWeb検索ではさまざまな定義が見つかるため、参照は提供していません。少なくとも、ここでは少し議論の余地があるかもしれません。)Fμ,σ(x)=F((x−μ)/σ)
重要なプロパティは、統計的な問題とデータの分析方法によって異なります。 前述の特性によって提案されたすべてのバリエーションに対処するには、この媒体にはスペースがかかりすぎます。1つの一般的な重要なアプリケーションに焦点を当てましょう。
たとえば、最尤法を考えます。 ほとんどのアプリケーションでは、Calculusを使用して推定値を取得できます。これが機能するためには、家族の中で「デリバティブを取る」ことができなければなりません。
(余談技術:これが達成された通常の方法は、ドメインを選択することであるのためのD ≥ 0と指定する連続、局所的に可逆関数PからΘをにC Y。(この手段をそのすべてのためのθ ∈ Θがボールが存在するB (θ 、ε )と、ε > 0に対してpは| B (θ 、ε ):Θ⊂Rdd≥0pΘCYθ∈ΘB(θ,ϵ)ϵ>0一対一です。言い換えれば、 θを十分に小さく変更すると、常に異なる分布が得られます。)p∣B(θ,ϵ):B(θ,ϵ)∩Θ→CYθ
その結果、ほとんどのMLアプリケーションでは、Θコンポーネントでが連続的であることが必要です(できれば、ほぼどこでも微分可能です)。(連続性がないと、尤度を最大化することは一般に難治性の問題になります。)これにより、パラメトリックファミリの次の尤度指向の定義が得られます。pΘ
(一変量)分布のパラメトリックファミリーは、局所的に可逆マップであるとΘ ⊂ R nは、そのための()各F θそれぞれに対する分布関数と、(b)は、X ∈ R、関数L X:θ → [ 0 、1 ]で与えられるLの X(θ )= F(X 、θ )
F:R×Θ→[0,1],
Θ⊂RnFθx∈RLx:θ→[0,1]Lx(θ)=F(x,θ) 連続的で、ほとんどどこでも微分可能です。
パラメトリック家族という注意より多くののちょうどコレクションよりもFの θ、それはまた、パラメータ値の特定の方法が含ま:θ分布に対応します。FFθθ
いくつかの実例を挙げてみましょう。
してみましょうすべての集合とする正規分布。 与えられているように、これはパラメトリックファミリではありません。単なるファミリです。パラメトリックにするには、パラメーター化を選択する必要があります。一つの方法は、選択することであるΘ = { (μ 、σ )∈ R 2 | σ > 0 }
とマッピングする(μ 、σ )の平均の正規分布にμ
及び分散σ 2。CYΘ={(μ,σ)∈R2∣σ>0}(μ,σ)μσ2
一連のポアソンの分布を(λ)有するパラメトリックファミリーである。λ∈Θ=(0,∞)⊂R1
制服のセットの分布は、(多くの教科書の演習で目立つ特徴がある)とパラメトリック家族である
θ ∈ R 1。この場合、F θ(X )= 最大(0 、分(1 、X - θは))で微分可能であるθを除い
θ ∈ { X 、X - 1 }。(θ,θ+1)θ∈R1Fθ(x)=max(0,min(1,x−θ))θθ∈{x,x−1}
ましょうとGが可能任意の二つの分布。次いで、F(X 、θ )= (1 - θ )F (X )+ θ G (X )のためのパラメトリックファミリーであるθ ∈ [ 0 、1 ]。(証明:の画像Fは、分布の集合であり、その偏微分θは等しい- F (X )+ G (FGF(x,θ)=(1−θ)F(x)+θG(x)θ∈[0,1]Fθこれはどこでも定義されています。)−F(x)+G(x)
ピアソンファミリーは、四次元のファミリーであり、(とりわけ)正規分布、ベータ分布、および逆ガンマ分布を含みます。これは与えられた分布が多くの異なる分布ファミリーに属するかもしれないという事実を例証します。これは、(十分に大きい)空間内の任意のポイントが、そこで交差する多くのパスに属している可能性があることを観察することに完全に類似しています。これは、以前の構成と一緒に、どの分布もそれが属するファミリーを一意に決定しないことを示しています。Θ⊂R4
すべての有限分散絶対連続分布の族はパラメトリックではありません。証明はトポロジの深い定理を必要とします。私たちは与える場合C Yをして任意のトポロジ(統計学的に有用かどうか)とP :Θ → C Yが連続しており、ローカル連続逆を持っている、そしてローカルC Yが同じ次元を持つ必要がありますΘ。ただし、統計的に意味のあるすべてのトポロジでは、C Yは無限次元です。CYCYp:Θ→CYCYΘCY