(以下の答えは、[0]で証明された定理を単に紹介し、述べています。その論文の美しさは、ほとんどの議論が基本的な線形代数に関して作られていることです。この質問に答えるには、主な結果を述べるだけで十分ですが、必ず、元のソースを確認してください)。
データの多変量パターンによって記述することができる任意の状況でk変量楕円分布、統計的推論は、定義により、フィッティング(及び特徴付ける)の問題を低減するk変量の位置ベクトル(例えばθ)およびkによってのk対称半正定行列(たとえばΣ)をデータに。多くの場合、分解するよりも分かりやすい理由から、私は、以下の説明(しかし、あなたはすでに前提として想定している)Σ形状部品(と同じサイズのSPSDマトリックスにΣあなたの多変量分布の密度輪郭の形状を占めます)スカラーσS これらの輪郭のスケールを表現します。
一変量データ(にk=1)、Σの形状成分を、以下の議論から続くように、データの共分散行列は、スカラーであり、Σその結果1であるΣそのスケール成分等しいΣ=σS常にとあいまいさはありません。
多変量データでは、スケーリング機能の多くの選択肢σS可能です。特にワン()鍵となる望ましい適切性を持つことで際立っている。これにより、楕円ファミリのコンテキストでのスケーリング係数の優先選択になります。σS=|ΣΣ|1/k
MV統計の多くの問題には、R k × kの function(al)対称半正定値として定義され、以下を満足する散布行列の推定が含まれます
。ΣRk×k
(非特異行列の Aとベクトル B)。たとえば、共分散の古典的な推定値は(0)を満たしますが、決して唯一のものではありません。
(0)Σ(AX+b)=AΣ(X)A⊤
Ab
すべての密度等高線が同じ形状行列で定義された楕円であり、スカラーによる乗算までの楕円分布データが存在する場合、次の形式のの正規化バージョンを考慮するのが自然です。Σ
VS=Σ/S(Σ)
ここで、は次の条件を満たす1固有関数です。S
(1)S(λΣ)=λS(Σ)
すべての。次いで、V Sは、形状(ショート状マトリックス中の)散乱行列の成分と呼ばれるσ S = S 1 / 2(Σは)散乱行列のスケール成分と呼ばれます。損失関数が形状成分V Sを介してΣのみに依存する多変量推定問題の例には、球形度、PCA、CCAなどのテストが含まれます。λ>0VSσS=S1/2(Σ)ΣVS
もちろん、多くの可能なスケーリング関数があるので、正規化関数いくつかの選択の(ある場合)が何らかの意味で最適であるという問題は未解決のままです。例えば:S
- (たとえば、OPの質問の下のコメントで@amoebaが提案したもの。[1]、[2]、[3]も参照)S=tr(Σ)/k
- ([4]、[5]、[6]、[7]、[8])S=|Σ|1/k
- (共分散行列の最初のエントリ)Σ11
- (の最初の固有値 Σ)λ1(Σ)Σ
ただし、は、局所的に漸近的に正常なファミリーのスケールと形状の対応する推定値のフィッシャー情報行列がブロック対角である唯一のスケーリング関数です(つまり、推定問題のスケールと形状の成分は漸近的に直交します)[0 ]。これは、とりわけ、スケール汎関数S = | Σ | 1 / kは唯一の選択肢であるSの非仕様れるσ Sは上で推論を行う際、効率の損失が生じないV S。S=|Σ|1/kS=|Σ|1/kSσSVS
(1)を満たす多くの可能な選択肢のいずれについても、比較的強力な最適性の特性化については知りません。S
- [0] Paindaveine、D。、形状の標準的な定義、Statistics&Probability Letters、Volume 78、Issue 14、2008年10月1日、2240-2247ページ。ゲートなしのリンク
- [1] Dumbgen、L.(1998)。タイラーの高次元の散乱のM関数について、アン。研究所 統計学者。数学。50、471–491。
- [2] Ollila、E.、TP Hettmansperger、およびH. Oja(2004)。アフィン同変多変量符号法。プレバス、ユバスキュラ大学。
- [3] DE、タイラー(1983)。散布マトリックスの堅牢性と効率特性、Biometrika 70、411–420。
- [4] Dumbgen、L.、およびDE Tyler(2005)。いくつかの多変量M-Functional、Scandのブレークダウンプロパティについて。J.スタティスト。32、247–264。
- [5] Hallin、M.およびD. Paindaveine(2008)。散布の均一性に対する最適なランクベースのテスト、Ann。統計。、表示されます。
- [6] Salibian-Barrera、M.、S。Van Aelst、およびG. Willems(200 6)。高速で堅牢なブートストラップを備えた多変量MM推定器に基づく主成分分析、J。Amer。統計学者。連合 101、1198–1211。
- [7] Taskinen、S.、C。Croux、A。Kankainen、E。Ollila、およびH. O ja(2006)。分散行列と形状行列に基づく正準相関とベクトル推定の影響関数と効率、J。Multivariate Anal。97、359–384。
- [8] Tatsuoka、KS、およびDE Tyler(2000)。非楕円分布の下でのS-FunctionalsとM-functionalsの一意性について 統計学者。28、1219–1243。