変位値と中央値ではなく、触覚と中央値をいつ使用しますか?


14

WikipediaやWolfram Mathworldで、触覚または中間の定義を見つけることはできませんが、Bílková、D. and Mala、I.(2012)、 " 所得分布をモデル化するときのLモーメント法の適用チェコ共和国で」、オーストリア統計局誌41(2)、125–132。

中央値は、サンプルの中央値が50 %のサンプルクォンタイルの値に等しいのと同様に、50(サンプル)のサンプルの値です。サンプルタンタイルとサンプルクォンタイルは、順序付けられたサンプルに基づいています。まず、順序付けられたサンプルの観測値の累積合計が評価​​されます。その後、所定の割合のためのp0 < P < 100、A tantileは、2つの部分に順序付けられたサンプル中のすべての観測を分割分析変数の値として定義される:小さいか等しい観測値の和である観測値の合計のと、より大きい観測値の合計は、残差を表します50p0<p<100p 100 p pp100pこの合計の。

従来の中央値やその他の変位値ではなく、これらを位置の尺度として使用するのが適切な場合はいつですか?考えられる状況の1つである家計収入は、その論文に記載されています。

この定義から、中間を収入のレベルの合理的な特性として使用できることがわかります。これは、収入が中間以下の世帯はサンプルの総収入の半分を受け取り、収入が高い世帯は半分を受け取るためです。他の半分を受け取る内側より。

この場合、家計収入の中央値はCZK 117,497(すなわち、これよりも多く稼いだ家計の半分と上記で稼いだ半分)であることが判明しました。総収入)。この比較は、必ずしも家計所得の歪度や不均一性を反映するものではないことに注意してください。家計所得が均一に分布していても、中央値は中央値より上にあります。私の定義を理解する限り、すべての世帯が同じ収入を受けた場合にのみ、中央値は中央値に等しくなります。

この場合、内側を好む特定の理由がありますか、それとも少なくとも補助的な手段として使用する理由がありますか?中央値と中央値の比較から正確に何がわかりますか?中央値は、先ほど述べた理由により、中心傾向の他の測定値に直接匹敵するものではないようです。中間/触覚が広く使用されている、または特に有益であると見なされている他の状況はありますか?サンプル研究論文でそれらが使用される実際の例は非常に歓迎されるでしょう、そして、それらが有用であると証明するかもしれないより広い文脈の直観的な考えはさらに良いでしょう。

合計と小計が意味のあるものである必要があります-お金に関連しているように見え、「パイ」がどのように分布しているのでしょうか?以下のために集中的ではなく、広範囲の性質例えば密度や温度など、合計の任意の並べ替えは、物理的に意味がないであろう。輸送物の分析者が、輸送される貨物の重量がカットオフであり、すべての貨物の50%(重量で)その重量以上の荷重で運ばれますが、生態学者がイモリの長さがどのくらいで、すべてのイモリの全長の50%がその長さ以上のイモリによってもたらされることに興味があるとは考えられません。


3
@NickCox私が理解する限りでは、中央値はカットオフ値を与えます。大まかに言えば(私はタイの問題を完全に無視しています)、半分の世帯がカットオフより多くを受け取り、半分の世帯がそれよりも少ないを受け取ります。中央値は異なるカットオフを与え、カットオフ以上の収入を受け取る世帯の総収入全収入の50%を占める一方で、カットオフ以下の収入を受け取る世帯の総収入はすべての収入の50%を占める。
シルバーフィッシュ

2
ちょっとしたヒント:以前の私の質問についての @ttnphnsのコメントの後、私はこれから興味津々になりました。平均(算術、幾何、調和、累乗、指数、組み合わせなど)は「分析平均」です。中央値、分位数、触覚は「位置平均」です。
シルバーフィッシュ

4
ありがとう。私はこれを読み違え、訂正に感謝します。「観測の合計」は「観測の数」に近すぎるので、「観測の合計」から「値の合計」に言い換えます。あるいは、言い訳に手を伸ばすかもしれません…。ローレンツ曲線との関係があるはずです。メジャーは、関係する変数が概念的に加算的または広範囲である場合にのみ有用と思われます。サー・デビッド・コックスは、変数が広範囲であるかどうかの重要性をしばしば強調します。したがって、総収入、総降雨量を考慮することは実質的に理にかなっていますが、総ログ収入や総気温は考慮しません。
ニックコックス

2
@NickCox拡張性は素晴らしい点だと思います(そして、あなたの提案された言い直しも私の意見では改善されたでしょう)。たとえば、輸送される貨物の重量がカットオフであるため、すべての貨物の50%(重量)がその重量以上の荷物で運ばれることに興味があるかもしれません。しかし、すべてのイモリの全長の50%がその長さ以上のイモリによってもたらされるようなイモリの長さに関心があるとは想像できません。
シルバーフィッシュ

1
私は実際には同意しますが、原則が影響を受けるとは思いません。「しかし、それは興味深くも有用でもないだろう」という答えは、必ずしも数学的または統計的原理の何らかの表示である必要はありません。また、「それをしないでください!」の範囲もあります。
ニックコックス

回答:


3

これは本当にコメントですが、コメントするには長すぎます。「タンタイル」の定義を明確にしようとしています(中央値に類似したp=0.5場合)。LET X密度関数を有する(簡単にするために)絶対連続確率変数でありf(x)。我々は仮定する期待μ=EX一体化されてい存在するμ=xf(x)dバツ収束します。定義し、同様に累積分布関数、「累積期待機能」を持つ(私は、このような概念を見たことがない、それが正式な名前を持っていますか?)で

Gt=tバツfバツdバツ
その場合、「タンタイル」は方程式 G t = μ / 2の解tです。Gt=μ/2

この解釈は正しいですか?これは意図したものですか?

元の質問に戻ると、所得分布の文脈では、総収入の半分はその収入を超える人々に、総収入の半分はその収入を下回る人々に当てはまるような所得の値です。

EDIT

Gt

Gtt

このアイデアに使用される別の用語は「部分的な期待」です。たとえば、https://math.stackexchange.com/questions/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r を参照して、googleを使用してください

バツ>0

Fkバツ=1Eバツk0バツtkftdt
kGt=μF1tF1FF0
{あなたはLあなたは}={あなたはvあなたは=Fバツv=F1バツ;バツ0}


1
追加してくれてありがとう-私はそれのルックスでいくつかの読書をしなければならないつもりです!
シルバーフィッシュ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.