Ziliak(2011)は、p値の使用に反対し、いくつかの代替案に言及しています。彼らは何ですか?


25

「Matrixx v。SiracusanoおよびStudent v。Fisher 統計的有意性」(DOI:10.1111 / j.1740-9713.2011.00511.x)と呼ばれる、統計的推論のためにp値に依存するデメリットを議論する最近の記事では、 Stephen T. Ziliakは、p値の使用に反対しています。最後の段落で彼は言う:

データは、私たちがすでに知っていることの1つであり、確かです。私たちが実際に知りたいのは、まったく異なるものです。データが与えられた場合、仮説が真である(または少なくとも実用的に有用である)確率です。入手可能な証拠があれば、2つの薬物が異なる確率、およびその程度を知りたいと思います。転置された条件の誤fall、フィッシャーが陥ったtrapに基づいた有意性テストは、その確率を教えてくれません。パワー関数、予想損失関数、およびスチューデントとジェフリーズから派生した多くの意思決定理論およびベイジアン手法は、現在広く利用可能でオンラインで無料です。

べき関数、予想損失関数、および「その他の決定理論およびベイズ法」とは何ですか?これらの方法は広く使用されていますか?Rで利用できますか?これらの新しい推奨方法はどのように実装されますか?たとえば、これらの方法を使用して、従来の2標本のt検定とp値を使用するデータセットで仮説をテストする方法を教えてください。


値のみの使用に反対する多くの論文がありますが、それは本当にコンテキスト、IMOに依存します。興味のあることについての詳細を追加していただけますか(最後の文を参照)。p
chl

2
私はこの記事にアクセスできませんが、この議論は何が起こっているのかというかなり不完全な理解を示しています。理解に欠陥があるにもかかわらず、他の統計は考慮に値するという結論は妥当です。予想損失関数は、損失関数の予想の単なる推定です(たとえば、二乗誤差、ロジスティックなど)。
イテレーター

以下のために最近掲載されている同様のスレッドは、私が上でこのスレッドに関する問い合わせ提起したメタCV
紙魚

回答:


17

これは、混乱した個人による別の強い紙のように聞こえます。フィッシャーはそのようなstudentsには陥りませんでしたが、統計学の多くの学生はそうしました。

仮説検定は、決定論的な問題です。一般的に、2つの決定の間に所定のしきい値(仮説が真または仮説が偽)のテストになります。などの単一の点に対応する仮説がある場合、データが真である場合に結果として生じる確率を計算できます。しかし、それが単一のポイントではない場合はどうしますか?θの関数を取得します。仮説θ 0はそのような仮説であり、真であると仮定すると、観測データを生成する確率についてそのような関数を取得します。その関数はべき関数です。とても古典的です。フィッシャーはそれについてすべて知っていました。θ=0θθ0

予想される損失は、決定理論の基本的な仕組みの一部です。自然のさまざまな状態、およびそれらから生じるさまざまな可能なデータ、および可能ないくつかの可能な決定があり、データから決定までの良い機能を見つけたいと考えています。どのように良いと定義していますか?取得したデータの根底にある特定の自然の状態と、その手順による決定を考えると、予想される損失は何ですか?これはビジネス上の問題で最も簡単に理解されます(過去3四半期に見た売上に基づいてこれを行う場合、予想される金銭的損失はどれくらいですか?)。

ベイジアン手順は、決定論的手順のサブセットです。予想される損失は、些細な場合を除くすべての場合に一意に最適な手順を指定するには不十分です。状態AとBの両方で1つの手順が別の手順よりも優れている場合、明らかにそれを好むでしょうが、1つが状態Aで優れ、1つが状態Bで優れている場合、どちらを選択しますか?これは、ベイズ手順、ミニマキシティ、偏りのない補助的なアイデアが入る場所です。

ttαβpαp

また、FisherがStudentの作品の広範な普及に責任を負っていることを考慮して、彼がStudentとJeffreysを一緒に名付ける理由についても少し混乱しています。

基本的に、p値の盲目的な使用は悪い考えであり、それらはかなり微妙な概念ですが、それはそれらを無用にしません。数学的な背景が貧弱な研究者による悪用に反対すべきでしょうか?もちろん、しかし、フィッシャーがフィールドの男性が使用するために何かを蒸留しようとする前に、それがどのように見えたか覚えておいてください。


5
質問に実際に回答するための+1、および挑発的であるが問題のある見積りに挑戦するための追加(ただし仮想)+1。あなたはここの最近の参加者であることがわかりますが、すでに多くの回答を提供しています:多くの感謝と歓迎(少し遅れて)私たちのサイトに!
whuber

詳細な回答をありがとうございます。その論文で批判的に提案されている代替戦略を考えるのに役立ちます。この質問をしたのは、一部の同僚がこの論文を使用してp値をまったく見るべきではないと言っており、これらの選択肢が実際に何を意味するのか理解していないことに気付いたからです。ご説明いただきありがとうございます!
アリエル

@whuberこれは質問にまったく答えるとは思わない。OPはZiliakが提案している代替案について尋ねていましたが、この答えはそれらに対処していません。たとえば、Ziliakの重要性の批判は、なぜ人々が5%または1%の重要性を使用するのかについて触れています。確かな理由はまったくなく、彼はこれらのレベルをフィッシャーの論文まで追跡することができました。これは、任意の便利な数字です。金銭的利益、すなわちドル価値に基づく「代替」アプローチとは対照的。
アクサカル

1
@Aksakal私は、仮説検定を意思決定論的問題に関連付け、p値を期待リスク(0-1損失関数に基づいて)に明示的に接続することにより、会話に重要な貢献ができると考えています。
whuber


5

EZの使用時にパッケージには、尤度比を提供しezMixed()混合効果モデリングを行うための機能を。尤度比は、2つのモデルの尤度(観測されたデータが与えられた場合)を比較することにより、現象の証拠を定量化することを目的としています。現象。モデルの微分複雑度の観測尤度を修正した後(クロス検証に漸近的に相当する赤池の情報量基準を使用)、この比率は現象の証拠を定量化します。


4

すべての代数が鉛筆で利用できるのと同じ意味で、これらのテクニックはすべてRで利用できます。Rの多くのさまざまな関数を介してp値を使用することもでき、p値またはベイジアン事後関数を取得するために使用する関数を決定することは、単一の関数またはパッケージへのポインターよりも複雑です。

これらの手法について学び、実際に答えを求めている質問を決定したら、R(または他のツール)を使用してそれを行う方法を確認できます(または、さらにヘルプを提供できます)。損失関数を最小限に抑えたい、または事後分布を取得したいということは、夕食に何を食べたいか尋ねられたときに「食べ物」と答えるのと同じくらい便利です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.