タグ付けされた質問 「chi-squared」

テスト(通常、分布、独立性、または適合度)またはそのようなテストに関連する分布のファミリー。

1
いかがですか
私は統計学の真新しいので、分割テスト(A / Bおよび多変量)の背後にある数学を勉強しています。与えられたテストデータを使用してを計算する方法を学びました。これをテーブルを介して確率に変換する方法を理解しましたが、自分で確率を計算できるようにしたいと思います。オンラインでいくつかの説明を読みましたが、理解できません。χ2χ2\chi^2 これを分解するリソースまたは本を誰か知っていますか?

1
ギャンブルマシン検証の統計
問題は、政府が電子ルーレットを閉鎖することを望んでおり、ルーレットが統計的検定で失敗したと主張していることです。 私の言語では申し訳ありませんが、これはスロベニアの法律から可能な限り翻訳された公式の(法律による)要件は次のとおりです。 各イベントの頻度は、予想される頻度と3シグマを超えてはなりません。 正規分布のカイ二乗検定は0.025のリスクレベル内にある必要があります 連続相関の検定は、3シグマ検定とカイ2乗検定に合格する必要があります。 最初の2つの要件をテストし、それらはテストに合格しましたが、3番目の要件を理解するのに問題があります。(これは翻訳されており、「連続した相関」は別のものになる可能性があることに注意してください) 3番目の要件をテストするにはどうすればよいですか? 誰かが興味を持っている場合のデータ:http : //pastebin.com/ffbSKpr1 編集:カイ二乗は2%の確率で失敗します(アルファが0.025であるために予想されることです)、sigma3テストは5%失敗しますが、3sigmaでは9%の失敗が予想されます(それに従って周波数が分散されていないようです)乱数でも正規分布) 私はこの法則を正しく理解していないかもしれませんが、すべての自己相関ベクトルに対して3シグマテストに合格する確率はほぼ0%です。 Pythonコード: from math import sqrt from itertools import * import random #uncoment for python 2.x #zip = izip #range = xrange #with open("rng.txt","r") as wr: # n = [int(i) for i in wr] n = [random.randint(0,36) for i …

1
カイ2乗GOFテストに使用するビンの数をどのように選択しますか?
私は放射性崩壊に関する物理学研究室の開発に取り組んでおり、私が取ったサンプルデータを分析する際に、驚いた統計の問題に遭遇しました。 放射線源による単位時間あたりの崩壊数がポアソン分布であることはよく知られています。ラボが機能する方法は、学生が時間枠ごとの崩壊の数を数え、それを何度も繰り返すことです。次に、カウント数でデータをビニングし、χ2χ2\chi^2推定された1つのパラメーター(平均)を使用した適合度検定。帰無仮説(データは、推定された平均値を持つポアソン分布から得られたもの)が成り立つかどうかを確認します。うまくいけば、彼らは大きなp値を取得し、物理学が実際に機能すると結論付けます(そうです)。 データをビニングした方法がp値に大きな影響を与えることに気付きました。たとえば、非常に小さなビンを多数選択した場合(たとえば、整数ごとに個別のビン:78カウント/分、79カウント/分など)、小さなp値が得られ、帰無仮説を拒否する必要があったでしょう。 。ただし、データをより少ないビンにビニングした場合(たとえば、スタージのルールで指定されたビンの数を使用:)、はるかに大きなp値が得られ、帰無仮説は拒否されませんでした。1 + l og2(N)1+log2(N)1+log_{2}(N) 私のデータを見ると、非常にポアソン分布されているように見えます(予想されるカウント/分とほぼ完全に一致しています)。とはいえ、平均値から非常に離れたビンには数カウントがあります。つまり、非常に小さなビンを使用して統計を計算する場合、次のようないくつかの項があります: これにより、統計が高くなり、p値が低くなります。予想通り、予想される値がそれほど低くならないため、ビンの幅が大きくなると問題はなくなります。χ2χ2\chi^2(O b s e r v e d− Ex p e c t e d)2Ex p e c t e d=(1 − 0.05)20.05= 18.05(Observed−Expected)2Expected=(1−0.05)20.05=18.05\frac{(Observed-Expected)^2}{Expected} = \frac{(1-0.05)^2}{0.05}=18.05χ2χ2\chi^2 質問: GOFテストを実行するときにビンサイズを選択するための良い目安はありますか?χ2χ2\chi^2 この異なるビンサイズの結果の不一致は、私が知っておくべきことでしたか*または、提案されたデータ分析でいくつかのより大きな問題を示していますか? - ありがとうございました *(私は学部で統計学のクラスを受講しましたが、それは私の専門分野ではありません。)

3
ビン化されたデータを使用した指数分布のパラメーターの推定
指数分布でモデル化できる次のデータがあります Time 0-20 20-40 40-60 60-90 90-120 120-inf Frequency 41 19 16 13 9 2 データが指数分布に従うかどうかをテストするために、カイ2乗検定統計量を使用します。しかし、このためにラムダも計算する必要があります()。ML E=1バツ¯MLE=1X¯MLE = \frac{1}{\bar X} したがって、私の質問は、最後の間隔が120から無限大の場合、間隔の中間点をどのように選択すればよいですか。

2
このカイ二乗検定結果を再現できますか?
時が経つにつれてSkeptics.StackExchange、答えは電磁過敏症への研究を引用しています: McCarty、Carrubba、Chesson、Frilot、Gonzalez-Toledo&Marino、Electromagnetic Hypersensitivity:Evidence for a New Neurological Syndrome International Journal of Neuroscience、00、1–7、2011、DOI:10.3109 / 00207454.2011.608139。 使用されている統計の一部について疑わしいので、それらが適切に使用されていることを再確認する専門知識に感謝します。 図5aは、電磁場発生器がオンになったときに被験者が検出を試みた結果を示しています。 簡略版は次のとおりです。 Actual: Yes No Detected: Yes 32 19 No 261 274 彼らはカイ二乗検定を使用したと主張し、有意性を見出した(pが何であるかを述べずにp <0.05)。 フィールドの存在下と不在下での体性反応と行動反応の頻度は、カイ2乗検定(2×2テーブル)またはフィッシャーの正確確率検定のフリーマンハルトン拡張(2×3テーブル;フリーマン&ハルトン、1951年)。 いくつか問題があります。 彼らは一部のデータを除外しました-表5bを参照-長期間デバイスをオフにした。そのデータを分離することの正当性がわかりません。 彼らは、実際のデバイスがオンの場合は結果が統計的に有意であると主張しているようですが、そうでない場合はそうではありません。(私はこれを誤解しているかもしれませんが、はっきりしていません。)カイ2乗検定で得られる結果ではありませんか。 このテストをオンラインの計算機で再現しようとしたところ、統計的に重要ではないことがわかりました。 これが私の本当の質問です。私はこれを正しいと思いますか?:フィッシャーの正確確率検定を使用した両側カイ2乗検定は、このデータを分析する正しい方法であり、統計的に有意ではありません。

2
カイ二乗分布の制限が正規分布であるのはなぜですか?
私の教授はそれを主張しました limp→∞χ2plimp→∞χp2\lim_{p\to\infty}\chi^2_p正規分布があります。主張は中心極限定理に基づいて行われました:として、法線ます。この主張は、の限界だろうと私は、これが有効でも真であるかを確認していない左側のを、まだまた、右側に表示されます。さらに、とどちらも依存します...p→∞p→∞p\to\infty(pμ,p2σ2)(pμ,p2σ2)(p\mu, p^2\sigma^2)ppppppσ2σ2\sigma^2μμ\muppp 何が欠けているのか、この制限の分布をどのようにして納得させるのですか?


2
いかがですか
分布を理解しようとしています。ウィキペディアには、確率密度関数について次のグラフがあります。χ2χ2\chi^2 このグラフは、場合、PDFが無限になることを示しています。分布のモードはとして定義されるため、k = 1k=1 k = 1χ2χ2\chi^2M X { K - 2 、0 }max{k−2,0}max \{k − 2, 0\}f1(0 )= ?f1(0)=?f_1(0) = ? Web上の他のグラフでは、よりも高くなるように見えました。ここのように:111 もちろん、累積分布関数はすべての自由度でに近づきます。111 確率分布関数がどのでもあたりでそのように動作する理由がわかりません。分布は周りでどのように定義されていか?000kkkχ2χ2\chi^2000
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.