タグ付けされた質問 「nonparametric」

このタグを使用して、ノンパラメトリックメソッドまたはパラメトリックメソッドの性質、またはその2つの違いについて尋ねます。ノンパラメトリック法は一般に、基礎となる分布に関するいくつかの仮定に依存していますが、パラメトリック法は、少数のパラメーターでデータを記述することを可能にする仮定を行います。

3
Kolmogorov-Smirnovテストが機能するのはなぜですか?
2標本KS検定について読んで、私は正確に理解し、それが何をしているのかが、私は理解していないそれが動作する理由。 つまり、すべての手順に従って経験分布関数を計算し、2つの間の最大差を見つけてD統計値を見つけ、臨界値を計算し、D統計値をp値に変換することができます。 しかし、なぜこの2つが実際に2つのディストリビューションについて何かを教えてくれるのか、私にはわかりません。 誰かがロバを飛び越えてどれだけ速く逃げるかを数える必要があることを簡単に教えてくれるかもしれません。速度が2 km / hr未満の場合は、帰無仮説を拒否します。確かに私はあなたが私に言ったことをすることができますが、そのどれが帰無仮説と関係がありますか? 2サンプルKSテストが機能するのはなぜですか?ECDF間の最大差の計算は、2つの分布の違いと何の関係がありますか? どんな助けも大歓迎です。私は統計学者ではないので、可能であれば私は馬鹿だと仮定します。

4
Tukey HSDのノンパラメトリックな同等物はありますか?
JMPを使用して、コントロールを使用した3つの処理の前後に、成長形態グループ(樹木、低木、樹木など)の植生被覆の違いを調べています。サンプルサイズが小さく(n = 5)、ほとんどの分布は通常分布していません。 正規分布の場合、ANOVAを使用して治療結果の差(変化率)を分析し、Tukey HSDを使用して結果のペア間の差の有意性をテストしました。 非正規分布データの場合、Wilcoxon / Kruskal-Wallis検定を使用しました。これらの結果のペアの違いを調べるために使用できる、Tukey HSDのノンパラメトリックな同等物はありますか?

5
ノンパラメトリックテストは正確に何を達成し、結果をどうしますか?
私はこれが他の場所で尋ねられたかもしれないと感じていますが、実際に私が必要とする基本的な説明のタイプではありません。ノンパラメトリックは、比較するために平均ではなく中央値に依存していることを知っています...何か。また、標準偏差ではなく「自由度」(?)に依存していると思います。私が間違っている場合は修正してください。 私はかなり良い研究をしてきたので、コンセプト、その背後にある仕組み、テスト結果が本当に意味すること、および/またはテスト結果をどう処理するかを理解しようとして考えました。しかし、誰もその地域に進出することはないようです。 簡単にするために、Mann-WhitneyのU検定に固執しましょう。これは非常に人気があることに気づきました(また、「正方形のモデルを円の穴に入れる」ために誤用され、過度に使用されているようです)。他のテストについても自由に説明したい場合は、一度理解すれば、他のテストもさまざまなt検定などに類似した方法で理解できます。 データでノンパラメトリックテストを実行し、この結果を取得したとしましょう。 2 Sample Mann-Whitney - Customer Type Test Information H0: Median Difference = 0 Ha: Median Difference ≠ 0 Size of Customer Large Small Count 45 55 Median 2 2 Mann-Whitney Statistic: 2162.00 p-value (2-sided, adjusted for ties): 0.4156 私は他の方法に精通していますが、ここで何が違うのですか?p値を.05より低くする必要がありますか?「マン・ホイットニー統計」とはどういう意味ですか?それに用途はありますか?ここでのこの情報は、私が持っている特定のデータソースを使用する必要があるかどうかを確認するだけですか? 私は回帰と基本の合理的な量の経験を持っていますが、この「特別な」ノンパラメトリックなものに非常に興味があります。 私が5年生だと想像して、あなたがそれを私に説明できるかどうか確かめてください。

1
相互作用を含めることができる2因子ANOVAのノンパラメトリックな同等物は何ですか?
こんにちは、相互作用を含めることができる双方向ANOVA(3x4設計)のノンパラメトリックな同等物を見つけようとしています。Zar 1984「生物統計学的分析」の私の読書から、これはシャイラー、レイ、およびヘア(1976)で述べられた方法を使用して可能ですが、オンラインの他の投稿によると、この方法はもはや適切ではないと推測されましただった)。 誰がそれを行うのに適切な方法を知っていますか?もしそうなら、RまたはStataの対応する機能は?


3
非線形相関を検出するためのMICアルゴリズムは直感的に説明できますか?
最近では、2つの記事を読みました。1つ目は相関の履歴に関するもので、2つ目は最大情報係数(MIC)と呼ばれる新しい方法に関するものです。変数間の非線形相関を推定するMICメソッドを理解することに関して、あなたの助けが必要です。 さらに、Rでの使用方法については、著者のWebサイト(ダウンロード)で確認できます。 これがこの方法を議論し理解するための良いプラットフォームになることを願っています。この方法の背後にある直感と、著者が述べたようにどのように拡張できるかを議論することへの私の関心。 " ... MIC(X、Y)からMIC(X、Y | Z)への拡張が必要です。MICの安定した推定値を得るために必要なデータの量、外れ値に対する影響の程度、3 -またはそれは欠場する高次元の関係、そしてより多くのMICは大きな前進ですが、取るために、より多くのステップがあります。」

1
2つのサンプルが同じ分布から抽出された場合のノンパラメトリック検定
サンプルまたは母集団の分布についての仮定を一切行うことなく、同じ母集団から2つのサンプルが抽出されるという仮説をテストしたいと思います。どうすればいいですか? ウィキペディアからの私の印象は、Mann Whitney Uテストが適切であるべきだということですが、実際には私にはうまくいかないようです。 具体的には、2つのサンプル(a、b)が大きく(n = 10000)、非正常(バイモーダル)の2つの母集団から抽出されたデータセットを作成しました。私はこれらのサンプルが同じ母集団からのものではないことを認識するテストを探しています。 ヒストグラムビュー: Rコード: a <- tibble(group = "a", n = c(rnorm(1e4, mean=50, sd=10), rnorm(1e4, mean=100, sd=10))) b <- tibble(group = "b", n = c(rnorm(1e4, mean=50, sd=3), rnorm(1e4, mean=100, sd=3))) ggplot(rbind(a,b), aes(x=n, fill=group)) + geom_histogram(position='dodge', bins=100) サンプルが同じ母集団からのものであるという帰無仮説を却下しなかったマン・ホイットニー検定は驚くほど(?)です。 > wilcox.test(n ~ group, rbind(a,b)) Wilcoxon rank sum …

3
ピアソンがパラメトリックでスピアマンがノンパラメトリックである理由
どうやらピアソンの相関係数はパラメトリックであり、スピアマンのローはノンパラメトリックです。 これを理解するのに苦労しています。私が理解しているように、ピアソンはr x y = c o v (X 、Y )として計算されます と我々は彼らのランクですべての値を代入以外スピアマンは、同じ方法で計算されます。rx y= c o v (X、Y)σバツσyrバツy=cov(バツ、Y)σバツσy r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} ウィキペディアによると パラメトリックモデルとノンパラメトリックモデルの違いは、前者には固定数のパラメーターがあり、後者にはトレーニングデータの量に応じてパラメーターの数が増えることです。 しかし、サンプル自体以外のパラメーターは表示されません。いくつかの発言パラメトリック検定は、正規分布を仮定し、するために行くことを言うピアソンは、通常の分散データを前提としないことが、私はピアソンはそれを必要とする理由を見ることができません。 だから私の質問は、統計の文脈でパラメトリックとノンパラメトリックが何を意味するのですか?そして、ピアソンとスピアマンはどうやってそこに収まるのでしょうか?

2
一般化された加法モデル—サイモンウッド以外の研究者は誰ですか?
私はGAMをますます使用しています。さまざまなコンポーネント(平滑化パラメーターの選択、さまざまなスプラインベース、平滑項のp値)の参照を提供しようとすると、それらはすべて1人の研究者(イギリスのバース大学のサイモンウッド)からのものです。 彼はmgcvR のメンテナーでもあり、彼は自分の仕事を実装しています。 mgcv非常に複雑ですが、非常にうまく機能します。 確かに古いものがあります。元のアイデアはHastie&Tibshiraniの功績によるものであり、2003年にRuppertらによって非常に古い教科書が執筆されました。 申請者として、私は学術統計学者の間で時代精神を感じていない。彼の作品はどのように見られていますか?1人の研究者が1つの分野でこれほど多くのことを行ったことは少し奇妙ですか?それとも、中に入れられないためにそれほど気づかない他の仕事がありmgcvますか?GAMがそれほど使用されているとは思いませんが、この資料は統計トレーニングを受けた人々にとっては合理的にアクセス可能であり、ソフトウェアは非常によく開発されています。「裏話」の多くはありますか? 統計ジャーナルからのパースペクティブの断片や他の同様のものの推奨は高く評価されるでしょう。

3
非正規分布サンプルの平均の信頼区間を計算するにはどうすればよいですか?
非正規分布サンプルの平均の信頼区間を計算するにはどうすればよいですか? ここではブートストラップ方式が一般的に使用されていることを理解していますが、他のオプションも受け入れています。ノンパラメトリックオプションを探していますが、パラメトリックソリューションが有効であることを誰かが私に納得させることができれば、それは問題ありません。サンプルサイズは400を超えています。 誰かがRでサンプルを提供できれば、とてもありがたいです。


2
カーネル密度推定を行うときにエパネニコニコフカーネルが理論的に最適である場合、なぜより一般的に使用されないのですか?
カーネル密度の推定を行う場合、少なくとも理論的な意味では、Epanechnikovカーネルが最適であることを(たとえば、ここで)読みました。これが本当なら、なぜガウス分布は密度推定ライブラリでデフォルトのカーネル、または多くの場合唯一のカーネルとして頻繁に表示されるのですか?

2
LOESSとLOWESSの違い
LOESSとLOWESSの違いは何ですか?ウィキペディアから、LOESSはLOWESSの一般化であることがわかります。それらはわずかに異なるパラメーターを持っていますか?

3
5つの数字の要約のみが知られている2つの分布の統計的検定
5つの数値の要約(最小、1番目の四分位数、中央値、3番目の四分位数、最大)とサンプルサイズのみがわかっている2つの分布があります。ここでの質問に反して、すべてのデータポイントが利用できるわけではありません。 2つの基礎となる分布が異なるかどうかを確認できるノンパラメトリック統計テストはありますか? ありがとう!

4
主観的なランク順の結果をどのようにグラフ化しますか?
ノンパラメトリックテストとは別に、主観的なランキングを視覚化する方法を探しています。 12人の参加者に、さまざまな主観的基準(それぞれのランキングを個別にランク付け)に従って8種類のアイテムをランク付けするように依頼しました。ランキングの個々のセットについて、ランキングの高レベルの傾向を視覚化する良い方法を探しています。 私は平均ランキングで棒グラフとレーダープロットの両方を試しましたが、他の人がランキングごとの応答数について散布図/バルーンプロットを使用しているのを見たことがありますが、何が最良の概要を伝えるかはよくわかりません。8つの平均ランキング、またはアイテムごとの各ランキングの8つのカウントを使用できます。 編集: 例:各列はアイテムであり、各行は8つのアイテムのそれぞれの人のランキングです。この例では特に強力な合意ではありませんが、一般的に全体的な傾向を伝える最良の方法を理解したいと考えています。 Item: A B C D E F G H Rater: 1 6 8 1 7 3 4 2 5 2 1 3 8 7 6 5 2 4 3 5 8 7 6 1 4 2 3 4 5 8 7 6 4 2 1 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.