タグ付けされた質問 「nonparametric」

このタグを使用して、ノンパラメトリックメソッドまたはパラメトリックメソッドの性質、またはその2つの違いについて尋ねます。ノンパラメトリック法は一般に、基礎となる分布に関するいくつかの仮定に依存していますが、パラメトリック法は、少数のパラメーターでデータを記述することを可能にする仮定を行います。

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

2
二元配置分散分析(3x3)のノンパラメトリック
私の従属変数は連続的で、非正規です(Shapiro-Wilkテストによると左に歪んでいます)。私は2つの独立した変数を持っています(色別のグループ、食品の種類)。各独立変数には3つのレベルがあります。各独立変数の観測数は等しくありません。 私はフリードマン検定やシャイラーレイヘア検定などのノンパラメトリック検定を調べましたが、どちらも適切ではないようです(観測数が異なるため)。 誰かが提案できる代替テストはありますか?SASを使用しています。

2
ユーザー設定のテスト
M1とM2の2つの方法を比較するユーザーテストを生成しました。私は40のテストケースを生成し、テストケースの各メソッドの結果を20人の個人に並べて表示します。個人は、どのメソッドからどのような結果が得られたかがわかりません。各テストケースについて、M1によって計算された結果が優れているか、M2が優れているか、それとも同等に優れているかを各人が言わなければなりません。 M1がM2よりも良いかどうか知りたい。すべての結果を合計して、3-Dヒストグラムを生成し、M1に投票し、同点に投票し、M2に投票します。 M1とM2を2次元ヒストグラムとしてのみ見た場合。M1とM2が同等に優れていれば、このヒストグラムは均一になることを知っています。次に、テストを実行します。χ2χ2\chi^2 モデル化の方法がわからないのは同点投票です。私が考えた2つのオプションは次のとおりです。 カイ2乗検定の基本は、ヒストグラムが相互に排他的であり、合計が1になることです。引き分けの票は2つに分割され、M1とM2のそれぞれに追加されます(引き分けは削除されます)ようですが、これはあまり原則的ではないようです。 もう1つのオプションは、関連付けを無視することです。「1つに追加」プロパティを壊すため、欠陥があるようです。たとえば、(M1:2、ties:98 M2:0)の場合、両方の方法の差は統計的に有意ではありません。 他に何ができますか?私はこれを間違って見ていますか?これは、ユーザーの投票をモデル化するときに人々が直面する一般的な問題のようです。絆をモデル化する正しい方法は何ですか?

4
正規分布を仮定せずに外れ値を見つける
サイズが40〜50ポイントの小さなデータセットがあります。データが正規分布であると想定せずに、少なくとも90%の信頼度で外れ値を見つけたかったのです。私は箱ひげ図がそれを行うための良い方法であるかもしれないと思いました、しかし私はわかりません。 助けてくれてありがとう。 また、boxplot実装では、プロットを描画する以外に、外れ値を明示的に出力する実装を見つけることができませんでした。

3
変換後もまだ正常ではないデータで分散分析を行う方法は?
私は、3つの異なる時点での敗北と挟み込みの主観的な評価に、敗北と挟み込みを誘発する状態が及ぼす影響を調べています。 ただし、主観的な評価は通常は分散されません。私はいくつかの変換を行いましたが、平方根変換が最もうまく機能しているようです。ただし、正規化されていないデータの側面がまだいくつかあります。この非正規性は、最高の敗北と捕獲の評価があると予想した時点で、高捕獲高敗北条件の負の歪度として現れます。その結果、このスキューは実験的な操作によるものであると主張することができると思います。 操作を考慮して、正規性の欠如にもかかわらず、このデータに対して分散分析を実行することは許容されますか?それともノンパラメトリック検定がより適切でしょうか?もしそうなら、4x3混合ANOVAの非パラメトリックな同等物はありますか?


2
Rで可能なすべての組み合わせのいくつかを取得するにはどうすればよいですか?
場合によっては、データの可能なすべての組み合わせを調べて、平均間の観察された差異をテストできる経験的分布を構築することにより、正確なテストを実行したい場合があります。可能な組み合わせを見つけるには、通常、combin関数を使用します。選択機能により、可能な組み合わせの数がわかります。組み合わせの数が非常に大きくなるのは非常に簡単で、combin関数の結果を保存することは不可能です。そこで、架空の「スタック」から一度に1つずつ値を提供するために、combin関数と同じロジックを実行するオブジェクトを作成してみました。ただし、この方法(私がインスタンス化したもの)は、妥当な組み合わせサイズでのCombnよりも50倍も遅くなります。 Combnで使用されるアルゴリズムよりもこのようなことを行うためのより良いアルゴリズムはありますか?


1
ロジスティック回帰は「セミ​​パラメトリック」モデルですか?
最近、質問の回答に「セミパラメトリック」という用語が含まれていますが、この用語の意味がよくわかりません。 ウィキペディアは言う 統計では、セミパラメトリックモデルは、パラメトリックコンポーネントとノンパラメトリックコンポーネントを持つ統計モデルです。 また、例としてコックス比例ハザードモデルを示します。 Cox比例ハザードモデルとロジスティック回帰は非常に似ていると思いますが、なぜ1つはセミパラメトリックであるが、もう1つではないと言うのですか? ところで私はこの答えを見つけました、GLMはセミパラメトリックモデルではないと言います。

1
ウィルコクソン順位和検定の実行中に変数を制御するにはどうすればよいですか?
ウィルコクソン順位和検定を行って、2つのグループの変数分布に違いがあるかどうかを調べました。テスト結果は、違いが存在することを示しました。X1X1X_1 しかし、この違いを引き起こしている交絡変数があるのではないかと思います。X2X2X_2 をどのように制御できますか?X2X2X_2 シナリオ例: ジョーは、男性と女性のリスニング能力に違いがあるかどうかを知りたいと考えています。ジョーは、「年齢」は彼の研究において交絡変数である可能性があると考えています。彼は「年齢」をコントロールしたいと思っています。ジョーが実行できるノンパラメトリックテストはありますか?

1
経験分布関数の定義を理解する方法
私は、ラリー・ワッサーマンによるすべてのノンパラメトリック統計を読んでいます。12ページで、彼は経験的分布関数を次のように定義しています。 経験分布関数 プット質量そのCDFである各データポイントで。正式にはFn^Fn^\hat{F_n}1n1n\frac{1}{n}XiXiX_i Fn^(x)=1n∑i=1nI(Xi≤x)Fn^(x)=1n∑i=1nI(Xi≤x)\hat{F_n}(x)=\frac{1}{n}\sum^{n}_{i=1}I(X_i\le x) どこ I(Xi≤x)={10if Xi≤xif Xi>xI(Xi≤x)={1if Xi≤x0if Xi>xI(X_i\le x)=\left\{\begin{matrix} 1& if\ X_i \le x\\ 0 & if \ X_i>x \end{matrix}\right. 私の質問は: が質量と呼ばれるのはなぜですか?1n1n\frac{1}{n} CDFは質量を各データポイント、私の理解では、それはなるはず。1n1n\frac{1}{n}XiXiX_i1nX1+1nX2+...+1nXn1nX1+1nX2+...+1nXn\frac{1}{n}X_1+\frac{1}{n}X_2+...+\frac{1}{n}X_n なぜですか?この式は、各インジケーター関数に質量しますが、は設定しないと思います。Fn^(x)=1n∑ni=1I(Xi≤x)Fn^(x)=1n∑i=1nI(Xi≤x)\hat{F_n}(x)=\frac{1}{n}\sum^{n}_{i=1}I(X_i\le x)1n1n\frac{1}{n}I(Xi≤x)I(Xi≤x)I(X_i \le x)XiXiX_i 「データポイントごとに」何かを「プット」することの意味は何ですか?

1
予測不確実性を伴うノンパラメトリック非線形回帰(ガウスプロセス以外)
トレーニングセットのサイズがバニラGPで禁止され始めたが、それでもそれほど大きくない場合、予測の不確実性を伴うノンパラメトリック非線形回帰のためのガウスプロセス(GP)の最新の代替手段は何ですか? 私の問題の詳細は: 入力空間は低次元です(、)X⊆RdX⊆Rd\mathcal{X} \subseteq \mathbb{R}^d2≤d≤202≤d≤202\le d \le 20 出力は実数値です()Y⊆RY⊆R\mathcal{Y} \subseteq \mathbb{R} トレーニングポイントは、標準のGP(近似なし)で処理できるものよりも1桁程度大きい103≲N≲104103≲N≲10410^3 \lesssim N \lesssim 10^4 近似する関数f:X→Yf:X→Yf: \mathcal{X} \rightarrow \mathcal{Y}はブラックボックスです。連続性と滑らかさの相対的な程度を仮定できます(たとえば、GPには\ nu = \ frac {5} {2}の Matérn共分散行列を使用しますν=52ν=52\nu = \frac{5}{2}) クエリされた各ポイントについて、近似は予測の平均と分散(または不確実性の類似の測定)を返す必要があります 1つまたはいくつかの新しいトレーニングポイントがトレーニングセットに追加されたときに、メソッドが比較的高速(数秒程度)で再トレーニング可能である必要があります どんな提案も歓迎します(メソッドへのポインタ/言及と、それがうまくいくと思う理由)。ありがとうございました!
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.