タグ付けされた質問 「spss」

SPSSは統計ソフトウェアパッケージです。このタグは、(a)質問の重要な部分または予想される回答としてSPSSを含み、(b)SPSSの使い方だけではないトピックに関する質問に使用します。

2
重要ではない結果を報告する必要がありますか?
私はクラスカルウォリス検定を実行しましたが、一部の質問ではp値は重要ではありません。これを有意であるのと同じ方法で報告し、df、検定統計量、p値を示しますか?したがって、このようなKruskal Wallis検定が実行されますが、結果は有意ではないことがわかりましたH(3)= 2.119、p> 0.05(または、ここに正確なp値(.548)を記載します)

4
LASSOで機能を選択するためのデータを準備するために欠損値を処理する方法は?
私の状況: 小さなサンプルサイズ:116 バイナリ結果変数 説明変数の長いリスト:44 説明変数は私の頭の上から来ていませんでした。彼らの選択は文献に基づいていた。 サンプルのほとんどの場合とほとんどの変数には欠損値があります。 選択した機能選択へのアプローチ:LASSO Rのglmnetパッケージではglmnetルーチンを実行できません。これは、明らかにデータセットに欠損値が存在するためです。欠落しているデータを処理するにはさまざまな方法があるようですので、知りたいのですが。 LASSOは、使用できる補完の方法に関して何らかの制限を課していますか? 補完法の最善策は何でしょうか?理想的には、SPSS(できれば)またはRで実行できるメソッドが必要です。 UPDATE1:以下の回答のいくつかから、補完法を検討する前に、より基本的な問題に対処していることが明らかになりました。それについてここに新しい質問を追加したいと思います。「該当なし」の値とグループラッソの使用法を処理するための定数値としてのコーディングと新しい変数の作成を示唆する答えについて: グループLASSOを使用すると、連続予測子に提案されたアプローチをカテゴリカル予測子にも使用できると思いますか?もしそうなら、私はそれが新しいカテゴリーを作成することと同等であると思います-これはバイアスを導入するかもしれないと警戒しています。 RのglmnetパッケージがグループLASSOをサポートしているかどうか誰かが知っていますか?そうでない場合、誰かがロジスティック回帰と組み合わせてそれを行う別のものを提案しますか?LASSOグループについて言及しているいくつかのオプションがCRANリポジトリにあります。私の場合に最も適切な提案はありますか?たぶんSGL? これは私の以前の質問に対するフォローアップです(ロジスティック回帰分析を実行するために、元の長いリストから変数のサブセットを選択する方法は?)。 OBS:私は統計学者ではありません。

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
因子分析で因子によって読み込まれるアイテム(変数)が2つ(またはそれ以下)だけであっても問題ありませんか?
SPSSで因子分析を行った20個の変数のセットがあります。研究のために、私は6つの要因を開発する必要があります。SPSSは、8つの変数(20のうち)が低い重みでロードされているか、いくつかの要因によって等しくロードされていることを示したため、それらを削除しました。残りの12個の変数は、6つの要素の2つのペアで読み込まれています。これは完全な構造です。私が望んでいたとおりですが、私と一緒に働いている教授の1人が、なぜ(またはどのような条件下で)正当化するのかを求めています因子分析は、因子ごとに3つ以上の項目がロードされた結果で有用であることが一般に知られているため、因子ごとに2項目のみを保持することが適切です。 誰かがこの問題について、できれば公開されたリファレンスも助けてくれますか?


3
ロジスティック回帰(SPSS)で非バイナリのカテゴリ変数を処理する方法
多くの独立変数を使用してバイナリロジスティック回帰を実行する必要があります。それらのほとんどはバイナリですが、一部のカテゴリ変数には3つ以上のレベルがあります。 そのような変数に対処する最良の方法は何ですか? たとえば、可能な値が3つある変数の場合、2つのダミー変数を作成する必要があるとします。次に、段階的な回帰手順では、両方のダミー変数を同時にテストするか、別々にテストする方が良いですか? SPSSを使用しますが、よく覚えていないので、SPSSはこの状況にどのように対処しますか? さらに、順序カテゴリカル変数の場合、順序スケールを再作成するダミー変数を使用するのは良いことですか?(例えば、プット4状態順序変数のための3つのダミー変数を用いた0-0-0レベルに対して、レベルについて2、レベルについて3及びレベルについて4、代わりに、、および4つのレベルのために)。1111-0-02221-1-03331-1-14440-0-01-0-00-1-00-0-1

2
尖度の定義とその解釈の違い
私は最近、SPSSとStataによって提供される尖度値に違いがあることに気づきました。 http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htmを参照してください 私の理解は、それゆえ同じものの解釈が異なるということです。 これに対処する方法に関するアドバイスはありますか?

4
Rの離散時間イベント履歴(生存)モデル
Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。 従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります:ID、Event(各time-obsで1または0)およびTime Elapsed(観測の開始以降)、および他の共変量。 モデルに合うようにコードを書くにはどうすればよいですか?従属変数はどれですか?Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか?必要ですか? ありがとう。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R線形回帰のカテゴリ変数「非表示」の値
これは私が何度か遭遇した例にすぎないため、サンプルデータはありません。Rで線形回帰モデルを実行する: a.lm = lm(Y ~ x1 + x2) x1は連続変数です。x2カテゴリ型で、「低」、「中」、「高」の3つの値があります。ただし、Rによって与えられる出力は次のようになります。 summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 私は、Rがそのような要因(要因x2であること)に何らかのダミーコーディングを導入していることを理解しています。私はただ疑問に思っていx2ます。「高」の値をどのように解釈しますか?たとえば、ここで示した例の「High」x2は応答変数にどのような影響を与えますか? これの例を他の場所(例:ここ)で見ましたが、理解できる説明は見つかりませんでした。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
各被験者ごとに複数のデータポイントを正しく処理する方法
私は現在、各被験者の複数の測定値を含むデータを正しく処理する方法についてsomeoeと議論しています。この場合、各被験者のさまざまな状態について、短時間で各被験者のデータが収集されました。すべての測定値は、正確に同じ変数を収集します。 現在の1つのオプションは、データを条件ごとにグループ化することであり、複数のデータポイントが1つの対象からのものであることを気にしないことです。ただし、各被験者のデータポイントはおそらく完全に独立しているわけではありません。 他の選択肢は、最初に各被験者から各状態のすべての測定値の平均を取り、次に平均を比較することです。ただし、最終分析では平均の誤差が少ないことが考慮されないため、これはおそらく重要性に影響を与えます。 どのようにしてそのようなデータを正しく分析できますか?これはSPSSで何らかの形で処理されますか?原則として、平均を計算するときに、最終的な分析でこれを考慮するよりも、エラーマージンを計算することは可能ですが、SPSSが何らかの形でこの計算を背後で行っているとは思いません。

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

3
ピアソンの相関と線形回帰によるボンフェローニ補正
私は5つのIV(5つの性格特性、外向性、快適さ、良心、神経症、開放性)について、PCTに対する態度、CBTに対する態度、PCTに対する態度、CBTに対する統計を実行しています。他にどのような影響があるかを確認するために、年齢と性別も追加しました。 私は、性格特性がDVの態度を予測できるかどうかをテストしています。 私は最初にすべての変数にピアソンの相関を使用しました(45テスト)。 主な発見は、外向性がPCTの態度とp = 0.05で相関していたことでした。しかし、45のテストを実行していたため、アルファ= 0.05 / 45 = 0.001のボンフェローニ補正を実行したため、この結果は重要ではありません。 その後、すべての変数に対して単純な線形回帰を実行しましたが、PCTに対する態度では外向性が有意でした。ボンフェローニ修正を行うと、これは重要ではなくなります。 質問: ピアソンの相関でボンフェローニを修正する必要がありますか? 私がそうし、PCTへの態度を無視した外向性を作る場合、線形回帰を行うことにまだ意味がありますか? 線形回帰を行う場合、これについてもボンフェローニ補正を行う必要がありますか? 修正された値のみ、または修正されていない値と修正された値の両方を報告しますか?

2
SPSS出力を正しく解釈するための反復測定ANOVA仮定の理解
さまざまな報酬条件がタスクのパフォーマンスに影響を与える可能性があるかどうかを調査しています。それぞれn = 20の2つのグループによる小規模な研究のデータがあります。3つの異なる「報酬」条件でのパフォーマンスに関連するタスクのデータを収集しました。タスクには、3つの条件のそれぞれにおけるパフォーマンスが2回、ランダムな順序で含まれていました。異なる「報酬」条件のそれぞれで、各グループのタスクパフォ​​ーマンスに平均差があるかどうかを確認したいと思います。 IV =グループタイプ DV = 3つの条件にわたるタスクパフォ​​ーマンスの平均測定値 反復測定ANOVAからの出力とSPSSの生データセットへのアクセスがありますが、続行方法がわかりません。Pallantのテキストは多少制限されているため、この解釈の段階的なガイドを見つけることができませんでした。私の特定の問題は次の分野にあります: 各変数の正常性を個別に、またはIVの各レベルの組み合わせ内でチェックしますか?それが組み合わせ内にある場合、それをどのようにチェックしますか? 最初にモークリーのテストをチェックしますか?違反している場合、それはどういう意味ですか?違反していない場合、それはどういう意味ですか? 多変量テストの表、または被験者内効果のテストをいつ見ても大丈夫ですか?どちらか(または両方?)を使用するのが適切かどうかはわかりません。 ペアワイズ比較を見ても大丈夫ですか?多変量または被験者内効果が有意性を示さない場合(つまり、P <0.05)、そうすることは直観に反するように見えますが、私は再び確信が持てません。

4
2 X 3テーブルで複数の事後カイ2乗検定を実行する方法
私のデータセットは、沿岸、ミッドチャネル、オフショアの3つのサイトタイプでの生物の全死亡率または生存率で構成されています。下の表の数字は、サイトの数を表しています。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 100%の死亡率が発生したサイトの数がサイトのタイプに基づいて重要かどうかを知りたいです。2 x 3カイ2乗を実行すると、重要な結果が得られます。実行できる事後的なペアワイズ比較はありますか、または実際にロジスティックANOVAまたは二項分布の回帰を使用する必要がありますか?ありがとう!

2
SPSSの多重回帰に関する複数の代入の質問
現在、帰属データを使用して重回帰モデルを実行していますが、いくつか質問があります。 バックグラウンド: SPSS 18の使用。私のデータはMARのようです。ケースのリストごとの削除では、92ケースのみが残り、複数の代入は分析のために153ケースを残します。すべての仮定が満たされました-1つの変数ログが変換されました。9 IVのカテゴリ5〜5、3スケール、1間隔。DVスケール。標準の重回帰のEnterメソッドを使用します。 私のDVは、事前スコアと事後スコアメジャー間のスコアの差です。これらの変数の両方に多くのケースがありません-これらのそれぞれに欠損値を代入してから、それらの違いを計算して私のDVを計算します(これを行うにはどうすればよいですか)、またはDVのデータを代入するだけですか?最も適切なアプローチはどれですか? 変換されたデータまたは変換されていない変換されたデータに対して補完を実行する必要がありますか? データが欠落していない場合でも、すべての変数を代入プロセスに入力する必要がありますか、それとも10%以上のケースで欠落している変数のデータを代入する必要がありますか? リストワイズで削除されたケースとDVの分散がほとんどないIVのアカウントで回帰を実行しました。その後、複数の代入を行った後、完全なファイルで回帰を実行しました-結果は非常に似ていますが、9つのIVはまだ私のDVの分散の約12%のみを予測しますが、私のIVの1つは、それが重要な貢献をしていることを示しています(これはたまたまログ変換された変数です)... 結論にほとんど違いがない場合、つまり、IVがdvを十分に予測できない場合、または完全なデータを報告する場合、元のデータを報告する必要がありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.