統計とビッグデータ psychometrics

2

順序データまたは間隔データに最適な評価者間信頼性方法はどれですか？「一致の共同確率」または「カッパ」は、名目上のデータ用に設計されていると思います。「ピアソン」と「スピアマン」は使用できますが、主に2人の評価者に使用されます（ただし、3人以上の評価者に使用できます）。順序データまたは間隔データに適した他の尺度、つまり3人以上の評価者はいますか？

25 reliability psychometrics agreement-statistics cohens-kappa

2

多問試験での不正行為のパターンの検出

質問：試験問題のバイナリデータがあります（正しい/正しくない）。一部の個人は、質問とその正解のサブセットに事前にアクセスした可能性があります。私は誰、何人、または誰がわからない。不正行為がない場合、アイテム正しい応答の確率をとしてモデル化するとします。ここで、は質問の難易度を表し、は個人の潜在能力です。これは、Rのltmのrasch（）のような関数で推定できる非常に単純な項目応答モデルです。潜在変数の推定（個人にインデックスを付ける）に加えて、個別の推定にアクセスできますL O G I T （（P iは = 1 | Z ））= β I + Z β I Z 、Z jは j個のq Jiiilogit((pi=1|z))=βi+zlogit((pi=1|z))=βi+zlogit((p_i = 1 | z)) = \beta_i + zβiβi\beta_izzzz^jz^j\hat{z}_jjjjq^jq^j\hat{q}_j 不正行為が不可能な別のデータセットから派生した同じ潜在変数の。目標は、だまされた可能性が高い個人と、だまされたアイテムを識別することです。あなたが取るかもしれないいくつかのアプローチは何ですか？生データに加えて、、、およびがすべて利用可能ですが、最初の2つは不正のためにバイアスがあります。理想的には、ソリューションは確率的クラスタリング/分類の形で提供されますが、これは必須ではありません。正式なアプローチと同様に、実用的なアイデアは大歓迎です。 Z j個のq jをβ^iβ^i\hat{\beta}_iz^jz^j\hat{z}_jq^jq^j\hat{q}_j これまで、スコアの高い個人と低い個人のペアの質問スコアの相関を比較しました（は彼らがだました確率の大まかな指標）。たとえば、個人をでソートし、個人の質問スコアの連続するペアの相関をプロットしました。また、値がの分位よりも大きい個体のスコアの平均相関をプロットしてみました、関数として。どちらのアプローチにも明らかなパターンはありません。のq J - Z j個のq J - Z j個のq J - Z jをNTHの …

25 r clustering classification psychometrics

6

構造方程式モデリングの概要

同僚から、この主題についてのいくつかの助けを求められますが、私は本当に知りません。彼らは1つの研究でいくつかの潜在変数の役割について仮説を立て、審判は彼らにこれをSEMで形式化するように依頼した。彼らが必要とすることはそれほど難しくないように思えるので、私はそれを試してみると思う...今のところ、私はちょうど主題への良い紹介を探しています！これについては、Googleは本当に私の友人ではありませんでした。事前に感謝します... PS：John FoxによるRのsemパッケージによる構造方程式モデリングと、同じ著者によるこのテキストを読みました。私の目的にはこれで十分だと思いますが、とにかく他の参考文献は大歓迎です。

24 references modeling sem psychometrics

5

アイテム応答理論の適用を開始する方法と使用するソフトウェアは？

コンテキスト私はアイテム反応理論について読んでいますが、それは魅力的です。私は基本を理解していると思いますが、その地域に関連する統計的手法をどのように適用するのか疑問に思っています。以下は、ITRを適用したい分野に類似した2つの記事です。 http://www.jstor.org/stable/4640738?seq=7 http://www.ncbi.nlm.nih.gov/pubmed/21744971 2つ目は、この時点で実際に拡張したいものです。 jMetrikという無料のプログラムをダウンロードしましたが、うまく機能しているようです。IRTに関しては基本的すぎると思いますが、よくわかりません。「最良の」方法にはRの学習が含まれる可能性が高いことを知っています。ただし、その学習曲線に取り組む時間を割くことができるかどうかはわかりません。ソフトウェアを購入するための資金はいくらかありますが、私が見る限り、素晴らしいIRTプログラムは存在しないようです。ご質問 jMetrikの有効性についてどう思いますか？ IRTの適用をどのように進めますか？ IRTを適用するのに最適なプログラムは何ですか？ IRTを定期的に使用している人はいますか？もしそうなら、どのように？

21 psychometrics latent-variable irt

4

新しいベクターをPCA空間に投影する方法は？

主成分分析（PCA）を実行した後、新しいベクトルをPCA空間に投影します（つまり、PCA座標系で座標を見つけます）。を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか？

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

3

リッカート項目で構成されるアンケートの因子分析

以前は、心理測定の観点からアイテムを分析していました。しかし今、私は動機や他のトピックに関する他のタイプの質問を分析しようとしています。これらの質問はすべてリッカート尺度に基づいています。私の最初の考えは、要因分析を使用することでした。なぜなら、いくつかの根本的な次元を反映するように質問が仮定されているからです。しかし、因子分析は適切ですか？次元に関する各質問を検証する必要がありますか？リッカート項目の因子分析の実行に問題はありますか？リッカートやその他のカテゴリー項目について因子分析を実施する方法に関する優れた論文や方法はありますか？

17 factor-analysis scales psychometrics likert psychology

2

アンケートの信頼性の評価：次元、問題のある項目、およびalpha、lambda6またはその他のインデックスを使用するかどうか？

実験に参加している参加者のスコアを分析しています。製品に対する参加者の態度を推定することを目的とした6つの項目で構成されるアンケートの信頼性を推定したいと思います。 Cronbachのアルファを計算し、すべてのアイテムを単一のスケールとして扱い（アルファは約0.6）、一度に1つのアイテムを削除しました（最大アルファは約0.72）。アイテムの数と基礎となる構造の次元によっては、アルファが過小評価および過大評価される可能性があることを知っています。それで、PCAも行いました。この分析により、分散の約80％を説明する3つの主成分があることが明らかになりました。だから、私の質問は、今どのように進めることができるかについてのすべてですか？これらの各次元でアルファ計算を実行する必要がありますか？信頼性に影響するアイテムを削除しましたか？さらに、Webで検索すると、信頼性の別の尺度があることがわかりました。guttmanのlambda6です。このメジャーとアルファの主な違いは何ですか？ラムダの良い値は何ですか？

16 pca reliability scales psychometrics cronbachs-alpha

4

勾配ブースティングマシンの精度は、反復回数が増えると低下します

caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

3

Cronbachのアルファ値の記述子はどこから来ますか（例：貧弱、優秀）？

Cronbachのアルファ値を次のように記述することはかなり一般的なようです： α≥0.9すばらしい 0.7≤α<0.9良い 0.6≤α<0.7許容範囲 0.5≤α<0.6悪い α<0.5許容できないこれらの値はどこから来たのですか？これらを説明するオリジナルの研究記事が見つかりません。編集：私はそれが単に慣習に基づいているだけであり、これらを概説する古典的な研究記事がないことを90％確信しています。

14 reliability psychometrics cronbachs-alpha

1

Rを使用した二分データ（バイナリ変数）の因子分析の例を介してステップを探しています

バイナリ変数のみのいくつかの二分データがあり、上司は四分相関行列を使用して因子分析を実行するように頼みました。私は以前、ここにある例とUCLAのstatサイトなどのサイトに基づいて異なる分析を実行する方法を自分自身に教えることができましたが、二分法の因子分析の例を通してステップを見つけることはできないようです。 Rを使用したデータ（バイナリ変数）私が見たのCHLの応答ややまねの質問には、私も見ましたttnphns'答えを、私はもっと何かを探しています綴ら、私が一緒に働くことができる例を通してステップ。ここの誰かが、Rを使用したバイナリ変数の因子分析の例を通してそのようなステップを知っていますか？更新2012-07-11 22：03：35Z また、3次元の確立された機器で作業していることを追加する必要があります。これにいくつかの質問を追加し、4つの異なる次元を見つけたいと考えています。さらに、サンプルサイズはのみで、現在個のアイテムがあります。サンプルサイズとアイテムの数をいくつかの心理学の記事と比較しましたが、間違いなく低価格ですが、とにかく試してみたかったのです。しかし、これは私が探しているステップスルーの例にとって重要ではなく、以下のカラカルの例は本当に素晴らしいようです。朝一番に自分のデータを使って作業を進めます。n = 153n=153n=153191919

14 r factor-analysis psychometrics binary-data

1

形成測定モデルと反射測定モデルの違いは何ですか？

誰かが他のものよりも選択する理由についての例を提供できますか？それらは別々に計算されますか？

13 sem psychometrics psychology scale-construction

3

「天井効果」が発生していると結論付けるには、どのような基準を満たす必要がありますか？

社会科学研究方法のSAGE百科事典によると… [a]メジャーに潜在的な応答の明確な上限があり、この制限で、またはその近くで参加者の集中度が高い場合、天井効果が発生します。スケール減衰は、この方法で分散が制限されるたびに発生する方法論的な問題です。…たとえば、天井効果は、高いスコアが好ましい態度を示し、最高の反応が可能な限り最も肯定的な評価を得ることができない態度の尺度で発生する場合があります。…天井効果の問題に対する最適なソリューションはパイロットテストであり、これにより問題を早期に特定することができます。天井効果が見つかった場合[および]結果の尺度がタスクのパフォーマンスである場合、潜在的な応答の範囲を拡大するためにタスクをより困難にすることができます。1 [強調を追加] あるように思わたくさんのアドバイスや質問（ここおよび上記の引用で説明したものと同様の天井効果を示すデータを分析することを扱います）。私の質問は単純なものでも素朴なものでもかまいませんが、データに天井効果が存在することを実際にどのように検出しますか？具体的には、心理測定テストが作成され、天井効果（視覚検査のみ）につながる疑いがある場合、テストを修正してより広い範囲の値を生成するとします。改訂されたテストにより、生成されたデータから天井効果が除去されたことをどのように示すことができますか？データセット内の天井効果があることを示しているテストがありますが、データセットの中にいない天井効果bが？私の素朴なアプローチは、分布のゆがみを調べることです。もしそれがゆがんでいなければ、天井効果はないと結論付けます。それは過度に単純化されていますか？編集より具体的な例を追加するために、年齢とともに増加するが最終的には横ばいになり、高齢になると減少し始める潜在的な特性xを測定する機器を開発するとします。範囲が1〜14の最初のバージョンを作成し、パイロット操作を行って、天井効果（最大値である14付近で多数の応答が発生する可能性があることを発見しました。しかし、なぜですか？その主張をサポートする厳密な方法はありますか？次に、1〜20の範囲になるようにメジャーを修正し、より多くのデータを収集します。この傾向は私の予想とより密接に一致していることがわかりますが、測定範囲が十分に大きいことをどのようにして知ることができますか。再度修正する必要がありますか？視覚的には問題ないようですが、疑念を確認するためにテストする方法はありますか？単に見ているだけでなく、データ内でこの天井効果を検出する方法を知りたいです。グラフは理論的なものではなく、実際のデータを表しています。機器の範囲を拡大すると、データの広がりが改善されましたが、それで十分ですか？どうすればテストできますか？ 1 Hessling、R.、Traxel、N.、＆Schmidt、T.（2004）。天井効果。Michael S. Lewis-Beck、A。Bryman、およびTim Futing Liao（編）、The SAGE Encyclopedia of Social Science Research Methodsで。（p。107）。カリフォルニア州サウザンドオークス：Sage Publications、Inc. doi：10.4135 / 9781412950589.n102

13 distributions variance scales psychometrics measurement

2

アンケートの序数データを適切な間隔データに変換する方法は？

順序レベルのデータを間隔レベルに変換する簡単な方法はありますか（逆の方法で行うのと同じように）？また、ExcelまたはSPSSで実行可能ですか？データがある、たとえば：序数レベルで10の質問（0-5スケール、0 = "not at all"、5 = "all the time"など）、それらを適切に処理できるように変換したいパラメトリックテスト用の間隔レベルデータ（正規分布、問題外のノンパラメトリックテスト）。答えに非常に感謝します！

13 categorical-data ordinal-data scales psychometrics

4

変数のグループ間/内で相関を計算する方法は？

1000個の観測値と50個の変数のマトリックスがあり、それぞれが5ポイントスケールで測定されています。これらの変数はグループに編成されていますが、各グループには同数の変数はありません。 2種類の相関を計算したい：（特性間の）変数グループ内の相関：変数グループ内の変数が同じものを測定しているかどうかの尺度。変数のグループ間の相関：各グループが1つの全体的な特性を反映していると仮定して、各特性（グループ）が他のすべての特性とどのように関連しているかを示す何らかの尺度。これらの特性は、以前グループに分類されていました。グループ間の相関関係を見つけることに興味があります。つまり、グループ内の特性が同じ基本特性（上記の＃1を完了した-クロンバッハのアルファ）を測定していると仮定すると、特性自体は関連していますか？誰がどこから始めればいいのか提案はありますか？

13 correlation psychometrics scales

2

アンケートからの無駄な質問の特定

アンケートを作成しています。その信頼性と妥当性を改善するために、統計的手法を使用したいと思います。答えが常に同じである質問を排除したい。これは、ほぼすべての参加者がこれらの質問に対して同じ回答をしたことを意味します。今、私の質問は：使用の文脈とは無関係に、答えが常に同じであるような役に立たない質問の専門用語は何ですか？そのような質問を識別する方法は何ですか？

12 survey reliability psychometrics validity

タグ付けされた質問 「psychometrics」

タグ付けされた質問「psychometrics」