統計とビッグデータ psychometrics

2

人は、3つの中から最も類似する2つのアイテムを繰り返し選択します。アイテム間の知覚距離をモデル化/推定する方法は？

人には3つの項目（顔の写真など）が与えられ、3つの顔のうちどれが最も類似しているかを選択するよう求められます。これは、顔のさまざまな組み合わせで何度も繰り返されます。各顔は多くの組み合わせで発生する可能性があります。この種のデータを考慮して、各面間の距離が2D空間（または3D、4Dなど）に配置され、各面間の距離が参加者。これをモデル化/推定するための良い（おそらく標準的な）方法は何でしょうか？モデル/論文および/またはソフトウェアパッケージへのポインタは高く評価されます。

8 modeling dimensionality-reduction psychometrics similarities

3

探索的要因分析で並列分析を正しく解釈するにはどうすればよいですか？

一部の科学論文では、方法論に対する私の理解と矛盾する方法で主軸因子分析の並列分析の結果を報告しています。何が欠けていますか？私は間違っていますか、それとも彼らですか。例：データ： 200人の人間のパフォーマンスが10のタスクで観察されました。個人およびタスクごとに、1人にパフォーマンススコアがあります。ここでの問題は、10個のタスクのパフォーマンスの原因となる要因の数を特定することです。方法：主軸因子分析で保持する因子の数を決定する並列分析。報告された結果の例：「並列分析は、2.21以上の固有値を持つ因子のみを保持する必要があることを示唆しています」それはナンセンスですよね？ Horn（1965）によるオリジナルの論文と、Haytonらのようなチュートリアルから。（2004）並列分析は、ランダムデータに基づくカイザー基準（固有値> 1）の適応であることを理解しています。ただし、適応は、カットオフ1を別の固定数に置き換えるのではなく、各因子の個別のカットオフ値（およびデータセットのサイズ、つまり10スコアの200倍）に依存します。Horn（1965）とHaytonらの例を見てください。（2004）、R関数の出力はfa.parallelに心理パッケージと平行でnFactorsパッケージでは、並列分析により、実際のデータの固有値と比較するために、スクリープロットに下向きの傾斜曲線が生成されます。「固有値が2.21より大きい場合、最初の因子を保持します。さらに、固有値が1.65より大きい場合は2番目を保持します。…」。「並行分析では、固有値が2.21以上の要素のみを保持する必要があることを示唆している」という適切な設定、考え方、方法論はありますか？参照：ヘイトン、JC、アレン、DG、スカルペロ、V。（2004）。探索的因子分析における因子保持の決定：並列分析に関するチュートリアル。組織研究方法、7（2）：191-205。ホーン、JL（1965）。因子分析における因子数の根拠とテスト。Psychometrika、30（2）：179-185。

8 factor-analysis psychometrics parallel-analysis

1

新しい集団におけるアンケートの検証

医学生の態度構成を測定することを目的とする20項目のアンケートに400の回答があります。機器は米国で医学生の1年間検証され、公開されたデータは非常に「クリーン」です。すべてのritc値> 0.3、アルファ0.84、安定した4因子構造のPCAなど。私のサンプルでは、 ritc <0.2を持つ20のアイテムと文化的サブポピュレーション（n = 70）では、これらのritc値はゼロ/負です。すべてのitmesを保持している場合、ritcが低いものは、どの要素にもロードされないか、2項目の要素（要素4）に分類されません。これは（調査したいと思います）これは次のいずれかが原因であると仮定します。または（ii）プログラムのすべての段階で生徒からの回答があり、スケールアイテムで十分にキャプチャされていない構成に発達面があるため。これを調査できる統計検定はありますか？ ritcのあるアイテムをスケールから削除する必要がありますか。削除する場合は、最低から順に削除します。どの時点でアイテムの削除を停止する必要がありますか/アンケートから何かを紛失しましたか？メジャーとマイナーのサブポピュレーションの間でスケールの因子構造を比較したい場合、これをどのように試行するか、またはマイナーサブサンプルが小さすぎて結論を導き出せないのですか？参考文献をいただければ幸いです。最後に、スケールを検証する目的は、介入前および介入後のスコアを使用して介入の有効性を判断するためにスケールを使用することです。アイテムのritcが低い場合、実験的な設定でスケールの信頼性に影響を与える可能性があると思います。または私は間違っていますか？発達的側面を持つ構成要素を測定するために設計されたスケールの有用性を決定する統計的方法はありますか？つまり、学生が態度構成要素の「より多く」を開発するときにすべての項目が適切に機能しますか？

8 survey validation scales psychometrics scale-construction

2

内部因子構造は良好ですが、Cronbachの不良ですか？

私はCFAを実行しており、1次元スケールの適切なインデックス（CFI = .99、RMSEA = .01）を取得しています。ただし、内部整合性をテストすると、Cronbachの s（）が悪くなります。外れ値の削除からアイテムの削除まですべてを試しましたが、それでも同じ問題が発生します。αα\alphaα = .6α=.6\alpha = .6 SEMに測定が信頼できることを示すものがあるかどうか疑問に思っていますか？クロンバックの（または内部一貫性）が信頼性を測定するかどうかについては議論があることを知っていますが、私の分野ではクロンバックのを心理測定の良さの尺度として報告する必要があるため、内部一貫性をあるものとして示す方法を見つける必要がありますこの対策には十分です。αα\alphaαα\alpha

8 sem reliability psychometrics confirmatory-factor cronbachs-alpha

5

0はリッカート尺度の有効な値ですか？

私は6ポイントのリッカートスケールを使用して言語学習の動機付けに関するパイロット調査を実施しましたが、0（非常に同意しない）から5（非常に同意する）までです。彼の調査で同僚が1〜6を使用していることに気付きました。私の計算変数（合計と平均）は、1〜6を使用した場合と同じですか？通常、何らかの理由で0を使用しないことをお勧めしますか？私はSPSSを初めて使用しましたが、実行する必要のあることのほとんどを実行できましたが、現在、自分の値が「歪んでいる」と心配しています。SPSSが方程式に0を追加する方法がわかりません。

8 spss scales likert psychometrics

1

複数の評価者、参加者ごとに異なる評価者、および経時変化の可能性がある評価者間信頼性を実行する方法は？

参加者は2回評価され、2つの評価は3年で区切られていました。ほとんどの参加者について、評価は異なる評価者によって行われましたが、一部（10％未満）では、同じ評価者が両方の評価を行いました。合計8人の評価者がおり、2つの評価者が両方の時点で評価を行っていました。さて、評価は仮想の「正しい」値を持つ能力の側面のものだったので、評価者間の絶対的な合意は一貫性よりも重要です。ただし、評価は3年間隔で行われたため、能力に実際の変更があった可能性があります（おそらく変更されていました）。この場合、信頼性の最良のテストは何でしょうか？私はクラス内相関に傾いていますが、ICC1はこれらのデータで実行できる最善の方法ですか？

8 reliability psychometrics agreement-statistics intraclass-correlation

4

FA：「単純構造基準」に基づく回転行列の選択

因子分析を使用する上で最も重要な問題の1つは、その解釈です。因子分析では、解釈を強化するために因子ローテーションがよく使用されます。満足のいく回転の後、回転した因子負荷行列L 'は相関行列を表す同じ機能を持ち、回転していない行列Lの代わりに因子負荷行列として使用できます。回転の目的は、回転した因子負荷行列にいくつかの望ましい特性を持たせることです。使用される方法の1つは、回転する行列が単純な構造になるように因子負荷行列を回転させることです。 LL Thurstoneは、因子回転の一般的なガイドとして、単純構造の原理を導入しました。単純な構造基準：因子行列の各行には少なくとも1つのゼロが含まれている必要があります共通因子がm個ある場合、因子行列の各列には少なくともm個のゼロが必要です因子行列の列のすべてのペアについて、1つの列ではエントリがゼロに近づくが、他の列ではエントリに近づかない変数がいくつかあるはずです。因子行列のすべての列のペアについて、4つ以上の因子がある場合、変数の大部分は両方の列でゼロに近いエントリを持つ必要があります因子行列の列のペアごとに、両方の列にゼロ以外のエントリを持つ少数の変数のみが存在する必要があります理想的なシンプルな構造は次のようなものです。各アイテムには、1つの要素のみで高い、または意味のある負荷があり、各要素には、一部の項目のみの高い、または意味のある負荷があります。問題は、回転メソッドのいくつかの組み合わせと、それぞれが受け入れるパラメーター（特に、斜めのパラメーターの場合）を試すと、候補行列の数が増え、上記の基準をどれがより適切に満たすかを確認することが非常に難しいことです。最初にその問題に直面したとき、私はそれらを単に「見る」だけでは最良の一致を選択することができず、決定を助けるためのアルゴリズムが必要であることに気付きました。プロジェクトの締め切りのストレス下で、私ができることのほとんどは、MATLABで次のコードを書くことでした。これは、一度に1つの回転行列を受け入れ、各基準が満たされているかどうかを（いくつかの仮定の下で）返します。新しいバージョン（アップグレードしようとした場合）は、3dマトリックス（2dマトリックスのセット）を引数として受け入れ、アルゴリズムは上記の基準により適合するものを返す必要があります。これらの基準からアルゴリズムをどのように抽出しますか？私はあなたの意見（メソッド自体の有用性についての批判もあったと思います）とおそらくローテーションマトリックス選択問題へのより良いアプローチを求めています。また、FAを実行したいソフトウェアを教えてください。Rの場合、どのパッケージを使用しますか？（私がFAをしなければならなかった場合、私は再びSPSSに目を向けることを認めなければなりません）。誰かがコードを提供したい場合は、RまたはMATLABを使用します。上記PSザ・シンプルな構造基準製剤は、本の中で見つけることができる「因子分析の感覚を作る」 PETT、M.、ラッキー、N.、SULLIVAN、J.によって PS2（同じ本から）：「成功した因子分析のテストは、元のコアマトリックスを再現できる範囲です。斜めの解法も使用した場合は、すべての中で最高および最低因子の最大数を生成したものを選択してください。ローディング。」これは、アルゴリズムが使用できる別の制約のように聞こえます。 PS3この質問はここでも尋ねられました。しかし、私はそれがこのサイトによりよく合うと思います。 function [] = simple_structure_criteria (my_pattern_table) %Simple Structure Criteria %Making Sense of Factor Analysis, page 132 disp(' '); disp('Simple Structure Criteria (Thurstone):'); disp('1. Each row of the factor …

8 r algorithms factor-analysis psychometrics matlab

2

科学的に健全なスケール構築に関するアドバイス

組織研究の分野で、20のリッカートアイテム（1〜5、サンプルサイズn = 299）のセットが与えられました。これらのアイテムは、多面的で多面的であり、本質的に異質である潜在的な概念を測定することを目的としています。目標は、さまざまな組織の分析に使用でき、ロジスティック回帰で使用できるスケールを作成することです。アメリカの心理学協会に従って、スケールは（1）一次元、（2）信頼でき、（3）有効でなければなりません。したがって、それぞれ4/6/6/4アイテムの4つの次元またはサブスケールを選択することにしました。コンセプトを表すと仮定されています。アイテムは、リフレクトアプローチを使用して構築されました（可能なアイテムの多くを生成し、その後の3つのグループでcronbachのアルファおよび概念表現（有効性）を使用してアイテムを繰り返し削除します）。利用可能なデータを使用して、ポリコリック相関に基づく予備的な並列説明因子分析とバリマックスローテーションを使用すると、アイテムが予想とは異なる他の因子にロードされていることが明らかになりました。4つの仮説とは異なり、少なくとも7つの潜在要素があります。項目間相関の平均は、正ではありますがかなり低い（r = 0.15）。cronbach-alpha係数も、各スケールで非常に低い（0.4〜0.5）。確認的因子分析が適切なモデルフィットをもたらすとは思えません。 2つの次元が削除された場合、cronbachsアルファは受け入れられます（スケールあたり10アイテムで0.76,0.7、これはcronbachsアルファの通常バージョンを使用することでさらに大きくすることができます）が、スケール自体は依然として多次元です！私は統計に不慣れで適切な知識が不足しているため、さらに先に進む方法に困っています。スケールを完全に破棄し、説明のみのアプローチに辞任することに消極的であるため、さまざまな質問があります。 I）信頼でき、有効であるが一次元ではないスケールを使用することは間違っていますか？ II）その後、概念を形成的であると解釈し、消失四面体テストを使用してモデル仕様を評価し、部分最小二乗（PLS）を使用して可能な解決策に到達するのは適切でしょうか？結局のところ、この概念は反射的なものよりも形成的なもののようです。 III）項目応答モデル（Rasch、GRMなど）を使用することは役に立ちますか？私が読んだように、ラッシュモデルなども一次元性の仮定が必要です IV）7つの要素を新しい「サブスケール」として使用するのが適切でしょうか？古い定義を破棄し、因子負荷に基づいて新しい定義を使用するだけですか？私はこれについての考えをいただければ幸いです:) 編集：追加された因子負荷と相関 > fa.res$fa Factor Analysis using method = ml Call: fa.poly(x = fl.omit, nfactors = 7, rotate = "oblimin", fm = "ml") 因子パターン行列と因子相互相関行列から計算された因子負荷、0.2を超える値のみが表示されます

8 factor-analysis scales psychometrics composite cronbachs-alpha

4

なぜすべてのテストが項目分析/応答理論で採点されないのですか？

項目分析/応答理論がより広く適用されない統計的な理由はありますか？たとえば、教師が25問の多肢選択式テストを行い、全員が10問正解した場合、10問は非常に低い割合で回答され（たとえば10％）、残りの5問は約50％の人が回答した。難しい質問にさらに重みを付けるために、スコアの重み付けを変更することは理にかなっていますか？それでも、現実の世界のテストでは、ほとんどの場合、すべての質問に等しく重み付けされています。どうして？以下のリンクでは、差別の指標と、どの質問を選択するのが難しいかについてのその他の対策について説明しています。http： //fcit.usf.edu/assessment/selected/responsec.html ただし、質問の識別インデックスを計算する方法は、前向きな方法でのみ使用されるようです（たとえば、質問がうまく識別できない場合は、それを投げます）。現在の母集団に対してテストの重み付けが変更されないのはなぜですか？

8 teaching psychometrics latent-variable

タグ付けされた質問 「psychometrics」

タグ付けされた質問「psychometrics」