スケールを構築する際に、スコアの単純な合計に対して「ファクタスコア」を使用するタイミングについての提案を受け取りたいと思います。すなわち、因子をスコアリングする「洗練されていない」方法よりも「洗練された」。DiStefanoらから。(2009; pdf)、強調が追加されました:
因子スコアの計算方法には、改良型と非改良型の2つの主要なクラスがあります。洗練されていない方法は、因子分布に関する個人の配置に関する情報を提供する比較的単純な累積手順です。シンプルさは、いくつかの魅力的な機能に役立ちます。つまり、洗練されていないメソッドは、計算も解釈も簡単です。洗練された計算方法は、より高度で技術的なアプローチを使用して因子スコアを作成します。 これらは、洗練されていない方法よりも正確で複雑であり、標準化されたスコアである推定値を提供します。
私の考えでは、目標が研究や設定全体で使用できるスケールを作成することである場合、すべてのスケール項目の単純な合計または平均スコアが理にかなっています。しかし、目標はプログラムの治療効果を評価することであり、重要な対照はサンプル内の治療対対照群にあるとしましょう。合計または平均をスケールするために因子スコアを好む理由はありますか?
代替案を具体的にするには、次の簡単な例をご覧ください。
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exact
この追加された強調は、因子のスコアでさえ必然的に不正確である(「未決定」)という事実から私たちをそらすべきではありません。
"more exact"
。線形に計算された因子スコアの中で、回帰法は「未知の真の因子値と最も相関がある」という意味で最も「正確」です。はい、より正確です(線形代数アプローチ内)が、完全に正確ではありません。