この質問で言及されている問題は、Rパッケージglmnetのバージョン1.7.3で修正されています。
私はfamily = multinomialでglmnetを実行する際にいくつかの問題を抱えており、同様の何かに遭遇したり、私が間違っていることを教えたりできるのではないかと思っていました。
自分のダミーデータを入力すると、実行時に「apply(nz、1、median)のエラー:dim(X)は正の長さでなければなりません」というエラーが表示されますcv.glmnet
。私にとってあまり有益ではありませんでした。
y=rep(1:3,20) #=> 60 element vector
set.seed(1011)
x=matrix(y+rnorm(20*3*10,sd=0.4),nrow=60) # 60*10 element matrix
glm = glmnet(x,y,family="multinomial") #=> returns without error
crossval = cv.glmnet(x,y,family="multinomial") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="class") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="mae") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
cvglm = cv.glmnet(x,y,family="multinomial",lambda=2) #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
以下は、glmnetで解決しようとしていた問題の視覚的な説明です(それが役立つ場合)。
my_colours = c('red','green','blue')
plot(x[,1],x[,2],col=my_colours[y])
パッケージのドキュメントからサンプルコードを実行できます。そのため、何かを誤解しているか、glmnetにバグがあるのではないかと疑っています。
library(glmnet)
set.seed(10101)
n=1000;p=30
x=matrix(rnorm(n*p),n,p) #=> 1000*30 element matrix
beta3=matrix(rnorm(30),10,3)
beta3=rbind(beta3,matrix(0,p-10,3))
f3=x%*% beta3
p3=exp(f3)
p3=p3/apply(p3,1,sum)
g3=rmult(p3) #=> 1000 element vector
set.seed(10101)
cvfit=cv.glmnet(x,g3,family="multinomial")
これはRバージョン2.13.1(2011-07-08)とglmnet 1.7.1を使用していますが、R 2.14.1でも同じ問題が発生する可能性があります。アイデアはありますか?