タグ付けされた質問 「sums-of-squares」

二乗和は、ANOVAのような正規分布に基づく統計モデルで重要な役割を果たします。


2
多項ロジスティック損失vs(クロスエントロピーvs二乗誤差)
Caffe(ディープラーニングフレームワーク)がほとんどのモデルサンプルの出力層としてSoftmax Loss Layer SoftmaxWithLossを使用していることを確認しました。 私の知る限り、Softmax損失層は、多項ロジスティック損失層とSoftmax層の組み合わせです。 カフェから、彼らはそれを言った Softmax Loss Layerの勾配計算は、数値的に安定しています。 ただし、この説明は私が望む答えではありません。説明は、レイヤーごとではなく、多項ロジスティック損失レイヤーとソフトマックス損失レイヤーの組み合わせを比較するだけです。しかし、他のタイプの損失関数と比較しないでください。 しかし、教師付き学習の観点から、これらの3つのエラー関数である多項ロジスティック損失、クロスエントロピー(CE)、二乗誤差(SE)の違い/利点/欠点は何ですか?支持記事はありますか?

1
タイプIIIの二乗和
私は、1つのカテゴリー変数(男性と女性)と1つの連続変数を持つ線形回帰モデルを持っています。AAABBB Rのコントラストコードをで設定しましたoptions(contrasts=c("contr.sum","contr.poly"))。そして今、私は、タイプIIIの二乗和と、を使用したそれらの相互作用(A:B)があります。AAABBBdrop1(model, .~., test="F") 私が行き詰まっているのは、二乗和の計算方法です。だBBBと思いますsum((predicted y of the full model - predicted y of the reduced model)^2)。縮小モデルはのようになりますy~A+A:B。しかし、を使用するとpredict(y~A+A:B)、Rは完全なモデルの予測値と同じ予測値を返します。したがって、平方和は0になります。 (の二乗和には、の縮小モデルを使用しました。これはと同じです。)AAAy~B+A:By~A:B 以下は、ランダムに生成されたデータのコード例です。 A<-as.factor(rep(c("male","female"), each=5)) set.seed(1) B<-runif(10) set.seed(5) y<-runif(10) model<-lm(y~A+B+A:B) options(contrasts = c("contr.sum","contr.poly")) #type3 sums of squares drop1(model, .~., test="F") #or same result: library(car) Anova(lm(y~A+B+A:B),type="III") #full model predFull<-predict(model) #Calculate sum of squares #SS(A|B,AB) predA<-predict(lm(y~B+A:B)) …

1
ビーガンのアドニス:変数の順序または階層の使用
パッケージadonis()内の関数を使用して、vegan1)共生する宿主種が複数のサイト間で微生物群集で異なるかどうか、および2)サイトが異なるかどうかを決定しています。CVとSOに関するすべての投稿を調べましたが、アドニス機能を使用して複数の要因の重要性を判断する方法に対する明確な答えはありません。 /programming/26768779/vegan-adonis-unbalanced-design-ss-type-ii-or-iiiで提案されているように、私は最初にこれを行いました: ここで、jaccはジャカードメトリックを使用した非類似度行列です adonis <- adonis(jacc ~ Species + Site, data = df_compare) adonis Call: adonis(formula = jacc ~ Species + Site, data = df_compare) Permutation: free Number of permutations: 999 Terms added sequentially (first to last) Df SumsOfSqs MeanSqs F.Model R2 Pr(>F) Species 2 0.6055 0.30273 1.7690 0.04981 0.004 …

3
平均二乗誤差と最小二乗誤差のどちらをデータセットと比較しますか?
同じシステムの3つのデータセットがあります。しかし、最初のものについては、21の測定があります。2番目と3番目の測定値は9つしかありません。次に、これら3つのデータセットを使用してモデルを作成しました(つまり、3つのモデル、データセットごとに1つ)。これら2つのデータセットの誤差を比較したい場合。LSE(最小二乗誤差)の代わりにMSEを使用することによる明確な利点はありますか?インターネットでは、これに対する明確な答えは見つかりません。主な利点は何ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.