統計学者が通常anova出力をどのように解釈するかについて質問があります。Rからanova出力があるとします。
> summary(fitted_data)
Call:
lm(formula = V1 ~ V2)
Residuals:
Min 1Q Median 3Q Max
-2.74004 -0.33827 0.04062 0.44064 1.22737
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.11405 0.32089 6.588 1.3e-09 ***
V2 0.03883 0.01277 3.040 0.00292 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6231 on 118 degrees of freedom
Multiple R-squared: 0.07262, Adjusted R-squared: 0.06476
F-statistic: 9.24 on 1 and 118 DF, p-value: 0.002917
> anova(fit)
Analysis of Variance Table
Response: V1
Df Sum Sq Mean Sq F value Pr(>F)
V2 1 3.588 3.5878 9.2402 0.002917 **
Residuals 118 45.818 0.3883
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
以上のことから、最も重要な値はPr(> F)でしょうか?したがって、このPrは0.05(95%レベル)未満です。これを「説明」するにはどうすればよいですか?「関連付け」で説明しますか。つまり、V2とV1は関連付けられていますか(関連付けられていません)?または「重要性」の観点から?「この価値は大事だなぁ…」と言われると、理解できないといつも思っていました。では、「重要」とは何でしょうか。より直感的な形式の説明はありますか?「私は95%確信している……」のように。
また、Pr値は唯一の重要な情報ですか。または、残差と残りの出力を見て結果を「説明」することもできますか?ありがとう
fitted_data