タグ付けされた質問 「excel」

Microsoft Excelは、市販のスプレッドシートプログラムです。このタグは、(a)Excelが質問の重要な部分または予想される回答として含まれているトピックに関する質問に使用します。(b)は、Excelの使い方だけではありません。

8
最適なラインは、良いフィットのようには見えません。どうして?
このExcelグラフをご覧ください。 「常識的な」最適なラインは、ポイントの中心を真っ直ぐに通るほぼ垂直の線に見えます(手作業で赤で編集)。ただし、Excelによって決定された線形トレンドラインは、示されている黒い斜めのラインです。 Excelが(人間の目には)間違っているように見える何かを生成したのはなぜですか? もう少し直感的に見える最適な線(赤い線など)を作成するにはどうすればよいですか? 更新1.データとグラフを含むExcelスプレッドシートは、サンプルデータ、PastebinのCSVで入手できます 。type1およびtype2回帰手法はExcel関数として利用できますか? 更新2。このデータは、風と共に漂流している間にサーマルで登るパラグライダーを表します。最後の目的は、風の強さと方向が高さによってどのように変化するかを調べることです。私はエンジニアであり、数学者や統計学者ではないので、これらの回答の情報は、私が研究するためのより多くの分野を与えてくれました。

8
統計ワークベンチとしてのExcel
多くの人々(私を含む)がExcelで探索的データ分析を行うことを好むようです。スプレッドシートで許可されている行数などの制限は苦痛ですが、ほとんどの場合、Excelを使用してデータを操作することは不可能ではありません。 しかし、McCulloughとHeiserの論文は、Excelを使用しようとすると、結果がすべて間違っていること、そしておそらく地獄で燃え上がることを実際に叫んでいます。 この論文は正しいですか、それとも偏っていますか?著者は、彼らがマイクロソフトを嫌うように聞こえます。

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

5
加重標準偏差を計算するにはどうすればよいですか?Excelで?
だから、私はそのようなパーセンテージのデータセットを持っています: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) パーセンテージの標準偏差を見つけたいのですが、データ量に重みがあります。つまり、最初と最後のデータポイントが計算を支配する必要があります。 それ、どうやったら出来るの?そして、Excelでそれを行う簡単な方法はありますか?

1
lmerモデルからの効果の再現性の計算
混合効果モデリングによる測定の再現性(別名信頼性、別名クラス内相関)の計算方法を説明するこの論文に出会ったばかりです。Rコードは次のようになります。 #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
t検定を実行するためにExcelを使用して正規分布を確認する方法は?
t検定を使用するための要件が​​満たされていることを確認するために、Excelでデータセットの正規性を確認する方法を知りたいです。 右尾については、平均と標準偏差を計算し、平均から1、2、3標準偏差を加算して範囲を作成し、使用後の標準正規分布の正規68/95 / 99.7と比較するのが適切ですか?各標準偏差値をテストするには、Excelのnorm.dist関数を使用します。 または、正常性をテストするより良い方法はありますか?

3
2つのドットが接続された行を持つこのプロットの名前は何ですか?
私はEIAレポートを読んでおり、このプロットは私の注目を集めました。同じ種類のプロットを作成できるようになりたいと思います。 2年間(1990〜2015年)のエネルギー生産性の進化を示し、この2つの期間の間に変化値を追加します。 このタイプのプロットの名前は何ですか?Excelで同じプロットを(異なる国で)作成するにはどうすればよいですか?

4
主観的なランク順の結果をどのようにグラフ化しますか?
ノンパラメトリックテストとは別に、主観的なランキングを視覚化する方法を探しています。 12人の参加者に、さまざまな主観的基準(それぞれのランキングを個別にランク付け)に従って8種類のアイテムをランク付けするように依頼しました。ランキングの個々のセットについて、ランキングの高レベルの傾向を視覚化する良い方法を探しています。 私は平均ランキングで棒グラフとレーダープロットの両方を試しましたが、他の人がランキングごとの応答数について散布図/バルーンプロットを使用しているのを見たことがありますが、何が最良の概要を伝えるかはよくわかりません。8つの平均ランキング、またはアイテムごとの各ランキングの8つのカウントを使用できます。 編集: 例:各列はアイテムであり、各行は8つのアイテムのそれぞれの人のランキングです。この例では特に強力な合意ではありませんが、一般的に全体的な傾向を伝える最良の方法を理解したいと考えています。 Item: A B C D E F G H Rater: 1 6 8 1 7 3 4 2 5 2 1 3 8 7 6 5 2 4 3 5 8 7 6 1 4 2 3 4 5 8 7 6 4 2 1 …

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
最適なラインがあります。最適なラインを変更しないデータポイントが必要です
線のフィッティングに関するプレゼンテーションを行っています。単純な線形関数ます。散布図に入れることができる散布データポイントを取得しようとしています。これにより、同じ方程式に最適なラインを維持できます。y=1x+by=1x+by=1x+b RまたはExcelのどちらか簡単な方でこのテクニックを学びたいです。

3
PowerPointで使用するのに最適なオープンソースデータ視覚化ソフトウェア
最高のオープンソースデータ視覚化ソフトウェアは何ですか?次のものが必要です。 Microsoft Excelからデータをインポートできます(Oracleデータベースからデータをインポートすることもできますが、これは必須ではありません)。 ソフトウェアによって生成されたグラフは、Microsoft PowerPointにエクスポートできます(コピーと貼り付けは問題ありません)。 オープンソースで使いやすい。


2
頻度表を値のベクトルに変換する方法は?
RまたはExcelを使用して、頻度テーブルを値のベクトルに変換する最も簡単な方法は何ですか? たとえば、次の頻度表をどのように変換しますか Value Frequency 1. 2 2. 1 3. 4 4. 2 5. 1 次のベクトルに? 1, 1, 2, 3, 3, 3, 3, 4, 4, 5
13 r  dataset  excel 

2
RとExcelの自己相関の式
Rがlag-k自己相関を計算する方法を理解しようとしています(明らかに、MinitabとSASで使用されているのと同じ式です)ので、シリーズとそのk-lagedバージョンに適用されるExcelのCORREL関数の使用と比較できます。RとExcel(CORRELを使用)は、わずかに異なる自己相関値を提供します。 また、ある計算が他の計算よりも正しいかどうかを調べることにも興味があります。
13 r  sas  autocorrelation  excel 

1
GBMパッケージとGBMを使用したキャレット
私はを使用してモデルのチューニングを行ってきましたがcaret、gbmパッケージを使用してモデルを再実行しています。caretパッケージが使用gbmし、出力が同じである必要があることは私の理解です。ただし、を使用した簡単なテスト実行でdata(iris)は、評価指標としてRMSEとR ^ 2を使用したモデルで約5%の不一致が示されています。を使用して最適なモデルのパフォーマンスを見つけたいが、部分的な依存関係プロットを利用するためにcaret再実行しgbmます。再現性のために以下のコード。 私の質問は次のとおりです。 1)これらの2つのパッケージは同じであっても違いがあるのはなぜですか(確率的ですが、5%がやや大きな違いであることがわかります。特に、次のような素晴らしいデータセットを使用していない場合 iris、モデリングの) 。 2)両方のパッケージを使用する利点または欠点はありますか? 3)無関係:irisデータセットを使用した場合、最適な値interaction.depthは5ですが、読み取り値が最大値floor(sqrt(ncol(iris)))である2 を超えるはずです。これは厳密な経験則ですか、それとも非常に柔軟ですか。 library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.