統計とビッグデータ

統計、機械学習、データ分析、データマイニング、およびデータの視覚化に興味がある人のためのQ&A

6
ロジスティック回帰とパーセプトロンの違いは何ですか?
Andrew Ngの機械学習に関する講義ノートを読んでいます。 このノートでは、ロジスティック回帰とパーセプトロンを紹介しています。パーセプトロンについて説明している間、注記では、ロジスティック回帰に使用されるしきい値関数の定義を変更するだけであると述べています。その後、パーセプトロンモデルを分類に使用できます。 したがって、私の質問は-これを指定する必要があり、パーセプトロンを分類手法と見なす場合、ロジスティック回帰とは正確には何ですか?クラスの1つに属するデータポイントの確率を取得するためだけに使用されますか?

5
個々の研究者は、誤発見率をどのように考えるべきですか?
私は、False Discovery Rate(FDR)が個々の研究者の結論をどのように知らせるべきかについて頭をかき回そうとしています。たとえば、研究の能力が不足している場合、有意であったとしても結果を割り引く必要がありますか?注:複数のテスト修正の方法としてではなく、複数の研究の結果を総合的に検討するという文脈でFDRについて話している。α = .05α=.05\alpha = .05 (多分寛大な)の仮定を作るテストの仮説が実際に真であるが、FDRは、タイプIの両方の関数であり、次のようにIIエラー率を入力します。〜0.5∼.5\sim.5 FDR = αα + 1 - β。FDR=αα+1−β.\text{FDR} = \frac{\alpha}{\alpha+1-\beta}. ある研究が十分な能力を持たない場合、十分な能力のある研究の結果と同様に、結果が有意であっても、結果を信頼すべきではないことは理にかなっています。したがって、一部の統計学者が言うように、「長期的に」、従来のガイドラインに従えば、誤った多くの重要な結果を公開する可能性がある状況があります。研究の一貫性が一貫して不十分な研究によって特徴づけられている場合(例えば、過去10年間の候補遺伝子環境相互作用の文献)、複製された重要な発見でさえ疑われる可能性があります。××\times Rパッケージを適用するとextrafont、ggplot2とxkcd、私はこれが有効として概念かもしれないと思うの視点の問題: この情報を与えられた場合、個々の研究者は次に何をすべきでしょうか?私が勉強している効果の大きさを推測している場合(したがって、サンプルサイズを考慮して推定値)、FDR = .05までαレベルを調整する必要がありますか?私の研究が十分ではなく、FDRの考慮を文献の消費者に委ねる場合でも、α = .05レベルで結果を公開する必要がありますか?1 - β1−β1 - \betaαα\alphaα = .05α=.05\alpha = .05 これは、このサイトと統計文献の両方で頻繁に議論されているトピックであることは知っていますが、この問題に関する意見の一致を見つけることができないようです。 編集: @amoebaのコメントに応じて、FDRは標準のタイプI /タイプIIエラー率分割表から導出できます(そのさをご容赦ください)。 | |Finding is significant |Finding is insignificant | |:---------------------------|:----------------------|:------------------------| |Finding is false in reality …

3
2つのサンプルが同じ母集団から引き出されているかどうかを判断する統計的テスト?
2つのサンプルがあるとします。それらが異なる母集団から引き出されているかどうかを知りたい場合は、t検定を実行できます。しかし、サンプルが同じ母集団からのものであるかどうかをテストしたいとしましょう。これをどのように行うのですか?つまり、これら2つのサンプルが同じ母集団から引き出された統計的確率を計算するにはどうすればよいですか?

3
ブートストラップ分布の平均を報告してみませんか?
パラメータをブートストラップして標準エラーを取得すると、パラメータの分布が得られます。取得しようとしているパラメーターの結果または推定値として、その分布の平均を使用しないのはなぜですか?分布は実際の分布に近似すべきではありませんか?したがって、「実際の」値の適切な推定値を取得できますか?それでも、サンプルから取得した元のパラメーターを報告します。何故ですか? ありがとう

3
LASSOのインジケータ/バイナリ/ダミー予測子を再スケールするかどうか
LASSO(およびその他のモデル選択手順)の場合、予測変数を再スケーリングすることが重要です。一般的な 推奨 私が従うは 0平均、連続変数の1つの標準偏差正規化を使用するだけです。しかし、ダミーとどう関係があるのでしょうか? 例えば、私がリンクした同じ(優秀な)サマースクールのいくつかの応用例は、連続変数を0から1の間にスケールし直します(ただし、外れ値にはあまり適していません)。しかし、それでも係数が同じ桁であることを保証するものではなく、したがって同様にペナルティを課されることを保証しません。

3
どの分散インフレ率を使用する必要があります:または?
vifRパッケージの関数を使用して、分散インフレ率を解釈しようとしていますcar。この関数は、一般化されたと両方を出力し。ヘルプファイルによると、この後者の値VIFVIF\text{VIF}GVIF1 /(2 ⋅ DF )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} 信頼楕円体の次元を調整するために、関数はGVIF ^ [1 /(2 * df)]も出力します。ここで、dfは項に関連付けられた自由度です。 ヘルプファイルでこの説明の意味がわからないため、またはを使用すべきかどうかわかりません。私のモデルのためにこれらの2つの値が非常に異なっている(最大〜ある、最大値は〜ある)。GVIFGVIF\text{GVIF}GVIF1 /(2 ⋅ DF )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})}GVIFGVIF\text{GVIF}606060GVIF1 /(2 ⋅ DF )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})}333 誰かが私にどれを使用すべきか、そして信頼楕円体の次元を調整することの意味を教えてください。

3
サンプルサイズが変数の数より小さいときに、サンプルの共分散行列が特異なのはなぜですか?
次元の多変量ガウス分布があるとしましょう。そして、この分布から観測値(それぞれベクトル)を取得し、標本共分散行列を計算します。この論文では、著者は、計算されたサンプル共分散行列は特異であると述べています。pppnnnpppSSSp>np>np > n それはどのように真実または派生していますか? 説明はありますか?

4
McNemarの検定とカイ2乗検定の違いは何ですか?また、それぞれを使用するタイミングをどのように知るのですか?
さまざまなソースで読み上げようとしましたが、私の場合、どのテストが適切かはまだわかりません。データセットについて質問している3つの質問があります。 被験者は、異なる時間にXからの感染についてテストされます。Xの正の比率がXの正の比率に関連するかどうかを知りたい: After |no |yes| Before|No |1157|35 | |Yes |220 |13 | results of chi-squared test: Chi^2 = 4.183 d.f. = 1 p = 0.04082 results of McNemar's test: Chi^2 = 134.2 d.f. = 1 p = 4.901e-31 私の理解では、データは繰り返し測定されるため、McNemarの検定を使用する必要があります。McNemarの検定は、Xの陽性の割合が変化したかどうかを検定します。 しかし、私の質問にはカイ2乗検定が必要なようです。Xafterの陽性の割合がX beforeの陽性の割合に関連しているかどうかをテストします。 McNemarの検定とカイ2乗の違いを正しく理解しているかどうかさえわかりません。私の質問が「Xに感染した被験者の割合が以前と異なっているか」という場合、正しいテストは何でしょうか? 同様のケースですが、前後の代わりに、ある時点で2つの異なる感染を測定します。 Y |no |yes| X|No |1157|35 | |Yes …


5
協調フィルタリングでSVDを使用するにはどうすればよいですか?
共同フィルタリングでSVDがどのように使用されるか、少し混乱しています。ソーシャルグラフがあり、エッジから隣接行列を作成し、SVD(正則化、学習率、スパース性最適化などを忘れましょう)を使用すると、このSVDを使用して推奨事項を改善できますか? 私のソーシャルグラフがinstagramに対応しており、ソーシャルグラフのみに基づいて、サービス内のユーザーを推奨する責任が課せられたとします。最初に隣接行列を作成し、SVD取得し、最初の固有値を選択します。(m × m )A = U s V kAA\mathbf A (m × m )(m×m)(m\times m)A = U s VA=UsV\mathbf A = \mathbf{U s V}kkk おそらく新しい行列のセットを作成します。 それでは何をしますか?うんN E WsN E WVN E W〜M × K〜K × K〜K × MUnew∼m×ksnew∼k×kVnew∼k×m\begin{align} \mathbf U_{new} &\sim m\times k \\ \mathbf s_{new} &\sim k\times k …

5
相互作用の深さはGBMで何を意味しますか?
Rのgbmの相互作用の深さパラメーターについて質問がありました。これはnoobの質問かもしれませんが、謝罪しますが、ツリーの末端ノードの数を示すと思われるパラメーターは、基本的にX-wayを示します予測子間の相互作用?仕組みを理解しようとしています。さらに、2つの異なる変数が単一の因子に結合されている場合を除き、同じデータセットに対して2つの異なる因子変数を含むデータセットがある場合、かなり異なるモデルが得られます(たとえば、因子1のXレベル、因子2のYレベルX * Y係数)。後者は前者よりもかなり予測可能です。相互作用の深さが増すとこの関係が生まれると考えていました。



5
多重線形回帰の最小二乗推定量を導き出す方法は?
単純な線形回帰のケースでは、最小二乗推定量、あなたが知っている必要はないように推定するために、β 1 = Σ (X I - ˉ X)(Y I - ˉ Y)y= β0+ β1バツy=β0+β1xy=\beta_0+\beta_1xβ 0 β 1β^1= ∑ (x私− x¯)(y私− y¯)∑ (x私− x¯)2β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2\hat\beta_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}β^0β^0\hat\beta_0β^1β^1\hat\beta_1 私がしたとし、どのように私は導出ん推定することなく?またはこれは不可能ですか?β 1 β 2y= β1バツ1+ β2バツ2y=β1x1+β2x2y=\beta_1x_1+\beta_2x_2β^1β^1\hat\beta_1β^2β^2\hat\beta_2

2
飽和非線形性という用語はどういう意味ですか?
ディープコンボリューショナルニューラルネットワークを使用したImageNet分類の論文を読んでいたのですが、セクション3では、コンボリューショナルニューラルネットワークのアーキテクチャについて説明し、次の使用方法を説明しました。 非飽和非線形性f(x )= m a x (0 、x )。f(バツ)=maバツ(0、バツ)。f(x) = max(0, x). 訓練するのが速かったからです。その論文では、CNNで使用されるより伝統的な関数、シグモイド関数および双曲線正接関数(すなわち、および(飽和)。f(x )= t a n h (x )f(バツ)=tanh(バツ)f(x) = tanh(x)f(x )= 11 + e− x= (1 + e− x)− 1f(バツ)=11+e−バツ=(1+e−バツ)−1f(x) = \frac{1}{1 + e^{-x}} = (1 + e^{-x})^{-1} なぜこれらの関数を「飽和」または「非飽和」と呼ぶのですか?これらの機能はどのような意味で「飽和」または「非飽和」ですか?畳み込みニューラルネットワークのコンテキストでは、これらの用語はどういう意味ですか?機械学習(および統計)の他の分野で使用されていますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.