タグ付けされた質問 「statistics」

12
オーバーフィットが悪いのはなぜですか?
私はこの多くを研究しましたが、機械学習でのアクションの過剰適合は悪いと言いますが、ニューロンは非常に強くなり、私たちが通り抜けたり回避したりする最高のアクション/感覚を見つけ、さらに悪いからデクリメント/インクリメントすることができます/ goodまたはbadトリガーによって、アクションが平準化され、最高の(右)、非常に強い自信のあるアクションになります。これはどのように失敗しますか?これは、正と負のセンストリガーを使用して、44posからのアクションをデ/再インクリメントします。22negに。

1
コイントスの例への期待値最大化の適用
私は最近、期待値の最大化について自己研究しており、その過程でいくつかの簡単な例を取得しました。 ここから:3枚のコイン、c 1、c 2があり、p 0、p 1、およびp 2は、投げられたときに頭に着く確率です。トスc 0。結果がHeadの場合、c 1を 3回トスし、それ以外の場合、c 2を 3回トスします。c 1およびc 2によって生成される観測データは、HHH、TTT、HHH、TTT、HHHのようなものです。隠されたデータはc 0の結果です。推定pc0c0c_0c1c1c_1c2c2c_2p0p0p_0p1p1p_1p2p2p_2c0c0c_0c1c1c_1c2c2c_2c1c1c_1c2c2c_2c0c0c_0、 P 1及び P 2。p0p0p_0p1p1p_1p2p2p_2 そしてここから:2つのコインとc Bがあり、p Aとp Bは投げられたときに頭に着く確率です。各ラウンドで、コインをランダムに1枚選択し、10回投げます。結果を記録します。観察されたデータは、これらの2つのコインによって提供されるトス結果です。ただし、特定のラウンドでどのコインが選択されたかはわかりません。p Aおよびp Bを推定します。cAcAc_AcBcBc_BpApAp_ApBpBp_BpApAp_ApBpBp_B 計算を取得することはできますが、それらの解決方法を元のEM理論に関連付けることはできません。具体的には、両方の例のMステップで、どのように最大化されているのかわかりません。パラメータを再計算しているようで、新しいパラメータは古いパラメータよりも優れています。さらに、2つのEステップは、元の理論のEステップは言うまでもなく、互いに似ているようにも見えません。 それでは、これらの例はどのように機能するのでしょうか?

6
間隔内の2つの数値の最大XORを見つける:二次式よりも良いことはできますか?
lllrrr L ≤ I 、最大(I ⊕ J )最大(私⊕j)\max{(i\oplus j)}L ≤ I 、J ≤ Rl≤私、j≤rl\le i,\,j\le r ナイーブアルゴリズムは、考えられるすべてのペアを単純にチェックします。たとえば、ルビーでは次のようになります。 def max_xor(l, r) max = 0 (l..r).each do |i| (i..r).each do |j| if (i ^ j > max) max = i ^ j end end end max end 私感私たちはより良い次より行うことができます。この問題のためのより良いアルゴリズムはありますか?

4
機械学習における相関と因果関係はどうですか?
「相関関係は因果関係に等しくない」ことはよく知られていますが、機械学習はほぼ完全に相関関係に基づいているようです。私は、過去のパフォーマンスに基づいて質問に対する学生のパフォーマンスを推定するシステムに取り組んでいます。Google検索などの他のタスクとは異なり、これは簡単にゲームをプレイできる種類のシステムではないようです。そのため、因果関係は実際には関係ありません。 明らかに、システムを最適化するための実験を行いたい場合、相関/原因の区別に注意する必要があります。しかし、適切な難易度になる可能性が高い質問を選択するシステムを構築するだけの観点から、この区別は重要ですか?

1
Naive Bayesモデルでの平滑化
Naive Bayes予測子は、次の式を使用して予測を行います。 P(Y= y| バツ= X )= α P(Y= y)∏私P(X私= x私| Y= y)P(Y=y|バツ=バツ)=αP(Y=y)∏私P(バツ私=バツ私|Y=y)P(Y=y|X=x) = \alpha P(Y=y)\prod_i P(X_i=x_i|Y=y) ここで、は正規化係数です。これには、データからパラメーターを推定する必要があります。 -smoothingでこれを行うと、推定値が得られますP (X I = X I | Y = Y )Kαα\alphaP(X私= x私| Y= y)P(バツ私=バツ私|Y=y)P(X_i=x_i|Y=y)kkk P^(X私= x私| Y= y)= #{ X私= x私、Y= y} + k#{ Y= y} + n私kP^(バツ私=バツ私|Y=y)=#{バツ私=バツ私、Y=y}+k#{Y=y}+n私k\hat{P}(X_i=x_i|Y=y) = \frac{\#\{X_i=x_i,Y=y\} + k}{\#\{Y=y\}+n_ik} …

4
研究主張の正確さを評価するために、統計はどのようにコンピューターサイエンスに適用されていますか?
私の短い学術生活の中で、私たちの地域で発表された多くの論文は統計に関してそれほど厳密ではないことがあります。これは単なる仮定ではありません。教授が同じことを言うのを聞いたことがあります。 たとえば、CSの分野では、方法論Xが効果的であることが観察され、ANOVAとANCOVAによって証明されたと主張する論文が発表されていますが、必要な制約が観察されたと評価している他の研究者への言及はありません。「複雑な関数と名前」が表示されるとすぐにそれはやや感じますが、それは、研究者が信頼できる方法とアプローチを使用していることを示しています。 、たとえば、コミュニティが評価できるように、その特定の分布またはアプローチについて。 場合によっては、このような小さいサンプルサイズで仮説を正当化するための言い訳があります。 したがって、ここでの私の質問は、統計学についてもっと学びたいという志を持つCS分野の学生として提起されています。コンピュータ科学者はどのように統計学に取り組みますか? この質問は、私がすでに説明したことを尋ねているように見えるかもしれませんが、それは私の意見です。私は間違っているかもしれないし、実践者のグループに焦点を当てているかもしれないが、CS研究者の他のグループは統計の厳密さに関してより良い実践に従う別のことをしているかもしれない。 具体的には、私が欲しいのは、「与えられた事実(論文の例、本、またはこれに関する別のディスカッション記事で結構です)のために、私たちの領域は統計に含まれているかどうかです。」です。@パトリックの答えはこれに近いです。


1
乱数ジェネレーターのシーケンスが1次元でのみ等分散されるとはどういう意味ですか?
上に読みながらXorshift I(強調は追加)以下に出くわしました: 次のxorshift +ジェネレーターは、代わりに128ビットの状態、最大周期2 ^ 128 − 1を持ち、BigCrushを渡します。 [snip code] このジェネレーターは、BigCrushを通過する最速のジェネレーターの1つです。ただし、これは1次元でのみ等分散されます。 この記事の前半には、次の内容があります。 [snip code] 両方のジェネレーターは、すべての最大周期のxorshift *ジェネレーターと同様に、可能な最大の次元で等分布された 64ビット値のシーケンスを出力します。 シーケンスが1つの次元で均等に分散されているのに対して、複数の次元で均等に分散されているとは、どういう意味ですか?

1
テンソルとしての条件付き確率?
次のような条件付き確率を表示することは適切ですか。 P(a | c) P(a | c、d) P(a、b | c、d) ...など、テンソルとして? もしそうなら、誰かがコンピュータ科学者/機械学習の実践者のためにその意味でテンソルを開発するまともな導入テキスト(オンラインチュートリアル、ワークショップペーパー、本など)を知っていますか? 私は多くの論文を見つけましたが、入門レベルで書かれたものは物理学者向けに書かれ、コンピュータ科学者向けに書かれたものはかなり進んでいます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.