タグ付けされた質問 「combinatorics」

セットまたは他の有限離散構造の要素をカウントまたは列挙します。

2
同じ名前の同じクラスの5人の子供の確率
赤ちゃん命名フォーラムでは、将来の両親は常に自分のフィアオブジェニファーのバージョンを繰り返します。物事は、もはやそのような人気に近づく名前はなく、ジェニファーの大流行の高さでさえ、あなたはクラスでそれらのうちの5つを取得しませんでした。名前の繰り返しのこのような偶然がどれほどあり得ないかについて、これらの両親のためのある種の答えを望みます。 社会保障局の豊富な赤ちゃんの名前のデータ(https://www.ssa.gov/oact/babynames/limits.html)を使用して、米国の小学校のクラスが5つある可能性を理解する方法を誰かに教えてもらえますか同じ名前の子供?(簡単にするために、「同じ名前」とは、同じスペルを意味し、「学校のクラス」とは、すべての子供が同じ年に生まれたことを意味します。)私はクラスサイズを指定していませんが、4より大きくする必要があります。:-)

1
ラテン語の正方形では、行、処理、列が直交していると言われている理由
私は常に幾何学の分野で「直交」を聞いてきました(私もネイティブスピーカーではないことに注意してください)。ラテン語の四角形(教科書からの引用)について、次のことが理解できません。 すべての処理(ABCD)は、各行に1回表示されます。したがって、処理と行は直交しています。...行と列は処理に直交しています。 12341ABCD2BCDA3CDAB4DABC12341ABCD2BCDA3CDAB4DABC\begin{matrix}\,&1&2&3&4\\1&A&B&C&D\\2&B&C&D&A\\3&C&D&A&B\\4&D&A&B&C\end{matrix} ここで直交性とはどういう意味ですか?

1
連続してボールを選択してマークすることにより、ボールの数を推定する
バッグにN個のボールがあるとします。最初のドローで、ボールにマークを付けてバッグに戻します。2回目の抽選で、マークされたボールを手に取ったら、バッグに戻します。ただし、マークの付いていないボールを拾った場合は、マークを付けてバッグに戻します。私はこれを何度も引き続けます。ドローの数とマークされた/マークされていないドローの履歴が与えられた場合、バッグ内の予想ボール数はいくつですか?

1
文字列の長さと可能な文字に基づく簡単な組み合わせ/確率の質問
「完全なランダム性」を想定し、各文字が62の可能な文字の1つである可能性がある20文字の長さの文字列が与えられた場合: 可能な組み合わせの総数はいくつですか?(20の62乗を推測します。) また、新しい文字列が次々とランダムに選択され、これまでに選択された文字列のリストに追加された場合、すでに選択されている文字列を選択する機会が1-in-100000()?10−510−510^{-5} 注: 62の由来は、数字(0-9)、大文字(AZ)、および小文字(az)です。

3
1から100までの2つの異なる整数をランダムに選択します。大きい数が小さい数の2倍になる確率はどのくらいですか?
私は最近、データサイエンスポジションのHackerRankテストを受けましたが、この質問は間違っていました。に来ました1/200。方法は次のとおりです。 これを実現する50の組み合わせがあります。(つまり、{1,2}、{2,4}、{3,6} ... {50,100})。特定の番号が選択される確率は1/100です。特定のセットが選択される確率は(1/100 * 1/100)です。 50セットあるので、 P=50*(1/100)*(1/100)=1/200 もちろん、1と100が含まれていると想定しています。しかし、これは間違った答えでした。誰かが私の間違いを理解するのを手伝ってくれる?

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

2
文字列内で順番に出現する文字の確率
個の記号を含むアルファベットとします。ここで、、および\ Pr(\ $)= 1-(\ Pr(a)+ \ Pr(b)+ \ cdots)= 1-mp。m+1m+1m+1{a,b,c,d,e,...,$}{a,b,c,d,e,...,$}\{a, b, c, d, e,..., \$\}のPr ($ )= 1 - (Prを()+ のPr (B )+ ⋯ )= 1 - M Pp=Pr(a)=Pr(b)=⋯p=Pr(a)=Pr(b)=⋯p = \Pr(a) = \Pr(b) =\cdotsPr($)=1−(Pr(a)+Pr(b)+⋯)=1−mpPr($)=1−(Pr(a)+Pr(b)+⋯)=1−mp\Pr(\$) = 1 - (\Pr(a)+\Pr(b)+\cdots)=1-mp 長さnのランダム文字列の場合nnn、文字a,b,c,...a,b,c,...{a, b, c, ...}(\ $を含まない$$\$)が順番に(必ずしも連続しているわけではありません)出現する確率はどれくらいですか?つまり、文字列の長さはnnnで、正規表現* a * b * c * \ …

1
シュエット=ネスビットの公式
私は、Schuette–Nesbitt公式についての記事を読んでいました。これは、組み合わせバージョンと確率的バージョンの両方を含む「包含/除外原理の一般化」と表現されています。別のウェブサイトは依存イベントの証明(pdfダウンロード)を提供し、それをワーリングの定理(pdf)と比較する3分の1を見つけました しかし、私はまだ混乱しています。式を全体的に理解するのに役立つように、ステップをある行から次の行まで明確にする離散確率(簡単にするため)を使用して、明確に解決された例を見つけてみました。 適切なリファレンス、または簡単に解決された例を提供できる回答はありますか?

2
Rで可能なすべての組み合わせのいくつかを取得するにはどうすればよいですか?
場合によっては、データの可能なすべての組み合わせを調べて、平均間の観察された差異をテストできる経験的分布を構築することにより、正確なテストを実行したい場合があります。可能な組み合わせを見つけるには、通常、combin関数を使用します。選択機能により、可能な組み合わせの数がわかります。組み合わせの数が非常に大きくなるのは非常に簡単で、combin関数の結果を保存することは不可能です。そこで、架空の「スタック」から一度に1つずつ値を提供するために、combin関数と同じロジックを実行するオブジェクトを作成してみました。ただし、この方法(私がインスタンス化したもの)は、妥当な組み合わせサイズでのCombnよりも50倍も遅くなります。 Combnで使用されるアルゴリズムよりもこのようなことを行うためのより良いアルゴリズムはありますか?

2
ランダムに選択されたアメリカ人は、2人が同じまたは隣接する州に50%の確率で住むために何人必要ですか?
バックグラウンド 一般的な偶然と、それにもかかわらず(不当に)平均的な人に印象を与える「近い」偶然を研究しています。以下の質問は、「2人が同じ誕生日を共有する確率が50%になるためには、ランダムに選択された人は何人必要か?」と尋ねる有名な誕生日問題の拡張です。答えはです。(実際には、誕生日が年間を通じて均一に分散されていないという事実を組み込むと、少し低くなりますが、代わりに特定の月に「まとまり」になり、2人が同じ誕生日を共有する可能性が高くなります。)条件を緩和し、同じ誕生日である、または1日だけ異なるという「ほぼ」の偶然を許可します。答えはに下がります。232323141414 以下は誕生日の問題の拡張ですが、もっと面白くて複雑です。 ランダムに選択されたアメリカ人のうち、2人がa)同じ州に住んでいる、またはb)同じまたは隣接した州に住んでいる可能性が50%になるには、どれくらいの数のアメリカ人が必要ですか? 50の州とその人口のリストが与えられていると仮定します。 S={(AL,4.803M),(AK,0.738M),(AR,2.978M),…}S={(AL,4.803M),(AK,0.738M),(AR,2.978M),…}{\cal S} = \{ (AL, 4.803M), (AK, 0.738M), (AR, 2.978M), \ldots \} 状態隣接情報(自己隣接を含む)を含む隣接行列(または無向グラフ)と同様に、境界を共有します。MM{\bf M}ggg {(CA,CA),(CA,WA),(CA,NV),(CA,AZ),(AK,AK),(ME,NH),…}{(CA,CA),(CA,WA),(CA,NV),(CA,AZ),(AK,AK),(ME,NH),…}\{ (CA, CA), (CA, WA), (CA, NV), (CA, AZ), (AK, AK), (ME, NH), \ldots \}。 条件付き確率を使用して、確率的シミュレーションに頼らずにこの問題を計算することに注意してください。このような厳密なアプローチは原則に基づいており、非常に大きな問題に対してより自然に一般化されます。 a)へのアプローチは誕生日問題の一般化ですが、b)への回答は少し複雑に見えます。 私は方程式(と説明)だけを求めています。その後、国勢調査と地理データを使用して数値を計算できます。 ここで、確率的検索を通じて、b)への答えは(おそらく驚くべき)わずか3.5人であることに注意します。4人の場合、可能性はほぼ60%であり、少なくとも2人は同じ州または近隣の州からです。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.