複合イベントの期待値を計算する方法は?


7

期待値の計算方法がわからないので、参考になれば幸いです

ロットには17品目が含まれており、各品目は2人の品質保証エンジニアによる検査の対象です。各エンジニアは、ランダムに独立して、ロットから4つのアイテムを選択します。以下によって選択されるアイテムの予想数を決定します。

a。両方のエンジニアb。どちらのエンジニアc。ちょうど1人のエンジニア。


3
2番目のエンジニアの観点から、これは超幾何実験です。
Jarle Tufto 2017年

2
おそらく最も簡単な解決策は、17項目のインジケーター関数を活用することです。期待の線形性と2つの選択の独立性を使用します。
whuber

回答:


3

これは、インジケーター変数の使用に関する演習です。インジケータが値を持っています1 ある条件が成立し、値が 0さもないと。確率と期待に関する一見困難な問題は、関係する確率変数が独立していない場合でも、インジケーターと期待の線形性を活用する簡単な解決策を持つことができます。これらのアイデアに不慣れな方のために、以下に詳細を示します。


エンジニアを「X」と「Y」と呼びます。によるモデルXの選択17 インジケータ変数 バツ =1217、 どこ

{バツ=1 Xがiを選択したときバツ=0 さもないと。

同様にインジケーター変数を定義する Y Yの選択。

問題の条件を代数的に表すことができます。

  • その指標 両方で選択されています バツY
  • その指標 どちらでもない 1バツ1Y
  • その指標 Xによってのみ選択されます バツ1Y
  • その指標 Yのみによって選択されます 1バツY

によって選択された総数 バツ です

4=バツ1+バツ2++バツ17=Σ=117バツ

明らかにすべて 34変数は同じように分散されます。しましょうμ彼らの共通の期待である。なぜなら

4=E[4]=E[Σ=117バツ]=Σ=117E[バツ]=Σ=117μ=17μ

私たちは推測します

μ=417

変数は独立していませんが、 バツ から独立していると仮定されます Y

a。両方で選択されたアイテムの予想数

両方で選択されたアイテムの総数は、 バツY。したがって、予想される数は

E[Σ=117バツY]=Σ=117E[バツY]=Σ=117E[バツ]E[Y]=Σ=117417417=4217

の独立 バツ そして Y それぞれを表現するために必要でした E[バツY] の製品として E[バツ] そして E[Y]

b。どちらも選択していないと予想されるアイテム数

どちらもが選択したアイテムの総数は、 1バツ1Y。すべてから1バツ すべてから独立しています 1Y、(a)とまったく同じ方法が適用されます。唯一の変化は4/17 に置き換えられます E[1バツ]=E[1Y]=13/17。値は

E[Σ=1171バツ1Y]=13217

c。正確に1つによって選択されたアイテムの予想数

これは(a)または(b)のように解決できます。 4/17×13/17=52/17 Xだけで選択されるチャンスとして 13/17×4/17=52/17 Yだけが選択する確率として。答えはこれらの(ばらばらの)イベントの合計であり、 104/17

ショートカット(または作業のチェック)は、すべての項目が両方のカテゴリのいずれかに正確に分類されるか、どちらにも分類されないか、または正確に1つに分類されることに注意することです。したがって、答えは合計(17)および(a)と(b)の回答の合計:

17421713217=10417

シミュレーションで確認

これらの選択の10,000(たとえば)シミュレーションを実行して、結果を追跡しましょう。(a)両方で選択されたアイテムの平均数、(b)どちらでも選択されなかったアイテムの平均数、(c)1つだけで選択されたアイテムの平均数を出力できます。この出力の下に、参照として、(a)、(b)、および(c)で与えられた回答を印刷してみましょう。効率を上げようとはしません。目的は、説明されているように選択プロセスをモデル化し、算術的なトリックを行わずにイベントを直接カウントアップすることです。以下は、R約1秒しかかからないが、かなり目立つ方法でそれを行うコードです。

n.sim <- 1e4 # Number of iterations
n <- 17      # Number of items
k <- 4       # Numbers chosen by each engineer

set.seed(17) # Creates reproducible output
sim <- replicate(n.sim, {
  x <- sample.int(n, k)                       # X chooses `k` items
  y <- sample.int(n, k)                       # Y chooses 'k' items
  x.and.y <- intersect(x,y)                   # Find those chosen by both
  not.x.and.not.y <- setdiff(1:n, union(x,y)) # ... .... chosen by neither
  x.only <- setdiff(x, y)                     # ... .... chosen only by x
  y.only <- setdiff(y, x)                     # ... .... chosen only by y
  c(Both=length(x.and.y),                     # Count those chosen by both
    Neither=length(not.x.and.not.y),          # Count those chosen by neither
    One=length(x.only) + length(y.only)       # Count those chosen by one
  )
})

signif(rbind(Simulation=rowMeans(sim),                   # Average the simulations
      Theory=c(k^2/n, (n-k)^2/n, n-(k^2+(n-k)^2)/n)), 4) # Give theoretical values

2行の出力(多くのシミュレートされた試行の平均と以前に与えられた理論的な回答)は、回答の正確さをサポートするのに十分近いです。

             Both Neither   One
Simulation 0.9315   9.932 6.137
Theory     0.9412   9.941 6.118
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.