エレクトロニクス企業は、95%の時間正常に動作するデバイスを製造しています


8

エレクトロニクス企業は、95%の時間正常に動作するデバイスを製造しています。新しいデバイスは400の箱で出荷されます。会社は、箱ごとにk以上のデバイスが機能することを保証したいと考えています。ボックスの少なくとも95%が保証を満たすための最大のkは何ですか?

試行:この問題には中央極限定理を使用する必要があることはわかっていますが、各ボックスには400個のデバイスがあり、ボックスの数は不明であるため、セットアップにどのNが必要かはわかりません。誰かがセットアップのヒントを教えてくれませんか?ありがとう!


3
これはひどい「現実世界」の質問であることに注意してください。エレクトロニクス製造のようなものでは、20分の1が失敗した場合、おそらく製造上の理由があります。それは天文学的に悪い率です。つまり、ランダム分布の正反対を期待する必要があります。k個のデバイスを数える唯一の方法は、デバイスを時間の大きなバリエーションにランダムに分散させ、400の多くのボックスにシフトすることです。一部の企業はまだ実際にこれを行っています。
blankip

@blankipチップ製造では、それよりもはるかに多くのランダムな欠陥が生じると思います。もちろん品質管理はされているので、実際にお客様に出荷されるデバイスの不良率は低くなります。
CodesInChaos 16

1
質問の言葉遣いが悪い。彼らが生産する製品の95%は機能するはずです。95%の確率で機能する場合、確実に機能するものはないため、実際に機能するものはありません。元のデザインで95%の時間しか機能しない場合を除き、その場合は問題ありません。
David

回答:


10

ボックス内のデバイスは独立していると想定する必要があります。 その場合、ボックス内の動作デバイスの数は二項分布に従う必要があります。パラメータは(ボックス内のデバイス数)と(稼働率)です。400.95

ボックスワークごとに以上のデバイスを保証するとします。そのようなボックスの少なくとも95%に個以上の作動デバイスが含まれていると言います。確率変数と分布の言語では、等しいかそれを超えるBinomial変数の確率は少なくともであると主張しています。解は、この分布の = 5パーセンタイルを計算することで見つかります。唯一のデリケートな部分は、これは個別の分布であるため、答えが1つにならないように注意する必要があることです。K 400 0.95 kは95 100 -kk(400,0.95)k95%10095

R5番目の百分位数はがわかります。k=373

qbinom(.05, 400, .95)

373

この値と同じかそれを超える可能性を計算して確認してみましょう。

pbinom(373-1, 400, .95, lower.tail=FALSE)

0.9520076

(少なくとも私にとっては、多少直観に反しlower.tail=FALSEますが、Rpbinom関数の引数にはその引数の値が含まれないということです。したがって、よりも厳密に大きいpbinom(k,n,p,lower.tail=FALSE)結果関連する可能性を計算しkます。)

再確認として、さらに大きな値を保証できないことを確認しましょう。

pbinom(373, 400, .95, lower.tail=FALSE)

0.9273511

したがって、のしきい値は、これら2つの連続する確率の間にあります。0.95

言い換えれば、

長期的には、ボックスのに以上の稼働デバイスが含まれますが、以上の稼働デバイスが含まれるのはのみです。したがって、以上のボックスがこの基準を満たすことを希望する場合、を超えることは保証できません。K = 373 92.7 374 373 95 95.2%k=37392.7%37437395%

ちなみに、正規分布、この特定の質問の優れた近似であることがわかります。(得られる答えを表示するのではなく、問題の設定方法に関する情報のみを要求したため、計算はあなたに任せます。)

このプロットは、二項分布関数をその近似正規確率と比較します。

図

2つは完全に一致しませんが、近くでは実際に非常に近くなります。k=373


答えはk = 373372ではなくと考えています。373以上のデバイスが動作する確率はで、必要な95%を超えています。
x=373400(400x)(0.95)x(10.95)400x0.952
Seeker14491 2016

@Seeker訂正ありがとうございます。それを反映するように説明を修正しました。
whuber

2

「少なくとも95%」から「少なくとも」は「分」を意味します。

コード:

#reproducible
set.seed(250048)

#how many times to check
N_repeats <- 500000

#stage for loop
temp <- numeric()

#loop
for (j in 1:N_repeats){

     #draw 400 samples at 95% rate
     y <- rbinom(n = 400,size = 1,prob = 0.95)

     #compute and store sampled rate
     temp[j] <- mean(y)

}

#print summary (includes min)
summary(temp)

結果:

> summary(temp)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.8900  0.9425  0.9500  0.9500  0.9575  0.9925

これを見ると、レートの最小値は89%です。これは、50万回の試行で、最悪のケースが89%機能していたことを意味します。

400の89%は356です。これにより、約100%が得られ、95%は得られません。実際の100%はこれより低い可能性があります。

#find the 95% case
quantile(temp,probs = 0.05)

収量:

> quantile(temp,probs = 0.05)
    5% 
0.9325 

400の93.25%は373です。これはデータのエッジではなく、内部であるため、おそらく適切な推定値です。あなたの答えは373に近いものになるでしょう。


2
現在rbinomがある「極端な値の分布」にプラグインしますか?どれを考えましたか?
マイクハンター

2
この分析は、100%のケースで、355以上のデバイスが機能したことを示しています。目標は、95%のケースでN以上のデバイスが機能するようにNを見つけることです。答えは356以上で、以下ではありません。最小ではなく、推定される分布の5パーセンタイルが必要です。
Nuclear Wang

@Mattは正しいです。実際、最悪のケースはです。あなたは、この記事で行ったように箱の唯一の95%が、良いことのための手当を無視した場合は、任意の正の値を提案する根拠がないですので、全てのを可能(ただし、天文学的に低い)いくつかのことボックスには、すべての非稼働デバイスを含めることができます。k=0k
whuber

@whuber-更新されました。
EngrStudent 16
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.