タスク完了時間の変動はメイクスパンにどのように影響しますか?


16

私たちは、タスクの大規模なコレクションを持っていることをみましょうと言うτ1,τ2,...,τnおよびプロセッサ(性能の点で)同一のコレクションはρ1,ρ2,...,ρm並列に完全に動作します。興味のあるシナリオでは、我々は仮定してもよいmn。各τiそれがプロセッサに割り当てられると完了するまでに時間/サイクルのいくつかの量をとりρj、そして一度割り当てられると、完了するまで再割り当てすることはできません(プロセッサは常に割り当てられたタスクを常に完了します)。各仮定しよう時間を要する/サイクルはX 私は、ない、事前に知られているいくつかの離散確率分布から取られました。:この質問のために、私たちも、単純な分布と仮定することができますP X I = 1 =は、P X I = 5 = 1 / 2、およびすべてのX iのあるペアごとに独立を。したがって、μ iの = 3στiXiP(Xi=1)=P(Xi=5)=1/2Xiμi=3σ2=4

静的に、時間/サイクル0で、すべてのタスクがすべてのプロセッサに可能な限り均等に、一様にランダムに割り当てられるとします。ので、各プロセッサρj割り当てられているn/m(私達はちょうど同様に想定することができるタスクをm|nの質問の目的のために)。メイクスパンを、割り当てられた作業を完了するための最後のプロセッサρが割り当てられた作業を終了する時間/サイクルと呼びます。最初の質問:

mnXiの関数として、makespan M何ですか?具体的には、E[M]何ですか?Var[M]

2番目の質問:

仮定、およびすべてのX iはそう、ペアごとに独立しているμ iが = 3及びσ 2 = 1mn、およびこれらの新しいX iの関数として、makespanとは何ですか?さらに興味深いことに、最初の部分の答えと比較してどうですか?P(Xi=2)=P(Xi=4)=1/2Xiμi=3σ2=1mnXi

後者への答えは、メイクスパンが長いという単純な思考実験の結果です。しかし、これはどのように定量化できますか?これが(a)物議を醸すか、または(b)不明な場合、例を投稿させていただきます。これに成功したかどうかに応じて、これらの同じ仮定の下での動的割り当てスキームに関する追加の質問を投稿します。前もって感謝します!

簡単なケースの分析:m=1

場合m=1すべてのnタスクが同じプロセッサにスケジュールされます。メイクスパンMは、nタスクを完全にシーケンシャルに完了する時間です。したがって、 V R [ M ]

E[M]=E[X1+X2+...+Xn]=E[X1]+E[X2]+...+E[Xn]=μ+μ+...+μ=nμ
Var[M]=Var[X1+X2+...+Xn]=Var[X1]+Var[X2]+...+Var[Xn]=σ2+σ2+...+σ2=nσ2

m>1max(Y1,Y2,...,Ym)Yi=Xinm+1+Xinm+2+...+Xinm+nmμY=nmμXσY2=nmσX2


いい質問です。唯一....今日締め切りがなかった場合
デイブ・クラーク

回答:


8

、我々はの面でこれを見ることができるとの代わりに、および。が、番目のプロセッサが処理を完了するのにかかる時間だとしましょう。m=k×nknnmTii

成長、確率 =(プロセッサのみ割り当てられいくつかのタスク)を近づくそうメイクスパンと定義、、近づく。nTi5kT=5i1max(Ti)E[M]5k

2番目のシナリオでは、これはため、プロセッサーの数を増やすと、4–2分割がより適切になります。4k

何についての -プロセッサーあたりのタスクの数を増やしますか?を増やすと逆の効果があり、不幸なタスクのセットを持つプロセッサを使用する可能性が低くなります。今家に帰りますが、後でこれに戻ります。私の「勘」は、が大きくなると、4–2スプリットと5–1スプリットの差がなくなり、が両方で同じになることです。そのため、特別な場合(および非常に小さい特定の値)を除いて、4–2は常に優れていると想定します。kkkE[M]E[M]kn

要約すると:

  • 分散が小さいほど、他はすべて同等です。
  • プロセッサの数が増えると、分散を小さくすることが重要になります。
  • プロセッサごとのタスクの数が増えると、分散を低くすることの重要性は低くなります。

+1優れた直観。これは私の考えを明確にするのにも役立ちます。そのため、プロセッサ数を増やすと、スケーリングの弱い仮定の下でメイクスパンが増加する傾向があります。また、タスクカウントの増加は、強力なスケーリングの仮定の下でメイクスパンを減少させる傾向があります(もちろん時間がかかります。作業/メイクスパン比が向上することを意味します)。これらは興味深い観察結果であり、真実のようです。
Patrick87

1つ目は、が固定および増加になる傾向があるという事実によって正当化されます。後者は、ます。分散は関数として線形に増加しません。それはあなたの思考と互換性がありますか(それは私があなたがこれまでに持っているものを解釈する方法です)?1(1P(X=5)k)n1knVar[X+X]=Var[X]+Var[X]=2σ24σ2=4Var[X]=Var[2X]k
Patrick87

「勘」がどこから来たのかわかりません。残りのヒューリスティックな推論とは一致しません。
アンドラスサラモン

2

タスクスケジューリング(およびビンパッキングなどの密接に関連する問題)を検討する際、ヒューリスティックな議論はしばしば誤解を招くことがわかります。直観に反する事態が発生する可能性があります。このような単純なケースでは、実際に確率論を行う価値があります。

ましょうと正の整数。が、プロセッサー与えられた番目のタスクを完了するのにかかったと仮定します。これは、平均および分散ランダム変数です。最初のケースで予想されるメイクスパンは、 がすべてiid であると仮定すると、 合計は平均および分散 iidです(これはペアごとの独立性よりも強力です)。n=kmkTijjiμσ2

E[M]=E[max{j=1kTiji=1,2,,m}].
kμkσ2Tij

最大値の期待値を得るには、分布に関する詳細情報が必要か、次のような分布のない境界に落ち着く必要があります。

  • ピーターJ.ダウニー、スケジューリングアプリケーションとの最大の期待に分布無境界、オペレーションズリサーチ手紙9、189-201、1990 DOI:10.1016 / 0167から6377(90)90018-Z

プロセッサ単位の合計がiidの場合に適用できます。基礎となる時間がペアで独立している場合、これは必ずしも当てはまりません。特に、定理1によって、予想されるメイクスパンはによって上に制限され ダウニーは、この限界を達成する特定の分布も提供しますが、分布はように変化し、まったく自然ではありません。

E[M]kμ+σkn12n1.
n

境界は、パラメーター、プロセッサー、またはプロセッサーごとのタスク数いずれかのパラメーターが増加すると、予想されるメイクスパンが増加する可能性があることに注意してください。σ2nk

2番目の質問では、メイクスパンが大きくなる低分散シナリオは、思考実験の結果とは考えられません。ましょ最初の配布のためのメイクスパンを表し、そして(他のすべてのパラメータと同じで)秒。ここで、とは、2つの分布の下でプロセッサ対応するタスク期間の合計を示します。すべての、独立性は X=maxi=1mXiY=maxi=1mYiXiYikixkμ

Pr[Xx]=i=1mPr[Xix]i=1mPr[Yix]=Pr[Yx].
最大値の確率分布の質量の大部分はその平均を上回るため、はよりも大きくなる傾向があります。これは完全に厳密な答えではありませんが、要するに、2番目のケースが望ましいようです。E[X]E[Y]
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.