qsub経由で送信されたジョブを一時停止することはできますか?


10

小さなクラスターでジョブを実行しています。経由で提出しましたqsub。現在、私のラボメートは私よりも緊急にリソースを必要としているため、可能であれば、ジョブを強制終了するか一時停止する必要があります。

ジョブを一時停止して、CPU、RAMなどを解放する方法はありますか?

私は通常のユーザーです(root権限はありません)。


1
まだ実行していないジョブをqholdで保留できますが、これはすでに実行中のジョブには影響しません。qmod実行中のジョブを一時停止できるようですが、rootまたはmanager権限が必要です。
jofel

(それに応じて設定されている場合)あなたの仕事を中断することができますが、管理者のみがそれを再開することができます:あなたはMOABクラスタを持っていると仮定するとdocs.adaptivecomputing.com/mwm/Content/topics/jobAdministration/...
オットToomet

回答:


6

ジョブが開始されていない場合は、で保留にすることができますqholdqrls再起動に使用します。

qhold <job ID>
qrls <job ID>

それらがすでに実行されている場合はqsig、ジョブを一時停止および再開するために使用できます(そのための追加の権限が必要な場合があります。その場合は管理者に問い合わせてください)。

qsig -s suspend <job ID>
qsig -s resume <job ID>

ジョブを再開したら、強制的に実行する必要があるかもしれません qrun

qrun <job ID>

PBSPro 13.0.2.153173を搭載したSLES 11 SP4システムでテストされましたが、他のPOSIX準拠のバッチジョブ送信システムでも動作するはずです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.