Windowsサーバーの再起動が必要になる頻度


77

少しの背景:私たちの部門にはいくつかのWindowsサーバー(2003、2008)があります。私たちはIT部門であるため、独自のサーバーを管理しています。ここにいる4人のうち、私はわずかなIT知識を持っている唯一の人です。(「わずかな量」に注意してください。)私の上司は、サーバーを少なくとも毎週再起動する必要があると言います。同意しません。私たちのIT部門は、彼女が絶えずそれらを再起動するので、それが私たちのハードドライブが故障し、電源がそれらに行く理由だと言います。(これは、過去4年間で数回、そしてごく最近、数台のサーバーで発生しました。)

質問は次のとおりです。誰がどのくらいの頻度でWindowsサーバーを再起動しますか?業界標準または推奨事項はありますか?IT部門は、再起動するためにハードウェアの問題が発生していると言っているのは正しいですか?(彼女の心を変えようとするなら、私には理由が必要です!)


111
ああ、毎月第2火曜日について。:)
jscott

4
ダン!私たちは毎月第4木曜日にやっていた!:)
エヴァン

2
私は反対のボートにいます。部門全体で1サーバーあたり約12人時間かかる1週間の議論がなければ、サーバーを再起動することはできません。はい、これにはパッチ適用のための再起動が含まれます。
-Hyppy

19
毎週再起動しても、ハードウェア障害が大幅に増加することはありません。
ジェームズライアン

3
サーバーは私のラップトップよりも頻繁に再起動されるようです。私は通常、使用していないときにスリープモードにします。再起動を行う通常の理由は、Windowsアップデートまたはソフトウェアのインストールです。
フィル

回答:


116

上司は、サーバーを少なくとも週に1回再起動する必要があると言っています

私は強く反対します。マイクロソフトは、安定性とアップタイムに関して、古き良き時代(NT、誰か?)から大きな進歩を遂げました。ITサポート内のコンセンサスがこれに伴って変わらないのは残念です。

全員がWindowsサーバーを再起動する頻度はどれくらいですか?

必要な場合のみ-OS /ソフトウェアの更新、他の方法では回復できない重大なソフトウェア障害、ハードウェアのアップグレード/交換、または再起動なしでは発生しないその他のアクティビティが原因です。1

業界標準または推奨事項はありますか?

それ自体、標準的な推奨事項を見たことはありませんが、特定の時間間隔で「必要なだけ」の再起動が必要であることを示す推奨事項(MS自体を除く)に同意できませんでした

IT部門は、再起動するためにハードウェアの問題が発生していると言っているのは正しいですか?

コンピュータのハードウェアアクティビティの最もストレスの多い期間は、再起動(さらには、電源の再投入)です。ディスクとファン... ...だけでなく、コンポーネントの温度の大幅な変動まで、ほとんどすべてが100%まで回転しています。最新のハードウェアは非常に回復力がありますが、週に数回、気まぐれにサーバーをバウンスする理由にはなりません。

1 さておき、サービスが失敗した場合など、技術者がWindowsサーバーを「ただ」再起動するのは嫌です。サービスを再度実行する必要があることは理解していますが、サーバーのトラブルシューティングの最後の手順は再起動する必要があります。障害の根本原因を特定し、修正 [!]することで、「Meh、just reboot it ....」という結果になることはほとんどありません


2
徹底的な回答ありがとうございます。更新は1か月に1回行います。更新を行うと、明らかに再起動する必要があります。答えに感謝します。
エヴァン

5
私はあなたの補遺に反対しなければなりません。サービスがサーバー(たとえば、エクスポートの共有を停止するNFSサーバー)を定義し、クリーンリブートがX分でサービスを回復することがわかっている場合、基本的なトラブルシューティングの後、解決するにはx + 5が必要であると判断します問題、再起動するのが最も便利です。後で原因分析を行うことができます。さて、それはとにかくそれを行う私の方法であり、あなたは非常に簡単に賛否両論できます:)
マシュー

34
@Matthew:再起動によって失われた原因に関する一時的な情報がなければ、事後の根本原因分析を実行することはすべてうまくいきます。「再起動する」ことを決定した場合の短いダウンタイムインシデントの数よりも、フェレットアウトとダウンタイムの根本原因を修正するためのダウンタイムをもう1つ長くしたいという場合、多くの人々に代わって話すと思います。根本的な原因の分析を支援するために揮発性情報を使用する機能を失う可能性があります。
エヴァンアンダーソン

8
@Matthewサービス障害の場合、技術者がトラブルシューティングの手順として、ボックス全体を再起動する前にサービスの再起動を試行することを期待します。
jscott

6
@Evan私はあなたに同意しますが、問題となるインシデントのしきい値が必要だと思います。たとえば、月に1回発生し、再起動で10分以内に解決される場合、根本原因を気にすることはありません。あなたと私は知りたいと思いますが、稼働時間は根本的な原因よりも重要です。しかし、それが週に3回起こる場合、それは全く異なる話です。
ジムB

52

パッチを適用する場合は、Windowsサーバーを毎月再起動する必要があります。パッチを適用していますか?右?


8
私を

3
パッチは毎月のみ適用しますか?
ジョンガーデニアーズ

厳密に言えば、xeは、それ自体が毎月の再起動が必要なパッチのみを適用します。すべてのPTFがリブートを必要とするわけではなく、すべての月次更新にそのような修正が含まれているわけでもありません。
JdeBP

2
更新プログラムで必要な場合にのみWindowsサーバーを再起動します。場合によっては、再起動が必要なパッチなしで数か月かかることがあります。しかし、私は長年リブートしていないLinuxサーバーがあり、問題なく動作しています。私のネットワークで見た中で一番長いのは、クローゼットに入れられ忘れられたlinuxボックスだと思います(自動更新されました)。私はssh'dで、稼働時間は3年でした。1年後、電源が故障したために再起動しました。
ジェームズ

LinuxまたはBSDの場合、再起動することなくサーバーにパッチを適用できます。カーネルの更新のためにのみ再起動する必要があります(サーバー指向のディストリビューションでは、これらはまれです)。
SnakeDoc

18

非常に具体的なケースについては、別の回答を示します。過去2〜3年の進歩によりこれが変更された可能性がありますが、多くの対話型アプリケーション(Officeなど)を実行するTSサーバーまたはCitrixサーバーを頻繁に使用する場合は、毎週時間外に再起動することをお勧めします。スタックセッション、使用済みデスクトップヒープなどのリソースのクリーンな状態から開始するだけです。ファームを適切にセットアップして再起動をずらした場合は、営業時間外の使用が少ない場合でも、ユーザーに影響を与えません。

もちろん、サーバーの定期的な再起動ですが、デスクトップのように使用されています。


4
Mm ... TS / Citrixのケースについてはお問い合わせください。
-Hyppy

CCHの監査管理ソフトウェアでCitrixを使用した同様の経験。

1
MetaFrameの時代にも同じことが当てはまり、実用的であればCitrix自身が夜間の再起動を推奨していました。
ジョンガーデニアーズ

ええ、メタフレーム...誰だ。プリンタードライバーマッピングファイルで遊ぶのをお見逃しなく。IT管​​理の観点から見ると、明らかに改善されています。
mfinni

10

これは技術的な問題というよりも政治的および心理的な問題です。

私の経験では、Windowsの非常に古いバージョンのいくつかを使用していた特定の人々は、毎週の再起動が必要であると頭に入れました。ただし、休暇中は再起動できません。)いくつかの非常に不安定なシステムとアプリケーションをお持ちでない限り、もはや現実に基づいていません。

反対に、頻繁に再起動するとハードウェア障害が発生する可能性がありますが、その原因である可能性はそれほど高くありません。


7
私の上司は退職したネットワーク管理者との良い友達で、少なくとも週に1度は再起動する必要があると言っていました。答えてくれてありがとう。
エヴァン

5
彼が「引退」したのも不思議ではありません...それは解雇のfor曲表現ですか
-KCotreau

3

再起動する必要があるのは、すべてが正常に機能している場合のメンテナンスのためだけです。スケジュールされた再起動は、A)ソフトウェアのアップグレード、B)ハードウェアメンテナンスの実行、またはC)ソフトウェアリークを引き起こしたソフトウェア/サービスの再起動では解決できないメモリリークの処理の場合にのみ必要です。Windowsは長い稼働時間で知られていませんが、それは起こります(最後の仕事には、一度に数か月間稼働していたWin2kボックスがいくつかありました。パッチを適用すると再起動が必要になる可能性が高いことを覚えておいてください。


答えてくれてありがとう。これは彼女を説得するのに役立つはずです。
エヴァン

1
私は、数年前から稼働している仕事用ネットワーク上にWindows NT、2000、および2003 Boxesを見つけました。そして最近まで、データセンターには毎年パッチ適用ポリシーがあり、600台を超えるサーバーで250日以上の稼働時間を確認することは珍しくありませんでした。私のサーバー(私は約120台あります)は、Microsoftがパッチを適用するたびに更新されて起動します。時々、先月のように、サイクルがありませんでした。稼働時間は、サーバー上で実行されているものと、物事がどれだけうまく機能するかに依存します。2003 R2では、35日ごとに再起動する必要があります。その後、面白いことが起こります。
クリストファーソーントン

2

私は決してこのテーマの専門家ではありませんが、実行しているサービスによっては、timeGetTime()やgetTickCount()などの特定のタイミング関数でオーバーフローする可能性があります。

timeGetTimeの結果は32ビットで、コンピューターが起動されてからのミリ秒数に等しくなります。これは約49.7日で最大になります。


2
エラー 14ヶ月の最良の部分のためにアップしてきました-私は、サーバー(私に説教していない、完全に分離された、信頼できるネットワーク上の)持っているNO悪影響を。
ベンピルブロー

3
すべてのサーバーとインスタンスにこの問題があることを意味するつもりはありませんが、サーバーがこれらの機能を使用するソフトウェアを使用し、そのような機能を考慮していない場合、計算上の問題が発生します。
マシュー

2
32ビットタイマーの問題は有効ですが、個々のソフトウェアベンダーが独自のコードで慎重に回避する必要がある問題です。Windowsはこのタイマーに関連する障害の影響を受けなくなりました(以前のように)が、タイマーのロールバックを考慮しないソフトウェアがインストールされている場合、予期しない影響を引き起こす可能性があります。
タイラー

1
このMicrosoft KBを参照していますか?
jscott

9
エラーこれはNT 4のバグであり、2k +に勝つため、この問題は発生しません。NT 4は2011年に死んでいると安全に言えると思います。誰かがそれを実行している場合は...この時点で得られるものに値します。
ザイファー

2

毎週すべてのWindowsサーバーを再起動していましたが、確かにそれが必要な時期がありました。最近は、更新プログラムで必要なときにのみ再起動します。もちろん、それは彼らがまだとにかく数週間ごとに再起動されることを意味します。


2

マイクロソフトは、長年にわたってサーバーOSの改善に多大な貢献をしてきました。また、問題が発生する前に6〜12か月実行できるサーバーもあれば、2〜3か月しか実行できないサーバーもあります。それはすべて、サーバーが実行しているサービスとアプリに依存します。しかし、それらはすべて、ある時点で問題を抱えることになります。Windowsの更新、メモリリーク、不完全なソフトウェアなどは、いくつかの理由にすぎません。

メンテナンス契約を結んでいるクライアントの場合、更新プログラムをインストールし、サーバーを毎月再起動します。これらのクライアントでは、定期的に再起動しない問題の5分の1のオーダーで、計画外のサーバーの問題がかなり少なくなります。

再起動が早期のハードウェア障害を引き起こすと言う人にとっては、ハードドライブとシステムの再起動が潜在的な問題であるときがありました。しかし、今日のHDDおよびその他のコンポーネントは、数千の開始停止サイクルに耐えるように構築されています。サーバーのハードウェアが弱い場合、問題に迅速に対処するために制御された時間にそれを知っているか、営業日中に部門がダウンしているという呼び出しでランダムに失敗しますか?

毎月の定期的な再起動にはマイナス面はないと感じていますが、長期的には明確で実証済みです。


1

Windowsの更新プログラムを使用して、「再起動スケジュール」を構成します。Windowsが自分自身を管理するようにします。メモリリークが原因で、セットアップで再起動が必要になることはほとんどありません...


1

私は、いくつかのWindows 2003 2008サーバーで動作する会社のネットワーク管理者です。通常、サーバーを3か月以上待機せずに月単位で再起動します。これは、短時間だけダウンすることが非常に重要だからです。

ただし、パッチとWindowsの更新では、ドメインコントローラーにWSUSをインストールして、好みに応じたスケジュールで更新プログラムなどを適用します。これは、サーバーが自身を更新して予期せず再起動するのを防ぐためです...


1

すべてのWindows Hatersは、平均稼働時間(http://uptime.netcraft.com/up/today/top.avg.html)で実行時間が最も長いNetcraft.comサイトをチェックアウトする必要があります。これは、最後の再起動以降に最も長く実行されているサイトを示し、上位50の95%がWindows 2003および2000マシンです。いつものように、走行距離は異なる場合があります。


おそらく、負荷分散についてあまり知りません
...-mfinni

0

Windowsのみを指定することは、合理的な決定を下すには広すぎる場合があります。実際、Windowsマシンで実行するサービス、ロール、および機能(Webサービス、データベースサーバーなど)を考慮すれば、より適切な決定が下されます。

特定のサーバーで実行されたサードパーティのアプリケーションとWebサービスの品質と動作は、ホストしているWindowsマシンを再起動する必要性を、それらのない他のマシンよりも多く/少なくすることを示唆します。

実際、一部のサードパーティアプリケーション(完全に設計されていないアプリケーションです;誰も完璧ではありません)は、メモリ、ロック、ソケットなどの取得したシステムリソースを優雅でタイムリーに解放できません。これにより、たとえば、一部のクラッシュしたアプリケーション、サービス、またはドライバーが[再実行時に]保留状態または開始状態のままになる場合があります。

実際には、ディスクI / O、ネットワーク、およびメモリを大量に使用するアプリケーションは、負荷が高く負荷が高く、システムリソースが少ないため、Windowsマシンが遅れたり、不安定になったり、トラッシュしたりする可能性があります。

そのような障害のあるアプリケーションを実行する必要がある場合、またはハードウェア/ソフトウェアの通常の容量よりも多くのユーザーにサービスを提供する必要がある場合、または互換性のないサービスを1台の物理マシンに併置する必要がある場合は、Windowsを再起動する必要があると判断される可能性があります定期的に。この場合、サーバーの速度に関するユーザーの苦情を聞いて、再起動期間を調整できます。


-6

ソフトウェアのアップグレードを行わない限り、正解は決してありません。前回、約2年前にサーバーを再起動しましたが、その理由は停電です。


3
Linuxサーバーについて話しているか、サーバーが専門家として使用されていないことを願っています
...-HTDutchy

3
パッチを適用したすべてのサーバーを再起動して、それらのパッチの一部を適用する必要があります。パブリックネットワークに公開されているサーバーには、パッチを適用する必要があります。
レールミート

私は、年に1回程度起動されるNT 4ドメイ​​ンコントローラをいくつか持っています。これ以上の更新はなく、悪者の標的になりません...(インターネットに接続されていません)
-hsmiths
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.