これまでに「継承」した最悪のサーバー構成/セットアップは何ですか[クローズ]


19

仕事を始めるか、会社のコンサルタントとして働いて、構成が不十分なサーバーを「継承」します。これまでに見た中で最悪の設定ミスは何ですか?

回答:


23

私はまだ、業界で15年間で、会社で新しいコンサルティングの役割を開始して、彼らが「良い」インフラストラクチャを持っていることを発見しています。通常、私はそれらを正しくするために呼ばれています。

この混乱の通常の原因は、技術的な意思決定を行う非技術的な意思決定者です。


15
「技術的な意思決定を行う非技術的な意思決定者」に対して+1。悲しいが本当。
マキシマスミニマス

2
それは本当にすべてのITの悪の根源です。
イジー

3
さらに悪いことは、すべてを知っていると思う人がたくさんの「クールなもの」(MPLS、OSPF、IS-IS、HSRPなど)を使用するが、まったくばかげている場合です。いいえ、ITの悪のすべてが技術者以外によって引き起こされることはほとんどありません。多くの場合、それは単に悪い技術です。
トーマス

同意しましたが、現在の婚約にうんざりしているかもしれません
イジー

19

数年前、小さな製造会社のネットワークインフラストラクチャの「評価」を行う仕事をしました。その作業中に、私は彼らのERPシステムがバックアップされたことがないことを発見しました。彼らの知らないうちに、以前のIT請負業者はBackup Execを毎日の完全バックアップ用に構成しましたが、ERPシステムで使用されるデータベースサーバーの「ダンプ」または停止/開始のスクリプトを作成しなかったため、データベースファイルは常に使用され、バックアップ。そのため、3年以上にわたって、ERPシステムのデータをまったく持たない毎日のテープバックアップを実行していました。請負業者が彼らに言ったように、彼らは忠実にテープを交換しましたが、明らかに誰が(請負業者を含めて)実際にテープに何があるのか​​を確認することを気にしませんでした。


1
良いですね!!私は...彼らはその後、何を復元するために試したことがないと思います
NoahD

彼らはいくつかのユーザーファイルをあちこちで復元しますが、ERPシステムのデータベースには触れませんでした。私はそれが良いと思う
エヴァン・アンダーソン

これは、ERPシステムとそのプラットフォームの安定性と信頼性に関する1つの推奨事項です。どのERPとどのプラットフォームですか?
イジー

1
私は非常に似たものを継承しました。バックアップフォルダーの場所が変更され、BackupExecの更新を誰も気にしなかったため、1年以上テープに何も書き込まれませんでした(ただし、これらはすべて契約者の指定に従ってローテーションされました)。
マットロギッシュ2009

@Izzy:Microsoft SQL ServerとJobBoss、適切に覚えていれば。データベースダンプを目にすることなく、MDF / LDFファイルは毎日スキップされます!
エヴァンアンダーソン

10

昔は、上級管理者の1人が私たちの組織を離れ、「ドキュメントイメージングシステム」の責任を私に引き渡しました。私はチームのローマンで、経験が浅く、何にでも飛び込みたいと思っていました。

Mean Joe Greenを使った古いコーラのコマーシャルのようでした...私は、顧客向けのプロダクションシステムのプライマリ(唯一)管理者になり、ドアを出る途中で、「ちょっと子供、キャッチ「汗をかいたタオルの代わりに、いくつかのログインとサポート用の電話番号が付いたしわくちゃの紙の束を彼が私に投げたと期待してください。

幸福感はすぐになくなりました...システムは、データベースを実行する2台のサーバー、共有、スキャナーと処理アプリケーションを備えた約6台のワークステーション、およびドキュメントを参照するためにログインするWebサーバーとアプリユーザーで構成されました。これは、ApacheとJava、およびWindows SQL Serverで実行されている少なくとも2種類のスクリプトの不浄なミッシュマッシュでした。そうそう。私たちはまた、しばしば故障した一連の「カスタマイズ」に対しても支払いをし、彼らのサポートスタッフはいつも喜んで気づいていなかった。

グッドタイムズの短いリスト:

  • アプリにメモリリークがあり、ハングしていました。
  • これは、夜間のFTPジョブでやり取りされる一連のフィードファイルを通じてERPと統合されました。両端でのフィード生成、処理、ファイルプッシュプル、およびデータベース更新のシーケンスは、リモートERPシステム上のアプリスケジューリング、SQL Serverジョブ、および夜間のcron間の慎重なタイミングに依存していました。いずれかの方向の更新が失敗した場合、部門全体が停止し、「レポート」がプリンターから吐き出されないか、さらに悪いことに、顧客からの苦情につながる不正確な情報が含まれていました。
  • SQL Serverにはメンテナンスジョブが構成されておらず、ログの切り捨ては手動で行われました。
  • アプリのライセンスファイルがランダムに「期限切れ」になり、全員がロックアウトされることがありました。
  • 内部ユーザーの役割が「混乱」し、ユーザーがログインして管理インターフェイスボタンを表示する(使用できる)ことがありました。(これらの呼び出しは素晴らしかった...「ダン...私はいくつかの新しいボタンが表示されます...クリックする必要がありますか?」)

文書化されているものはほとんどなく、何かが壊れたときにそれぞれのしわを発見しました。たとえば、レポートが間違っていたか、印刷されませんでした。または、デスクトップがJVMの新しいバージョンをプッシュし、誰もスキャンできませんでした。または、誰かがスキャンワークステーションからドングルを蹴り出し、アプリがクラッシュしました。または、ログファイルシステムがいっぱいになりました。または、OCR抽出からのデータは、何かを誤ってキャプチャし、それを違法なものとして送信したために、アプリをクラッシュさせました。または、さまざまな部門のサポートで約30枚のチケットが開いており、その多くが数か月間開いていたことがわかりました。など週に4〜5の割合で新しい重要なものを発見し、そのアプリの詳細とニーズ、およびデータベースを適度に健全に保つのに十分なSQL Serverを非常にすばやく学習し始めました。

最良の部分は、私が新しい役割に「歓迎」するために、内部ユーザーグループ会議に招待されたときでした。子供じゃない 30人の怒っているユーザーが輪になっていて、私は真ん中に座った。

大変でしたが、私は非常に迅速に学びました。痛みは別として、それは素晴らしい機会でした。私の一部は、それがそれほど試練ではなかったことを望みますが、多分私はそれほど速く学ばなかっただろう。

申し訳ありませんが、それはとても長かった...しかし、ああ...それは療法のようなものです;)


1
素晴らしい記事と面白い:)
T.

8

約12年前、中規模ISPでシステム管理者として働き始め、約30人のスタッフがそこで働いていました。以前は実際のシステム管理者がいなかったので、自分が何をしているのかを知っていると思っていた人もいました(時には正しい、ほとんどの場合はそうではありませんでした。

しかし、ケーキの上のアイシングは、その場所のほとんど全員がサーバーへのルートパスワードを持っているということでした。私は受付については知らないが、確かにすべてのマネージャー、ヘルプデスクスタッフ、ウェブ開発者、およびシステムとやり取りした他の誰もがルートを持っている。そして、彼らはすべてそれを使用します。気まぐれで。たとえば、顧客が苦情でヘルプデスクを呼び出した場合、rootとしてログインし、その特定の顧客の問題が解決されるか何らかの形で魔法のように発生を止める(「解決済み」と見なされる)までシステムをいじります。もちろん、これは他の多くの問題を引き起こします。ヘルプデスクの他の人々が同じ「ルートとしてログインし、システムを肉屋にする」方法を使用して同時に対処します。

当然、ルートパスワードを変更し、変更管理やその他のプロセスを導入して、何が変更されたか、いつ、どのように、誰によって始められたかを制御しました。そうそう...構成ファイルのバックアップとリビジョン管理も。

(私が最初にしたことは、オープンリレーメールサーバーを閉じ、スパム対策フィルタリングを実装することでした。実際、インタビューでかなりのアンチをしたと言ったので、私は仕事を得たと確信しています。 -スパムの仕事。私には知られていないが、彼らは何ヶ月も続いていた深刻なスパム/オープンリレーの問題があり、修正方法がわからなかったため、絶えずブラックリストに登録されていました。その後すぐに恐ろしいニュースを発見しましたその場所のほぼ全員がルートアクセス権を持っていた)

ルート特権を奪うことは最初は多くの怒りを引き起こしましたが、幸いなことに、上司は私と私が達成しようとしていることをサポートしてくれました。貧しい人々に何がなされたかを考慮して、達成するのは難しい)


ああ、それは...おそらく私がここで始めたシステムと同等です。そして私を信じて、それは本当に悪かった。投稿保留中!
アーニー

6

完全に標準化された小規模ネットワーク:Windows 95およびNT Server

数週間前でした。;-/


4
私は非常に小さな顧客を少し持っています。Windows NT 4.5 Small Business Serverコンピューター(元の1999年のビンテージハードウェア上)といくつかのWindows 98 PCを実行しています。Exchange 5.5を実行し、「POPコネクタ」を介してインターネットメールを受信します。彼らは、Outlook 98とPC上の古いWindowsバージョンのSolomanアカウンティングを使用します。面白いことですが、彼らはここ10年で何の問題もほとんどありませんでした(!!!)。所有者は、近い将来に変更を加える予定がないことを私に示しました。遅いPCは、従業員による不必要なインターネットの使用をも妨げるようです!
エヴァンアンダーソン

変更する必要がない場合は、変更を行わないことについて説明する必要があります:)
pjc50 09年

6

簡単な最初のISマネージャーの仕事は、dBaseでAP書記の夫によって書かれたカスタム注文入力アプリを見つけました。いくつかのスクリーンはモノクロでしたが、他のスクリーンはレインボックスがそれらに投げ込まれたように見えました。多くの部分が特定のファイルを排他的にロックするため、一度に1人のカスタマーサービス担当者のみがカスタマーマスターを編集できます。
安価なツイストオンコネクタ(圧着なし)を使用して、リモートオフィスのこのシンネット同軸に追加します。電話のトラブルシューティングは、ネットワークがダウンしていると言ってから始まり、誰かが家具やコンピューターを動かしたかどうか、清掃員がどこかに掃除機をかけているかどうかを尋ねました...トークンリングを壊しますが、それらが緩んでいることが目に見えるほど十分ではありません。
その後、オーナーはUSNewsのコピーを持って出張から戻ってきて、コンピューター広告を指して、「これらのサーバーを使用しないのはなぜですか」と言います。しばらくの間、私はディルバートの漫画に住んでいると思っていました。スコット・アダムスが私を追って、メモを取っているのを知っている...


6

誰かが匿名ユーザーにサーバー上のEVERYTHINGへの完全かつ完全なアクセス権を与えると、IIS Webサーバーを継承しました。彼らの言い訳は、それが彼らが彼らのウェブアプリを機能させることができる唯一の方法であったということでした。

子供じゃない


4

ああ。それが私この仕事を始めた方法です。

2000年、小さなISPでした。サーバーのほとんどはPentium 1-タワーケースのクラス「サーバー」ハードウェアでした。DNSおよびRADIUS認証の場合、これは問題ではなく、実際に今後数年間機能し続けましたが、本当のこだわりはすべてがBSD / OS 4.2であったことです。私はFreeBSDとFreeBSD(最初の仕事で実際にそのバージョンのBSDを実際に使用していました)に精通していましたが、それまでにかなり古風だったと言うのは控えめです。何だった問題はメールサーバーとウェブサーバーでした。それらはわずかに速いマシンでしたが、ひどく過負荷になりました。しかし、ハードウェアはそれほど堅牢ではないと思います。死ぬことのない幸運(?)だったデスクトップマシンに似ています。1994年の会社設立以来、アップグレードされたものはありませんでした。すべてがオフィスの一角に詰め込まれていましたが、偶然にも十分な空調がありませんでした。そして、私が「オフィス」と言うとき、私は皆のための1つの部屋を意味します。過去には、熱によるサーバー障害がいくつか発生していました。

さて、古風なアーキテクチャ:チェック。

前のシステム管理者:かなり無能で、数か月しか続きませんでしたが、彼は新しい請求データベースを開始し始めて(そして古い請求システムから紙に変換して)薄気味に消え始めただけだったと思います。それ以前は、アカウントの作成、Apache Webサイト、停止したサーバーの起動に十分な知識を持っていたのは会社の所有者でした。たぶんそれよりもう少し。時折、彼は友人の助けを借りました。実際に不動産業者として働いた人。システム管理者に対するボスの態度:「誰が必要ですか?ログを読みながらコーヒーを飲むのに誰かに4万ドルを払っています。技術サポート担当者が必要です。」

セキュリティ:なし。いいえ、本当に。T1はサーバーにインターネット接続を提供しました。そしてオフィス。すべてのパブリックIPを修正しました。ボスの態度:「ああ、私たちは安全です。BSD/ OS 4.2を実行しています!侵入されたことはありません!」少なくともパスワードは完全には遅延しませんでしたが、すべてのデフォルトサーバーはすべてのマシンで実行されていました。もちろん、パッチ未適用。すべてのサーバーデーモンの古代バージョンも。

火災:どこでも!すべて!に!!火災!!!雇われてから1週間以内に最初にやったこと(技術サポートとして追加するかもしれません。システム管理もしたいですか?忙しいときはそうします-私は十分に若くて気にかけないほど貧しかったです)顧客がダイヤルアッププールに同時にログインできる回数を制御するシェルスクリプトを作成しました。スパマーが帯域幅を集約する方法として使用しているため、ダイアルアッププールが常にビジーであるという最も差し迫った問題を解決しました。AAA RADIUSサーバーには、このバージョンではこの機能がありませんでしたか?また、このプラットフォームで新しいAAA RADIUSサーバーをコンパイルすることもできませんか?FreeRADIUSもできませんか?セクション1、Archaicハードウェアを参照してください。後で、実際のああ、会計を実装するために同じようなことをしましたダイアルアップで、月に30時間サインアップした人が月に300時間使用していなかった。メールサーバーはオープンリレーではなかったことを思い出すようですが、そうだったかもしれません。それはあっによるファイルごとに1つのメッセージを使用して代わりのMaildir形式のメールボックスのフラットファイルのうちの各メッセージの構文解析を要するという事実はまだ、それが使用されるどのような古風なバージョンにおいて、sendmailの使用mbox形式にひどく過負荷、一方。そのため、大きなメールボックスを持っている人がメールをチェックした場合、サーバーはすべての人にとって停止状態になります。そしてもちろん、送信SMTPとPOPは同じマシン上にありました。もちろん、スパムフィルターはありませんでした。受信または送信メール。新しいサイトが手動で追加されたという事実は別として、Webサーバーの何が問題だったかは思い出せません。それだけで十分です。

バックアップ:バックアップ?あはははは!ああ!

しかし、この場所で最も戸惑ったのは、プリントサーバーがなかったことです。ファイルを印刷したいですか?机から立ち上がって、スイッチボックスのダイヤルをコンピューターに回し、戻ってファイルを印刷します。私もそれを修正するのにそう長くはかからなかったことを思い出します。


LPTスイッチの場合は+1。私はそれらの大きい不格好なもの...覚えて
マーク・ヘンダーソン

3

私の現在のドミノ環境はそれでなければなりません。以前の長期在職者の1人は、迅速で汚れた開発作業を行うことにのみ関心を持っていたため、10年間、基本的なハウスキーピング作業はまったくありませんでした。彼に続いたが私に先行した二人-当然のことながら-それを一度見て、頭を下げておくことに決めました。だから今、私は標準化された命名規則、ACL全体のユーザーアカウント、長い間アカウントを使用し続けている古い管理者と開発者(そしてまだ敏感なグループ)の合計混乱を持っています、ユーザーの半分は同じパスワードを持っています、残りの半分はパスワードがスプレッドシートに記録されており、2つのカスタム内部セキュリティデータベースを備えた美しい重要な基幹業務アプリがあります標準ACL に加えて、バージョン6レベルでフリーズする前に4〜5回の迅速かつダーティーなアップグレードを経て、ほぼ毎日破損する1000を超えるデータベース(「コピーのコピー」などを含む) 。彼はWindowsのスケーラビリティについても妄想的だったので、ちなみに私には8 CPUのボックスがあります。

外でそれを撮影し、それは慈悲になります。


3

私が現在の仕事を始めたとき、私は数週間後にひどい無能のために解雇された男からその地位を引き継ぎました。彼は前任者から得たすべてのドキュメントを破壊し、すべての管理者パスワードを知らないうちにランダムに変更し、「隠された」アカウントをマシンに入れて後で入ることを除いて、ここで働いている間は何もできませんでした。

パスワードとバックドアは本当の問題ではありませんが、何がどのように何をしていたのかがわからないまま非常に興味深いものでした。それでも、これに苦しむユーザーはいませんでしたが、幸運にも、この男が愚かすぎて本当のダメージを与えることはできませんでした。


3

この質問は頭を痛めます。私は州政府のために働いています...最低入札が勝ちました!

私が現在の地位を引き継いだとき、私は主に逃げる男と2週間働き、主に彼が請負業者と一緒に6か月かけて構築したWebアプリのコーディングに取り組んでいました生産に入る。1か月後、アプリはスクレイプされ、彼らは請負業者にお金を投げてただ去りました。私はまだコードを持たない他のアプリを呼び出すドキュメントがないvb6アプリを扱っています!

私は、奇妙なサーバー設定や、道路の向こう側にあるオフサイトのバックアップ、または他の部門全体がルーターとスイッチを「処理」することもしません(ああ、彼らは再配線すると言ってそれを得た)もちろん、そうではありません、今ではポート料金を請求し、デュアルMACをブロックしているだけです!私たちは、神のためにSIP電話を使用しています!そして、テストマシンをセットアップするためのコストを正当化する必要があります.Aaarrrrgggghhh!)

私は止めなければなりません、これは私を泣かせます。私は毎日、政府が何かを成し遂げることに驚いています。


3

ファイル共有サーバー。250GBのファイルを約30のクライアント(ラップトップ/デスクトップミックス)に提供し、各フォルダーはネットワーク共有にマップされます。悪い点は、10クライアント接続の最大制限でWindows XPを実行していたことです。最初にしたことは、Server 2003のフォーマット/インストールでした。

翌日、同僚は全員が同時に仕事をすることができたため、非常に満足していました。


3

現在の会社で働き始めたとき、彼らはSmall Business Server 2003を使用していましたが、最終的にはSBS2003から実際の「実際の」サーバー環境に切り替える必要がありました。残念ながら、移行パックは機能しませんでした。MSが最近購入したボリュームライセンスを通じて、すべてを移行できました。支援とは、移動や変更が必要なもののリストを提供することを意味しますが、正確な方法ではありません。

今、私はActive Directoryの腸にかなり習熟していますが、彼らが私に言わなかったことの1つは、SBSがどのようにFSMOの役割の1つを奪うのが好きではないかということでした。オフです。

SBS2003を降りるのは悪夢で、ときどきADでSBSの参照や古いSBSサーバーへの参照をあちこちで見ますが、約2年が経ちました。

ああ、ところで、私はSBSが嫌いです!:)


2
SPSはPOSです。私は毎分それに取り組んでいました。SQL Server、Exchange、Active Directory、IIS、ISA、および会社のファイルサーバーはすべて1台の物理マシンにありますか?ええ、すべての卵を1つのバスケットに入れましょう!特に、インターネットに面し、毎日インターネットから数千のヒットを得る1つのバスケットです!素晴らしい計画。
phuzion

SBSの吸い込みの+1。
ニック

3

すべてのワークステーションにSymantec Antivirusサーバーをインストールしたクライアント。


2

これもDCであり、Exchange 2003を実行するWindows 2003サーバーです。これまでのところ十分に悪いですが、待ってください。また、ユーザーの移動プロファイルをホストしていました。また、DATテープを使用した中央バックアップサーバーでもありました。

まだ十分ではないですか?マシンには単一のCPU、2GB RAM、RAID 1として構成された7,200 RPM SATAドライブのペアがありました。アレイは2つの論理ドライブとして分割され、システムドライブは16GBで、そのうち2GB未満が空きでした。この機械は、仕様を推奨する請負業者によって中古部品から組み立てられました。疑いもなく、使用可能な部品に基づいて、まともな新しいサーバーにかかる費用とほぼ同じ金額を請求しました。また、マシンの構成と試運転も担当しました。彼は10年近くクライアントと取引していたため、彼のアドバイスは受け入れられました。私は彼がもはやそれらを扱っていないことを確認しました。


私の家の「サーバー」に少し似ていますが、私の場合は500GBのHDDと1GBのRAMしかありません。:)私は9つの異なる役割を実行しており、さらに多くのベストプラクティスを破っています。それは私に多くを教えてくれました、そしてそれは効果的に無料でした。
pipTheGeek 09

DCで交換しますか?私はそれが悪いことを知っています。DC上のTS?OK、それはもっと悪い。しかし、WebとFTPのみをLANに提供していると仮定すると、これらの他の役割を設定することの何が問題になっていますか?
ニック

いいえ、LANにサービスを提供するだけではありません。
ジョンガーデニアーズ

2

非常に大きなコンピューターメーカー(Ireland Ahem)のヨーロッパ事業のネットワーク監査を管理しました。数週間かかりましたが、作成したすべてのPC /サーバーのすべてのハードディスクに噴出されていたデータのすべてのビットが、同じ4スレッドのワイヤ上を移動していることを発見しました。ビルドします。彼らにもっと多くのケーブル/ SFPを入手するようにRANに伝えて、30分以内にマルチパスにしたが、それは衝撃的だった。


2

私の最初の仕事は、18歳以上の「Point 4」ミニコンピューターからの移行を計画することでした。彼らは「所有者が既存の機器が古くなっていると感じたため」、機器を近代化したいと考えていました。この旧式のタイムシェアミニコンピューターは、カスタムROMを備えたリバッジされたTelevideo 955ターミナルを使用し、市場にはダムターミナルとして機能するコンピューターを接続できるターミナルエミュレーションプログラムが合計で1つありました。もちろん、そのプログラムはシステム7でのみ実行されました。

ベンダーは長い間廃業していました。部品はハードウェアサポートベンダーから年間契約で提供され、数か月に1回、他の何かが壊れて交換が必要になったときに訪問しました。


すごい!彼らはそれを交換したかったのですが、まだ完全には壊れていませんでしたか?
kmarsh 09

ハ!あなたは彼らの感情を正確に説明しました!:)実際、彼らは継続的なサービス契約を結んでおり、定期的に部品を交換していました。数年前に折りたたまれたベンダーから部品を入手できなかったことを考えると...それはそこから撤退する時が来たのは理にかなっています。
エイブリーペイン

2

私が受け継いだ最大の問題は、ソフトウェアではなく物理的なものでした。サーバークローゼットは、たまたま電気クローゼットと電話クローゼットでもありました。それで、部屋を加熱する巨大な変圧器の形で、それは大丈夫でした。クローゼットは、小さな会議に使用される部屋からも離れていました。私は、たとえ騒々しかったとしても、クローゼットのドアを閉めないように人々に告げるサインを掲示しなければなりませんでした。幸いなことに本館のACは十分であり、一時的な故障は発生していません。配線作業も少し面倒でした。ほとんどの標準ラットは、スイッチからサーバーに向かってネストします。この最大の利点は、ラックの1つが他の2つのラックから離れていたため、ラック間に小さな通路があったことです。サーバーは1つだけでしたが、そして、そのための電源ケーブルは、プロテクターなしで床を横切っているだけでなく、平らに敷かれていませんでした。これにより、足を簡単に引っ掛けることができました。あなたが前に落ちて、植物に直面しようとしている後、横に張​​られた首の高さのパッチケーブルがあなたを捕まえて、あなたの首をスナップしようとします。

オフィスを(REAL ACのあるサーバールームに)移動する前に、そのパッチを天井まで走らせる機会はありませんでしたが、クローゼット全体にベルクロストラップが付いていました。その後、自分を殺さずに実際に歩くことができます!


私が病気になったセットアップを見てきましたが、これは実際にユーザーを殺そうとする最初のサーバールームです。いいね:-/。
sleske

1

私が最初に到着したときに働いていた会社の1つには、オフィスサーバー(2台のハードドライブ、1台はそれほどミラー化されてマウントされていません)と、レンタルコロケーションサーバー、1台のハードドライブがありました。テープバックアップはまったくありません。

LANの残りの部分には課題がありましたが、そのように動作する場所の3年以上にわたる運は驚くべきものです。ミラーリング、冗長性、テープはありません。


1

NT 4でIIS 4(または3を覚えていませんか?)は、デスクトップクラスのコンピューターで会社のイントラネットを実行しており、冗長性やバックアップなしで約12年間(私は見た中で最悪) 。異常なことはありませんが、それでもです。


しかし、あなたは彼らにそれを与えなければなりませんでした-バックアップなしで12年は端に住んでいます!
リラナ

1

最も忙しく、最もミッションクリティカルなテーブルのエクステントが16kであるInformixデータベースは、テーブルスペース上の38,000エクステントのようなもので(断片化されたディスクを考えてください)、サポートされるレベルの2倍でした。(ベンダーは実際に、「あなたのデータベースはいつでもクラッシュする」というような手紙を書いた)

以前のDBA、SA、およびネットワーク担当者は去り、私は学校を6週間ほど休みました。私は多くの研究を行い、6時間のダウンタイムを必要とする問題を修正する方法を見つけました。上司は、停止のスケジュールを拒否しました。

そのため、1年で最も忙しい日に、システムがフリーズします。500のコールセンターオペレーターと1つのコマースWebサイトがダウンしています。ベンダーがそのサイズのテーブルで、かつて使用している「興味深い」データベーススキーマのようなものでこれを行ったことがないため、障害後の修正は困難でした。そのため、データベースの整合性チェックにさらに5時間かかったことを除いて、当初予定していたことを正確に実行しました。


ITボスに良い名前を付けるのは、そのようなことです。「そう言った」と言うのは嫌いです(だから頭の中でやります)。「上司は」たぶん... catestrophicクラッシュ後にシステムを復旧するための良好な書き込みをアップしました
浴槽

1

確かに、これは90年代後半に戻っていましたが、ここで働いていました。私のサーバーソフトウェアは、上司の仕事用マシンであるデバッガーで実行していました。彼はほとんどの仕事を自宅で別のマシンで行っていましたが、実稼働コードをデバッガーで実行しているのは誰ですか?


1

ハードウェアシャーシにミラーリングされた2台のHDDを備えたサーバー-ある日、1台のディスクが停止し、アラームが鳴り始め、オフィスのスタッフがアラームをオフにすることを決め、3か月後に2台目のディスクが停止し、電話をかけました-サーバーにアクセスできません


0

ある仕事で、以前の管理者の1人は、ほとんどすべてのSunサーバーを自動起動しないように設定することをお勧めしました。また、「このコンピューターがクラッシュしたどうかを知りたい」という理由で、initスクリプトを適切なランレベルディレクトリに配置しませんでした。もちろん、もう一方の管理者は、基本的にショップ全体の一貫性を失い、最初の計画的および計画外の停止中に物事を面白くするようなことについて、もう少しレベルが高くなっています。


0

私はcitrix aliveを実行しているWindows NT4ボックスを維持しています。それは元々ソフトウェアレイドでセットアップされていました...そうです。ソフトウェアレイド、Windows NT4。 ..

好奇心those盛な人のために、Windows nt4はLinuxホストでvirt machineとして実行することを好みませ :-D


たぶんVMWareを試してみてください。私は今日、カスタム測定ソフトウェア(幸いなことにシリアルポートに接続された)を備えた古いNT4ボックスをXP上の(デスクトップ)vmwareインスタンスに移行しました。 ;)
スヴェン

0

クライアントには5人の従業員がいました。ローエンドのゲーミングPC機器、2台のサーバーを使用してカスタム構築された彼らの古いIT担当者。1もExchangeを実行しているドメインコントローラーでした。もう1つはターミナルサーバーでした。各従業員は、シンクライアントを使用してサーバーに接続して作業しました。どちらもWindows 2000を実行しており、5年前に構築されました。言うまでもなく、ローエンドのRAIDカードが両方のサーバーで互いに数日以内に死んだとき、サーバーを標準のhpサーバーに交換し、通常のミニタワーを使用してそれらを入手しました。また、サーバーを両方とも同じものから実行するのではなく、独自のUPSユニットに配置し、WAPを持たず、バッターのバックアップを監視しました。

さらに、オフィスには6台のネットワークプリンターがあり、2台はDHCPを使用していました。他の4人はIPを割り当てていましたが、委任されたIP範囲に散らばっており、ドキュメントはありませんでした。

悲しいことでしたが、1か月の調整の後(古いハグは彼らの働き方の変化にあまりうまくいっていませんでした)、今ではめったに電話しません。


0

性能の悪いMySQLシステムを修正するために呼び出されましたが、誤ったヘッダー要素を発見しただけで、/etc/my.cnf使用しようとしたすべての素晴らしい調整パラメーターがデフォルトを無視して無視されていました...

したがって、InnoDBデータベースエンジンを使用して、16Gb RAMを搭載したサーバー上に7Gbのdbを持つシステムがありました...

障害のある構成は、InnoDBの12 Gb RAMに設定されました...

システムはInnoBDに128 MbのRAM しか使用していませんでした。したがって、すべてのクエリと更新に/ lot /のディスクアクティビティが使用されていました。

ヘッダーの簡単な修正、MySQLサービスの再起動、そしてちょっと、すべてがキャッシュされ、見事に実行されました:)

誰も彼らが適用したチューニングパラメータが実際に使用されていることをチェックすることを考慮していなかったという奇妙な!! :-/

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.