サーバー管理者

システムおよびネットワーク管理者向けのQ&A

2
Ubuntu Serverがスワップの追加でハングする
Ubuntu Serverの新規インストールは起動を拒否し、「/ dev / mapper / test--vg-swap_1に524284kスワップを追加します。優先度:-1エクステント:1全体:524284k これを回避するには、リカバリモードに切り替えて、通常のブートに戻るだけです。

3
Windowsはすべてのネットワークドライブを再接続できませんでした
OK、すべての「あなたの問題でスーパーユーザーに!」を得る前に、彼らはヘルプページで具体的に述べています:「企業のITサポートとネットワークに特有の問題についてではありません」私はITマネージャー/sr.adminです。よくわかりました...はい、私は自分でこれを理解することはできませんが、TLCのように頼むのはあまり誇りに思っていません。免責事項が完了しました。 問題 Win 8 Proラップトップを再起動すると、「すべてのネットワークドライブを再接続できませんでした」というメッセージが最近表示されています(下の例の画像)。 トラブルシューティング それでも、Explorer GUI(「ここをクリックしてネットワークドライブのステータスを確認する」をクリック)とcmd lineの「net use」コマンドの両方をチェックすると、適切なドライブマッピングがあります。 また、レジストリHKEY\CURRENT USER\Networkを確認し、正しいマッピングを見つけました。 アプリケーション、セキュリティ、またはシステムイベントログに「エラー」メッセージに対応するイベントが表示されません。 何も問題はないように思えます。 注: 私は、自宅でラップトップを起動しているときなど、「社内ネットワークから離れている」ときにも同じメッセージが表示されることを知っています。私はそれを取得します...しかし、これはネットワークに配線されており、ネットワーク接続を持っているときです(ラップトップにpingを実行し、ログインする前にmgmtツールを実行できるサーバーの1つを介して証明されています)。 質問 だから私は本当の質問は次のとおりだと思う: このエラーメッセージはある時点で有効ですか?何らかの理由でドライブが接続される1秒前に表示されるのでしょうか?それをトラブルシューティングし、それが本当にスコーキングされているものを把握する方法はありますか? #1が可能であっても、単にメッセージ期間を抑制することはできますか?正直に言っても気にしないので、それを見なくても悲しみを感じることはありません。

8
Oracle DBAにはルートアクセスが必要ですか?
私のOracle DBA同僚は、本番サーバーでのルートアクセスを要求しています。 彼は、サーバーの再起動やその他のタスクなどの操作を実行するために必要であると主張しています。 彼にOracleユーザー/グループとOracleユーザーが属するdbaグループを設定したため、私は彼に同意しません。すべてが順調に実行されており、DBAが現在ルートアクセス権を持っていることはありません。 また、インフラストラクチャの相互作用の誤解に関連するあらゆる種類の問題を回避するために、スケジュールされたサーバーの再起動などのすべての管理タスクを適切な管理者(この場合はシステム管理者)が行う必要があると思います。 sysadminsとOracle DBAの両方からの入力を希望します-Oracle DBA が実稼働環境でrootアクセスできる理由はありますか? 同僚がこのレベルのアクセスを本当に必要とする場合は提供しますが、セキュリティとシステムの整合性の懸念から、そうすることを非常に恐れています。 私は賛否両論を探しているのではなく、この状況に対処するために私がとるべき方法に関するアドバイスを探しています。

1
cronジョブとは/ usr / lib / sa / sa1
マシンでログウォッチを有効にしています。突然、ログウォッチにこの行が表示されます /usr/lib64/sa/sa1 1 1 : 4297 times /usr/lib64/sa/sa2 -A : 29 times run-part /etc/cron.hourly : 716 crontab -eを試しましたが、エントリが表示されませんか?
14 centos  cron 

2
Linuxベースのデータセンターで時間ドリフトを検出するための戦略は何ですか?
すべてのLinuxベースのデータセンターで時間ドリフトを検出するための戦略は何ですか?これは、最初に思われるよりも難しい問題です。 時間のずれは特定のアプリケーションに深刻な問題を引き起こす可能性があり、多くの場合、NTPがインストールされていても、次の(およびその他の)理由で失敗する可能性があります。 NTPは、再起動時に自動的に再起動するように正しく設定されていません。 サーバーの設定が正しくないため、サーバーが指すタイムサーバーが到達不能または不正確です。 マスタータイムサーバーに到達できず、すべてのサーバーと同期しているため、信頼できないソースに同期しています。 個々のサーバーがすべて正しいかどうかを検出する方法を教えてください。テストスクリプト/アプリケーションがインストールされているサーバーは正しくない可能性があることに注意してください。
14 linux  monitoring  ntp  time 

5
Nginxにアセットを提供する前に数秒間待機するように指示するにはどうすればよいですか?
したがって、私が書いているアプリでAjaxなどをローカルでテストしているとき、sleepステートメントを使用してサーバー側スクリプトに遅延を追加することがよくあります。遅い接続などをシミュレートするのに役立ちます。 Nginx configで同様の遅延動作を直接指定する方法はありますか?それは提供しているフラットなHTMLファイルで動作しますか? ネットワークレベルで同様の遅延シミュレーションを実行できることは承知しています(こちらを参照)
14 nginx 

3
mdadm raid5による二重ディスク障害の回復-ひねり(ドライブ順)
最初に、間違いを犯したこと、およびこのRAID上のすべてではないがほとんどのデータのバックアップがあることを認めさせてください。残りのデータを回復することを望んでいます。ドライブを復旧の専門会社に持ち込むようなお金はありません。 間違い#0、100%のバックアップがない。知っている。 私が持っているmdadm4x3TBのRAID5システムを。/ dev / sd [be]をドライブし/dev/sd[b-e]1ます。すべて1つのパーティションがあります。非常に大きなドライブでのRAID5にはリスクがあることは承知していますが、とにかくそれを行いました。 最近のイベント 2つのドライブに障害が発生すると、RAIDは劣化します。一方のドライブ[/ dev / sdc]は実際になくなっており、もう一方の[/ dev / sde]は電源を入れ直した後に復旧しましたが、RAIDに自動的に再追加されませんでした。そのため、2つのアクティブドライブ[/ dev / sdbおよび/ dev / sdd]のみを持つ4デバイスRAIDが残っていました。 間違い#1、RAIDの復元にドライブのddコピーを使用していない。ドライブも時間もありませんでした。間違い#2 mdadm -E。スーパーブロックと残りのドライブのバックアップを作成していません。 回復の試み RAIDを縮退モードで再構成しました mdadm --assemble --force /dev/md0, using /dev/sd[bde]1. その後、データにアクセスできました。/dev/sdcスペアに交換しました。空の; 同一のドライブ。 /dev/sdc1RAIDから古いものを削除しました mdadm --fail /dev/md0 /dev/sdc1 間違い#3、ドライブを交換する前にこれを行わない 次に、新しいパーティションを作成/dev/sdcし、RAIDに追加しました。 mdadm --add /dev/md0 /dev/sdc1 その後、RAIDの復元を開始しました。ETA 300分 私はプロセス/proc/mdstatを2%で実行し、他のことをしました。 結果を確認する 数時間後(ただし300分未満)、プロセスをチェックしました。の読み取りエラーにより停止しました/dev/sde1。 …

2
サーバー上のポートアクセスをブロックするイーサネットポートプラスチックプラグ
イーサネットポート内にプラスチック製のブロッカーを備えたDell Poweredgeサーバーがあります。私の問題は、それを取り出す方法がわからないことです。ここでプラグの写真を見ることができます: 私はそれらを引き抜こうとした、または絞ってから引っ張ろうとしたが、動かない。Dellのインストールマニュアルには何も記載されていないため、おそらくDellから提供されたものではありません。 この種のプラグを見て、何かを壊す危険を冒すことなくそれらを取り出す方法を知っていますか?

3
Debianでユーザーのフルネームを変更する方法
私は、経験の浅い管理者としてDebianサーバーで作業しています。の間に提供されたユーザーのフルネーム(ログイン名ではない)を変更する必要がありますadduser USERNAME。これどうやってするの?usermod(http://linuxcommand.org/man_pages/usermod8.html)にそのようなオプションが見つかりませんでした。

1
Windowsファイアウォールサービスを無効にしないように推奨事項をバックアップするにはどうすればよいですか?
個人的な経験から、XP後のシステムでWindowsファイアウォールサービスを無効にすると、あらゆる種類のネットワークの問題につながる可能性があり、それを無効にする適切な方法は、トラフィックをブロックせずに実際のサービスを実行したままにすることです。これは、Vista以降、WindowsファイアウォールサービスがWindowsネットワークスタックの重要なコンポーネントであり、それを停止すると完全にランダムな方法で大混乱が生じるためです。 ただし、サービスを停止して無効にするだけでよい解決策であり、適切に無効にするために時間をかけることは不要な作業であると考える人々につまずきます。その後、あらゆる種類のネットワークの痛みが発生すると、本当の理由を認めず、それを承諾する前に他のことを試みます。はい、そのサービスは実際に実行したままにしておく必要があります。 これらの人々を重い(および/または鋭い)オブジェクトで攻撃することは別として、ここでの実際の解決策は、「このサービスを無効にしないでください、または単にトラブルを求めている」という公式文書です。それでも、私が見つけたこのトピックに関する唯一の投稿は、単に「セキュリティが強化されたWindowsファイアウォールに関連するサービスの停止はMicrosoftによってサポートされていません」と言っているだけです。 。 Windowsファイアウォールサービスを実際に停止するべきではないという主張を裏付けるために参照できるものはありますか? 明確化のビット:私は実際にユーザーに言及しなかったが、上記のような構成がちょうどいいと思いすぎ態度、あまりにも少しの本当の知識を持つ管理者に、彼らのネットワーク全体でのGPOを経由して、それを実現し、かつ単純ではありません彼らが経験しているこれらのランダムなネットワークの問題は、それによって引き起こされる可能性が非常に高いことを彼らに伝えるときに聞いています。 現在、これらの問題の修正(および、この問題のために期待どおりに機能しない新しいサービスの実装)を担当しています。f*** ingサービスをそのままにするように説得する方法が必要です。残念ながら、個人的な経験は十分に公式ではないようです。

1
vCenter 5.1u1がメンテナンスモードからホストを終了するのはなぜですか?
このvCenterサーバーは5.1アップデート1にアップグレードされたばかりです。ホストを調べてファームウェアを最新の状態にしてから、さまざまなバージョンの5.0から5.1u1にアップグレードします。 vCenter 5。まだ5.1にアップグレードされていない5.0ホストでのみ発生します。 イメージでは、ホストをmaintモードに設定し、HP SPP DVDの自動更新モードで再起動しました。通常の約40分の更新プロセスの後、ホストはオンラインに戻りました。ホストが再接続したことを記録する7秒前に、vCenterはホストにメンテナンスモードを終了するタスクを送信しました。 私の理解では、vCenterがメンテナンスモードからホストを削除する必要があるのは、vCenterがホストをメンテナンスモード自体(VUMアップグレードタスクなど)にしたときだけです。 このvCenterがユーザー開始メンテナンスモードから一方的にホストを終了するのはなぜですか? 編集、追加情報: さらに5つのホストでファームウェアアップグレードをすべて同時に実行しました。それらのうち2つは再接続後にmaintモードを終了し、3つは終了しませんでした。maintモードを終了する一般的な要因は、どれくらいの時間オフラインになっていたようです。仮想メディアを起動するのに数回の試行を要した2つは、メイントモードからノックアウトされた2つです。 esx31(上の画像):応答しない45分 esx19(exited maint):応答しない87分 esx24(maintにとどまる):32分間無反応 esx29(maintにとどまった):応答しない39分 esx32(maintにとどまる):30分間無反応 esx34(exited maint):応答しない70分 編集:切断時間のアイデアは、一貫して起こっていないため、赤いニシンであったようです。 さらに、vpxd.logメイントモードの終了では、タスクの開始は常にこのvim.EnvironmentBrowser.queryProvisioningPolicySOAP呼び出しの直後に続くようです。以下に、わかりやすくするために少しトリミングした行を示します。 15:27:49.535 [info 'vpxdvpxdVmomi'] [ClientAdapterBase::InvokeOnSoap] Invoke done (esx31, vim.EnvironmentBrowser.queryProvisioningPolicy) 15:27:49.560 [info 'commonvpxLro'] [VpxLRO] -- BEGIN task -- esx31 -- HostSystem.exitMaintenanceMode -- 終了タスクを取得しないノードでは、vim.EnvironmentBrowser.queryProvisioningPolicyイベントが引き続き発生することに注意してください。再接続プロセスでは、メンテナンスモードの終了による余分なイベントは別として、この前後のイベントに違いは見られません。 ログにプロビジョニングポリシーが記載されていることを考えると、自動展開に関連するメンテナンスモードの問題を探すと、同様の動作に関する苦情が寄せられます(ただし、自動展開はまったく使用していません)。


4
nginx変数が設定されているかどうかをテストします
変数がまだ設定されていない場合は、変数をデフォルト値に設定する必要があります。次の設定は仕事をします: if ($foo ~ "^$") { set $foo default-value; } ただし、ランタイム警告が生成されます。 初期化されていない「foo」変数を使用する 警告を生成せずに、グローバルに警告をオフにせずに変数が設定されているかどうかをテストする方法はありますか? uninitialized_variable_warn off;
14 nginx 

3
ハードウェアRAIDコントローラーキャッシュバッテリー障害の頻度/寿命?
私は、AdaptecおよびLSI MegaRAIDハードウェアRAIDコントローラーを装備した多くのSupermicroサーバーを含む環境にいます。これらのコントローラーには、バッテリバックアップ式キャッシュモジュールが含まれており、書き込みパフォーマンスを向上させ、転送中のデータを保護します。 頻繁にサポートされる問題は、RAIDコントローラーのバッテリー障害です。これにより、アレイがライトバックモードからライトスルーモードに移行します。システムの書き込み速度が低下すると、明らかにパフォーマンスが低下します。これは、システムの電源を切ってバッテリーを交換するためのダウンタイムウィンドウが確立されるまで続きます。 これは私たちにとって非常に日常的な操作です。数千台の物理サーバーでほぼ毎週 ...充電サイクルなしで交換できるように、交換用バッテリーを準備するための充電ステーションも設置されています。 おそらく、HP ProLiantサーバーとSmartアレイRAIDコントローラーの長い歴史に甘やかされていますが、HPシステムのバッテリー寿命は通常4〜6年でした。最終的には、2009年頃にRAIDバッテリーの使用を廃止しました。スーパーキャパシタでバックアップされたメモリモジュール(フラッシュバックアップ式書き込みキャッシュ、またはFBWC)に置き換えられました。 AdaptecおよびLSIコントローラーのバッテリー障害は、 12か月未満稼働しているシステムで時々発生するのを見るので、これは他の環境で一般的かどうか疑問に思います。 これが一般的な場合、他の大規模なサーバー環境はこれをどのように処理しますか? RAIDバッテリーの交換を処理するためのヒントやコツはありますか? 役立つ構成パラメーターはありますか? これは、環境内の運用に対してどれほど破壊的ですか? シャーシの冷却と温度の低下が要因になる可能性がありますか? 私たちは何か間違ったことをしていますか? Dell PERCコントローラは、LSIによって作成されています。Dell環境では、同じ短いバッテリ寿命が発生しますか? 1年以上使用できる新世代バッテリーの概要を示すLSI製品資料。 HP ProLiant DL585 G2サーバーは、1000日以上の稼働時間とRAIDバッテリーを搭載しています... # uptime 05:38:08 up 1031 days, 44 min, 31 users, load average: 0.49, 0.64, 0.99 # hpacucli Cache Board Present: True Cache Status: OK Accelerator Ratio: 50% Read …

1
ソフトウェアmd-raidを使用してSSDにLinux fstrimを実装する
現在、MariaDBインスタンスを実行するために、RAIDミラーに2つの256GB SSDを搭載した新しいUbuntu 13.04サーバーを構築しています。通常、LVMはmd raid 1アレイの上にあるdm-crypt暗号化の上に配置しますが、以前はこのセットアップでSSDを使用していません。 私の質問は、新しい(3.8)カーネルを使用するため、fstrimをRAIDボリュームに直接適用できるようにする必要があることです。fstrim -v /RAIDが適所になかった場合と同じように、cronジョブを介して適切に動作するために、これに単純に依存できますか?RAIDボリュームの上にLVMがあってもこれは本当ですか?ドライブにあるハードウェア暗号化を使用する予定なので、ここではdm-cryptは必要ありません。 注:更新されたカーネルバージョンのバックポートとmdボリュームでの廃棄の実装に関連するいくつかの同様の質問があることを認識しています- fstrim新しいカーネルでさらに変更することなくmd-raidに対して動作するかどうかを具体的に尋ねています。 更新:これがうまくいったことをフォローアップして投稿したかっただけです。そこジョブが実行されますが、上fstrim cron.dailyがあることで、今だ/と/boot、それが完璧に働いています。また、SSD(Samsung 840 Pro)のハードウェア暗号化にはTPMサポートが必要であることが判明しましたが、TPMサポートはないため、リンクに示すようにソフトウェア暗号化を構成しました。追加することによりdiscard中のオプションに/etc/crypttab(ないと/etc/fstab)とissue_discards = 1のデバイスセクションに/etc/lvm/lvm.confも、LVM、暗号化、およびRAID層によって罰金、fstrim作品。 LVMおよび暗号化を使用したSSDでのトリム/廃棄の構成に関する詳細情報は、こちらから入手できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.