サーバー管理者

システムおよびネットワーク管理者向けのQ&A


3
SNMPは2015年現在でも広く使用されていますか?
SNMPについての多くのことは、15年前でも私には面倒でした。1つの例は、MIBがローカルリソースであり、それ以外の場合は数値のOIDを「意味をなす」という概念です。 SNMPは近代化されたか、または何か他のものに変異されましたか?それはまだネットワーク機器の必須機能ですか?
23 snmp 

1
アプリケーションのVMwareパフォーマンス要件をVMware管理者に説明する方法
多くの場合、オンサイトのdebian-stableベースのアプリケーションのインストールは、仮想マシン(通常はVMware ESXi)で実行されます。一般的なケースでは、仮想化環境に対する可視性や影響力はなく、VMware vCenterクライアントや同等のものへのアクセスもありません。ここではVMwareに焦点を当てます。これは、私たちが目にする最も一般的な方法だからです。 私たちがしたいこと: お客様のVMware管理者に伝える:パフォーマンス基準X、Y、Zを満たしている限り、VMware ESX環境などでアプリケーションを実行できます。 実行中のシステムであっても、基準X、Y、Zが実際に継続的に満たされているかどうかを判断できます(たとえば、現在も)(アプリケーションを停止してベンチマークを実行することはできません。仮想環境は時間とともに変化します)。 基準X、Y、およびZが満たされた場合、十分なパフォーマンスでアプリケーションを実行するための適切な仮想HWリソースがあることを確信してください。 X、Y、Zとは何ですか? パフォーマンスの問題がある場合、問題はアプリケーションではなく、仮想化環境にあることが何度もあります。たとえば、別の仮想マシンが大量のCPU、メモリ、またはディスクが実際に格納されているSANを使用している場合、アプリケーション以外のものが頻繁に使用します。現在、それを証明または反証する方法はありません。 理論的には、アプリケーションが遅い場合もあります... ;-) パフォーマンスの問題の根本的な原因(仮想環境またはアプリケーション)をどのように判断しますか? 通常、CPU、メモリ、およびディスクI / Oのパフォーマンスの問題には3つの領域があります。 CPU たとえばVMwareでは、管理者はMHzで表される予約と制限を指定できますが、たとえば、あるESXホストの512MHzは別のESXホストの512MHzとまったく同じです。 そして、私たちが実際にそれを得るかどうかをどのように測定しますか?アプリケーションの実行中に、おそらく4つのCPUで212%のCPU使用率になっていることがわかります。私たちのアプリケーションが多くのことをしているからか、同じホスト上の別のVMがCPUを集中的に使用してすべてのCPUを使用しているからでしょうか? メモリー(バルーニング?) たとえば16GB RAMを要求すると、多くの場合構成されますが、バルーニングのために、実際には4GBしか得られず、驚くことに、アプリケーションのパフォーマンスが低下します。 VMwareツールに現在のバルーニングについて尋ねることができますが、それはしばしば嘘をつく(または少なくとも不正確である)ことがわかりました。OSが合計16GBのRAMがあり、すべてのプロセスの常駐メモリ(RSS)の合計が4GBのRAMであると考える例を見てきましたが、VMwareツールからバルーンが0であると通知された場合でも2GBのRAMしかありません: -( また、コピーオンライトメモリなどの共有RAMが簡単に存在する可能性があるため、RSSを一緒に追加するだけでは有効ではありません。そのため、すべてのプロセスからRSSを単純に差し引いて、RAMの空き容量を測定し、バルーニングを確実に検出することはできません。バルーニングのいくつかのケースを検出できますが、バルーニングが有効であるが、この方法では検出できない他のケースがあります。 ディスクI / O ディスクの読み取りと書き込みの数、読み取りと書き込みのバイト数、およびIO待機%を経時的にグラフ化できると思います。しかし、それはディスクI / Oの正確な状況を教えてくれますか?すべてのCPUを使用する別のVMでビットコインマイナーが実行されている場合、CPUリソースが低下し、IO待機(%で測定されます)上がります。 要約すると、VMware管理者などに、どの言語を使用してどのようなパフォーマンスが必要かを、ポータブルで測定可能な方法で説明できますか?

5
ロードバランサーなしでGoogle Container Engineのポート80および443を公開する
現在、小さな趣味のプロジェクトに取り組んでおり、準備ができたらオープンソースを作成します。このサービスはGoogle Container Engine上で実行されています。GCEを選んだ理由は、構成の手間を避け、コストが手頃で、新しいことを学ぶためです。 ポッドは正常に動作LoadBalancerしています。ポート80および443でサービスを公開するタイプのサービスを作成しました。これは完全に機能します。 しかし、LoadBalancerサービスごとに新しいGoogle Compute Engineロードバランサーが作成されることを発見しました。このロードバランサーは非常に高価であり、単一のインスタンスの趣味のプロジェクトでは本当にやり過ぎです。 コストを削減するために、ロードバランサーなしでポートを公開する方法を探しています。 私が今までに試したこと: NodePortサービスを展開します。残念ながら、30000未満のポートを公開することは許可されていません。 Ingressをデプロイしますが、これによりロードバランサーも作成されます。 無効にしようとしましたHttpLoadBalancing(https://cloud.google.com/container-engine/reference/rest/v1/projects.zones.clusters#HttpLoadBalancing)が、ロードバランサーを作成します。 ロードバランサーなしでGoogle Container Engineの単一インスタンスのポート80と443を公開する方法はありますか?

2
ZooKeeperサーバーがリーダーかフォロワーかを確認するには、どのコマンドを発行する必要がありますか?
3つのZooKeeperサーバーで構成されるZooKeeper Quorumが作成されました。 zoo.cfg次のように3つのすべてのZooKeeperサーバのルックスにあります: maxClientCnxns=50 # The number of milliseconds of each tick tickTime=2000 # The number of ticks that the initial # synchronization phase can take initLimit=10 # The number of ticks that can pass between # sending a request and getting an acknowledgement syncLimit=5 # the directory where the …
23 linux  zookeeper 

2
Ansibleはシェルスクリプトで 'rm -rf /'の実行を防止します
これは、このデマの質問に基づいています。説明されている問題は、次の効果をもたらすものを含むbashスクリプトを持っていることです。 rm -rf {pattern1}/{pattern2} ...両方のパターンに1つ以上の空の要素が含まれる場合rm -rf /、元のコマンドが正しく転写され、OPがパラメーター展開ではなくブレース展開を行っていると仮定して、少なくとも1つのインスタンスに展開されます。 OPによるデマの説明では、彼は次のように述べています。 コマンド[...]は無害ですが、ほとんど誰も気付いていないようです。 Ansibleツールはこれらのエラーを防止しますが[...]しかし[...]誰もそれを知らないようでした。さもなければ彼らは私が説明したことが起こらないことを知っているでしょう。 したがってrm -rf /、ブレース展開またはパラメーター展開のいずれかを介してコマンドを発行するシェルスクリプトがあると仮定すると、Ansibleを使用するとそのコマンドの実行が妨げられるというのは本当ですか? rm -rf /あなたがそれを行うためにAnsibleを使用している限り、root権限で実行することは本当に「無害」ですか?
23 linux  bash  ansible  rm 

10
CentOS 7「ネットワーク」サービスを開始できません
「NetworkManager」サービスを無効にして削除した後、CentOS 7「ネットワーク」サービスを開始できません。ネットワークサービスのステータスを確認すると、次のエラーが表示されます。 #systemctl status network.service network.service - LSB: Bring up/down networking Loaded: loaded (/etc/rc.d/init.d/network) Active: failed (Result: exit-code) since Fri 2015-01-16 22:30:46 GMT; 38s ago Process: 4857 ExecStart=/etc/rc.d/init.d/network start (code=exited, status=1/FAILURE) Jan 16 22:30:46 localhost.localdomain network[4857]: RTNETLINK answers: File exists Jan 16 22:30:46 localhost.localdomain network[4857]: RTNETLINK answers: File exists Jan …

6
Ansibleでapt-get autoremoveを実行する
私はansibleでEC2サーバーの群れを維持しています。サーバーは定期的に更新され、aptモジュールを使用してアップグレードされます。 サーバーを手動でアップグレードしようとすると、次のメッセージが表示されました。 $ sudo apt-get upgrade Reading package lists... Done Building dependency tree Reading state information... Done Calculating upgrade... Done The following packages were automatically installed and are no longer required: linux-headers-3.13.0-29 linux-headers-3.13.0-29-generic linux-headers-3.13.0-32 linux-headers-3.13.0-32-generic linux-image-3.13.0-29-generic linux-image-3.13.0-32-generic Use 'apt-get autoremove' to remove them. 0 upgraded, 0 newly installed, 0 to …
23 apt  ansible 

4
MBRディスクにプライマリパーティションが4つしかないのはなぜですか?
CentOS.orgでドキュメントを読んでいます。 セクション25.1.2で。パーティション:1つのドライブを多数に変換する、次のステートメントがあります。 パーティションテーブルは、4つのセクションまたは4つのプライマリパーティションに分割されます。プライマリパーティションは、1つの論理ドライブ(またはセクション)のみを含むことができるハードドライブ上のパーティションです。各セクションには、単一のパーティションを定義するために必要な情報を保持できます。つまり、パーティションテーブルで定義できるパーティションは4つまでです。 パーティションが4つしかない理由がわかりません。これは最初に設計された方法ですか?本当に4つのプライマリパーティションしか存在できないのでしょうか?
23 partition  mbr 

4
SSL証明書が失効しているかどうかを確認するにはどうすればよいですか
ハートブリードの脆弱性の最近の発見により、認証局は証明書を再発行するようになりました。 heartbleed脆弱性が発見される前に生成された2つの証明書があります。SSL発行者から証明書を再生成するように指示された後、サーバー/ドメインの両方を新しい証明書で更新しました。 私の理解が正しい場合、古い証明書はCAによって失効され、CRL(証明書失効リスト)またはOCSPデータベース(オンライン証明書ステータスプロトコル)に到達する必要があります。そうでない場合、誰かが「侵害された証明書から取得した情報から証明書を再生成することにより、中間者攻撃。 古い証明書がCRLとOCSPに到達したかどうかを確認する方法はありますか。それらが含まれていない場合、それらを含める方法はありますか? 更新:状況は、既に証明書を置き換えていることです。古い証明書の.crtファイルのみであるため、URLを使用して確認することは実際には不可能です。
23 linux  ssl  heartbleed  crl  ocsp 

2
ほこりからサーバーを保護する
建物の小さな(約10'x10 ')地下室に1台のサーバーラック(42Uのうち31台)がありますが、そこには軽い改修工事が行われています...廊下や部屋を作るためのカフェテリアであったものを、関連する乾式壁、天井を落とし、新しい床タイルを使って作りました。具体的には、乾式壁の仕上げ作業のために、泥やサンディングの乗組員がすぐに来ます。ラック内の機器を移動または切断できません。結果として生じる埃からスイッチとサーバーを保護するにはどうすればよいですか? 部屋の詳細:サーバールーム専用のエアコンがありますが、クリーンルームではありません。労働者はサーバールームにアクセスできず、部屋自体に乾式壁の作業はありません。仕事の前に新しいフィルターを手に入れる小さな家庭用空気清浄機を部屋にすでに持っています。5月下旬には、掃除のために個々の機械を開けることができるダウンタイムを計画しています。 )。機器をほこりから保護するためにできること、またはすべきことは他にありますか?私はそれが冷却ファンと電源ファンのベアリングに入ることを最も心配しています。

2
Bashスクリプトが1行に5分のカウントダウンを表示する[終了]
閉じた。この質問には、詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善したいですか?詳細を追加し、この投稿を編集して問題を明確にします。 6年前に閉鎖されました。 5分カウントダウンして、毎秒更新し、同じ行に結果を表示したいと思います。これはBashスクリプトでも可能ですか?
23 bash 

5
Windowsはプログラムの依存関係をどのように処理しますか?
私はかなり長い間Linuxを使ってきましたが、apt-get、aptitude、Pacman、yumなどのパッケージマネージャーのようなプログラムの依存関係をWindowsがどのように処理できるのか、常に疑問に思っていました。時々、私のパッケージマネージャーは、このライブラリのこのバージョンがこのパッケージに必要であるか、何らかの競合があることを教えてくれます。 Windowsはこれらすべてをどのように処理しますか?

3
iptablesファイアウォールルールを使用する場合、許可されたすべてのポートで新しい状態をアサートするのはなぜですか?
多くの場合、すべてのパケットを関連接続に許可し、特定のサービスポートを新規接続に許可するように構成されたiptablesが表示されます。 NEWと表示する理由は何ですか?接続が新規でない場合、関連していると思われるため、特定のポートルールはどちらも実行しません。それでは、プロトコルとポート番号だけでなく、サービスポートを明示的にNEWで定義するのはなぜですか?
23 iptables 


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.