タグ付けされた質問 「statistics」

5
**どのように**ハードディスクの回転サイクルは有害ですか?
ハードディスクをスピンダウンしてバックアップするたびに、平均寿命から少し時間を削るのが常識です¹。 このトピックは以前に説明されています。 ハードディスクの電源を切ることは有害ですか? 最新のハードドライブでのスタンバイ(スピンダウン)モードの影響は何ですか? スピンダウンとスピンアップが有害である理由の一般的な説明は、通常のランニングよりも機械部品に大きなストレスを誘発し、デバイスのメカニクスに有害な熱変動を引き起こすことです。 スピンサイクルがどれほど悪いかを定量的に示すデータはありますか?つまり、スピンサイクルの平均寿命はどれくらいですか?または、実際には、X秒間ディスクを必要としないことがわかっている場合、スピンダウンを保証するためにXをどれだけ大きくする必要がありますか? ¹ しかし、従来の知恵は以前は間違っていました。たとえば、ハードディスクは可能な限り低温に保つべきであると一般に考えられていますが、このトピックに関するある公開された研究では、実際にはより低温のドライブがより故障することが示されています。この調査は、調査対象のすべてのディスクの電源が24時間年中無休であったため、ここでは役に立ちません。

4
異なるメーカーが異なるSMART値を持っているのはなぜですか?
まず第一に、メーカーが認めたい以上にハードドライブが故障することは誰もが知っていると思います。Googleは、ハードドライブのSMARTステータスが報告する特定の生データ属性が、ドライブの将来の障害と強い相関関係を持つ可能性があることを示す調査を行いました。 たとえば、最初のスキャンエラーの後、ドライブはそのようなエラーのないドライブよりも60日以内に39倍故障する可能性が高いことがわかります。再割り当て、オフライン再割り当て、および保護観察カウントの最初のエラーも、高い障害確率と強く相関しています。これらの強力な相関関係にもかかわらず、故障したドライブの大部分がSMARTエラー信号をまったく示さなかったことを考えると、SMARTパラメータのみに基づく故障予測モデルは予測精度が大幅に制限される可能性が高いことがわかります。 Seagateは、ソフトウェアのみがドライブの正確なステータスを正確に判断できると主張し、ソフトウェアがSMART属性の生データ値を通知しない方法で、ドライブに関するこの情報を隠そうとしているようです。Western Digitalは私の知る限りそのような主張をしていませんが、彼らのステータスレポートツールは生データ値もレポートしていないようです。 各属性の生データ値を収集するために、smartmontoolsのHDtuneとsmartctlを使用しています。確かに...特定の属性に関しては、リンゴとオレンジを比較しています。たとえば、ほとんどのSeagateドライブでは、数百万の読み取りエラーがあると報告されますが、ウェスタンデジタル99%は読み取りエラーに対して0を示します。また、Seagateは何百万ものシークエラーを報告しますが、Western Digitalは常に0を報告するようです。 Q:このデータを正規化するにはどうすればよいですか?Seagateは何百万ものエラーを生成していますが、Western Digitalは何も生成していませんか?SMARTステータスに関するウィキペディアの記事によると、製造業者にはこのデータを報告するさまざまな方法があります。 私の仮説は次のとおりです。 データを正規化する方法を見つけたと思います(正しい用語ですか?)。 Seagateドライブには、Western Digitalドライブにはない追加の属性があります(ハードウェアECCリカバリ済み)。ECC回復カウントから読み取りエラーカウントを差し引くと、おそらく0になります。これは、Western Digitalが報告した「読み取りエラー」カウントと同等のようです。これは、Western Digitalが修正できない読み取りエラーのみを報告し、Seagateがすべての読み取りエラーをカウントし、修正できたエラーの数を通知することを意味します。 読み取りエラーカウントがECCリカバリカウントよりも少ないSeagateドライブがあり、ファイルの多くが破損していることに気付きました。これが私の仮説を思いついた方法です。シーゲイトが生成する何百万ものシークエラーは未だに謎です。 追加情報がある場合は、私の仮説を確認または修正してください。 ここに私の西部のデジタルドライブのスマートステータスがありますので、私が話していることを見ることができます。 james@ubuntu:~$ sudo smartctl -a /dev/sda smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF INFORMATION SECTION === Device Model: WDC WD1001FALS-00E3A0 Serial Number: WD-WCATR0258512 Firmware Version: …

2
さまざまなメディアの長期保存の信頼性
さまざまな種類のメディアの長期保存/アーカイブの信頼性に関する統計のリファレンスを探しています。つまり、可能な限り多くの種類のメディア(フロッピー、テープ、CD、DVD、フラッシュなど)にデータを確実に保存できる期間に関する情報、比較、チャート、グラフ、テスト結果などを探しています。ドライブ/メモリカード、HD、SSD、デバイスファームウェア/ EEPROM、一体、パンチカードや石のタブレット(ある場合)。 明らかに、DVDの50年の信頼性のようなものに関するデータはありませんが、おそらくウイルス対策比較データベースと同様に、データは時間の経過とともに更新されます。

4
平均故障時間(MTTF):ディスクメーカーがこれを投稿するとき、それらの数値をどのように解釈すべきですか?
通常、平均故障時間(MTTF)は時間で表され、いくつかの計算を行うと、かなりの年数が経過した後にのみディスクが故障するように見えます。 ディスクはそれよりも頻繁に修復する必要があるようです。これがなぜそうであるか誰か知っていますか? 私はこの測定基準について何か怪しいことがあると考えました。ここで何か間違っていると解釈していますか?

5
SubVersionリポジトリのサイズを分析することは可能ですか?
SubVersionリポジトリの各プロジェクトが使用しているディスク容量を知ることはできますか? 各プロジェクトの作業コピーをチェックアウトして各プロジェクトが占めるサイズを調べることはできますが、それがプロジェクトの合計サイズ(すべてのリビジョン)を網羅しているとは思いません。 リポジトリの "db"ディレクトリを見ることはできますが、そこにあるファイルのどれも意味がありません - 各プロジェクトがどれだけのスペースを占有しているかを把握するためにそれらを使用することは不可能です。 私が試した svn ls --verbose しかし、それが私に与えるサイズはヘッドリビジョンの実際のファイルのサイズにすぎません、私はそれがすべてのリビジョンを含むとは思いません。 たぶんこれは不可能ですが、私は私が尋ねると思いました。 前もって感謝します!

3
マウス使用統計を収集するアプリケーション[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? スーパーユーザーのトピックになるように質問を更新します。 3年前休業。 マウスの使用に関する統計を収集および分析するために使用できるアプリケーション。 例:マウスの移動速度、生産的および非生産的クリックの数など。分析が多ければ多いほど効果的です。 アンチマウスの使用量に最も近いアンチマウスを調べましたが、残念ながら、プログラムを閉じるたびに統計がリセットされます。長期分析のために統計を収集するプログラムが必要です。 PS:キーボードを使用するための同様のプログラム。

6
ブログのテキスト分析を実行するソフトウェアはありますか?[閉まっている]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、上のトピックスーパーユーザーのために。 3年前休業。 私の会社は、過去11年間のクライアントのWordpress 2ブログ投稿のPivotViewer視覚化を作成することを目指しています。ただし、これを行うには、並べ替え可能なカテゴリとして使用するために、やや無計画で不完全な、一般に不十分なタグを編集する必要があります。私たちは彼らのブログのエントリを分析し、単語カウントを実行して、私たちが何を扱っているかを理解するためのツールを探しています。 理想的には、これらの機能をすべて備えています。 単語のブラックリスト化(無視) 単語ステミング カスタム同義語のマージ すべての用途を数える 単語が表示される投稿の数を数えます。 この種のテキスト分析は非常に一般的だと思っていたでしょうが、この種のことを行うソフトウェアをブログ全体で見つけることはできませんでした。これを行うためのソフトウェアはありますか?

1
Linuxでは、どのプロセスが最もネットワーク帯域幅を使用しているかをどのように確認できますか?
Linuxでは、どのプロセスが最もネットワーク帯域幅を使用しているかをどのように確認できますか?ネットワークに「トップ」のようなものはありますか? 私はbwm-ngについて知っていますが、プロセスごとの使用量ではなく、グローバル統計のみを表示します。

3
国の統計を使用して色分けされた国の地図を作成する
国の地政学的な地図を使用して、PNG(またはGIF)画像を作成します。各国は、いくつかの国の統計に従って色が設定されています(「米国」にはn、「カナダ」にはmなど)。 LogToMapに似たものですが、動的に生成したり、インタラクティブにする必要はありません。データソースは外部ファイルです。

2
リモートデスクトップ - アクティビティ統計の監視 - Windows Server 2008 R2
私はリモートデスクトップを使用して作業している複数のユーザーでWindows Server 2008 R2のセットアップをしています。私は一日を通してシステムとの彼らの相互作用のいくつかの統計を取得したいのですが。たとえば、何回キーストロークが送信されたか、またはマウスを使用した操作やその他の操作方法も同様です。ユーザーがサインオフしてサインインしたときだけでなく、その日の何時の間にシステムとの相互作用が激しくなくなったかを示すグラフがいくつかあります。 そのような統計を作成するためのツールはありますか?

1
フィルター処理されたデータでLINESTを使用する-Excel
LINEST関数を使用してから、興味のあるサブセットを反映するように元のデータをフィルター処理しようとしています。残念ながら、LINESTは常に最初に定義されたすべてのデータを使用します。フィルタリングされたデータからデータを取得する方法はありますか?-「トレンドライン」は適切に機能します。


1
OpenOffice calcはデータ点を異なる方法で色付けする
私は上司のためにいくつかのFTPファイルサイズ統計を集めました、そして私はOpenOffice calcが異なったデータポイントを色付けする能力を持っていたかどうか疑問に思いました。平均値から1標準偏差以内のデータ点を緑色に、1から2標準偏差の間のデータ点に黄色を適用し、それらの点の外側に赤色を適用します。その方法がわかりませんでした。 ODSファイルがもうありません。私はベル/分布曲線を得た後にそれを削除しました。私はPaint.netを使って適切な部分を緑色にしました。私は黄色と赤の部分を気にしませんでした。以下はグラフです。 これがOO.oでは不可能だが、ExcelやGoogle Spreadsheetsで可能であれば、それらを使っても大丈夫です。 編集: ユーザー IQV 異なるXYプロットを組み合わせて個々の線に色を付けることをお勧めします。私が期待していたものではありませんが、フォトエディタで線を色付けすることなく機能します。テキストセルの色付けには条件付き書式を使用し、色付きセルに基づいて範囲を簡単に選択することで各プロット曲線を定義しました。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.