タグ付けされた質問 「archive」

11
15TBの小さなファイルを転送する
あるサーバーから別のサーバーにデータをアーカイブしています。最初はrsync仕事を始めました。5 TBのデータのファイルリストを作成するのに2週間、1 TBのデータを転送するのにさらに1週間かかりました。 その後、新しいサーバーでいくつかのダウンタイムが必要になるため、ジョブを強制終了する必要がありました。 おそらく再びアクセスする必要はないので、それをtarすることに同意しました。500 GBのチャンクに分割することを考えていました。私がtarそれをした後、私はそれをコピーしようとしましたssh。私は使用tarしてpigzいましたが、それでも遅すぎます。 それを行うより良い方法はありますか?両方のサーバーがRedhat上にあると思います。古いサーバーはExt4で、新しいサーバーはXFSです。 ファイルサイズは数KBから数MBの範囲で、5 TBには2400万のJPEGがあります。ですから、15TBで約6,000万から8,000万を推測しています。 編集:数日間rsync、nc、tar、mbuffer、pizzで遊んだ後。ボトルネックはディスクIOになります。データが500個のSASディスクと約2億5千万個のjpegにストライプ化されているため。しかし、今では、将来使用できるこれらすべての素晴らしいツールについて学びました。

8
アーカイブに保存されているファイルを効率的に取得するための、よりスマートなtarまたはcpioがありますか?
tar非常に大きな(マルチGB)bz2ファイルのグループをアーカイブするために使用しています。 tar -tf file.tarアーカイブ内のファイルの一覧表示に使用する場合、完了するまでに非常に長い時間がかかります(約10〜15分)。 同様に、cpio -t < file.cpio完了するまでに数秒かかります。 したがって、(tar -xf file.tar myFileOfInterest.bz2たとえば)経由でアーカイブからファイルを取得するのは同じくらい遅いです。 アーカイブ内の個々のファイルをすばやく取得できるように、アーカイブですぐに利用できる「カタログ」を保持するアーカイブ方法はありますか? たとえば、アーカイブ内の特定のバイトへのポインターと、取得するファイルのサイズ(およびその他のファイルシステム固有の詳細)を格納するある種のカタログ。 アーカイブ内のファイルを効率的に取得できるツール(またはの引数tarまたはcpio)はありますか?
24 linux  tar  archive  cpio 

14
Exchange環境でのメールアーカイブ
Exchange Server 2007環境の電子メールアーカイブとニアラインバックアップを実行するソリューションを検討しています。 現在、約200のメールボックスがあり、メールストアは約150 GBです。法的目的のために電子メールを数年間アーカイブできる必要があります。また、アーカイブソリューションは、可能であれば、削除されたメッセージの復元の迅速化にも役立ちます。システムサポートコンサルタントがMimosaを推奨しています。 この市場でミモザや他の製品を使った経験はありますか?

6
ビデオおよび画像データの費用対効果の高い長期アーカイブ?〜50 TB
私の研究室では、私たちのグループが現在取り組んでいるプロジェクトのデータ(主にビデオと画像データ、およびいくつかのドキュメント)を保持する小さなサーバーをセットアップしています。歴史的に、研究プロジェクトが終了した後、データは無計画に1つのハードドライブ、または大量のDVD(または昔のCD)にアーカイブされ、および/またはビデオの一部はSony DVカセットまたはさらにはVHSテープ(このラボは90年代前半から活動しています)、または上記のすべての混合物... 質問:(1)それらをすべて同じ形式と記憶媒体に統合し、(2)非常にまれなアクセス(たとえば30年以上)のためにそのようなデータを長期間アーカイブするのに最適な媒体は何ですか?残念ながら、企業レベルの予算はありません(私たちはたった10人の研究室にすぎません)。 ありがとう! PS古いビデオと画像の解像度が低いことを考えると、最近のものは非常に大きいので、本当に古いデータ用に30〜40 TB、最近のデータ用に別の10〜20 TB、そして毎年約5 TBの追加について話していると思います。

4
チェックサムを含むtarファイルを作成する
ここに私の問題があります:大きなファイル(通常はそれぞれ30〜40 GB)を大量(最大60 TB)のtarファイルにアーカイブする必要があります。アーカイブする前にこれらのファイルのチェックサム(md5、sha1、何でも)を作成したいと思います。ただし、すべてのファイルを2回(チェックサムで1回、tarで2回)読み取らないことは、非常に高いアーカイブパフォーマンスを実現するために多少なりとも必要です(LTO-4は120 MB / sを維持し、バックアップウィンドウは制限されます)。 そのため、ファイルを読み取り、一方の側にチェックサムツールを供給し、もう一方の側にテープにtarを作成する何らかの方法が必要になります。 tar cf - files | tee tarfile.tar | md5sum - アーカイブ全体のチェックサム(このサンプルシェルコードはこれを行うだけでなく)ではなく、アーカイブ内の個々のファイルのチェックサムが必要な場合を除きます。 GNU tar、Pax、Starオプションを研究しました。Archive :: Tarのソースを見てきました。これを達成する明白な方法はありません。必要なものを実現するために、Cなどで手動でビルドする必要があるようです。Perl / Python /などは単にパフォーマンス面でそれをカットしません、そして、様々なtarプログラムは必要な「プラグインアーキテクチャ」を見逃します。コードチャーニングを開始する前に、これに対する既存のソリューションを知っている人はいますか?

3
archive.debian.orgのwheezy-updatesは404 Not Foundを返します
Debian Wheezyに古いテストマシンがありますが、今すぐ更新することはできません。 Debian Wheezyリポジトリは2月にアーカイブされました。だから私は先に行きたい、と/etc/apt/sources.listから更新しました deb http://ftp.fr.debian.org/debian wheezy main deb http://security.debian.org/ wheezy/updates main deb http://ftp.fr.debian.org/debian wheezy-updates main に deb http://archive.debian.org/debian wheezy main deb http://security.debian.org/ wheezy/updates main deb http://archive.debian.org/debian wheezy-updates main しかし、実行するとapt-get update、このエラーが発生します: # apt-get update <snip> Err http://archive.debian.org wheezy-updates/main i386 Packages 404 Not Found [IP : 193.62.202.28 80] 他のリポジトリは問題なく更新されています。 何か不足していますか?

8
Linuxを使用した自作の自動階層型ストレージソリューション?(メモリ-> SSD-> HDD->リモートストレージ)
システムにSSDを使用し、データにHDDを使用することに関するこの質問に関連します。ただし、システムにこれを自動的に実行させたい場合を除きます... できれば無料のオープンソースソフトウェアを使用して、ストレージの複数のレイヤーを持ち、それらの間でアイテムを自動的にプッシュすることは可能ですか? EMC SAN-> EMC Centera自動アーカイブのような非常に高価なエンタープライズクラスのソリューションを知っていますが、この種の段階的なストレージが自動的に実行できるかどうか疑問に思いました。 これに複数のレイヤーを含めることができると便利です:メモリ-> SSD-> HDD->より遅いHDDまたはテープまたは他のアーカイブソリューション。 これを自動的に行うことができるファイルシステムはありますか?(ZFS、Btrfs、ハンマー?) 任意のUnixの私はどのようにこの作品に、それはLinuxや他のフレーバー(BSDなど)への移植である可能性が高いのかどうか興味があるよう-variantsは、罰金です。
13 linux  unix  ssd  archive  storage 

3
Tar:特定のサイズよりも大きいファイルのアーカイブを避けます
サイズが3 MB未満のファイル(tarを含む)をアーカイブしたい。しかし、それらのファイルが存在するディレクトリも保持したいと思います。(したがって、findコマンドを使用できません)。サイズが3 MBを超えるファイルは避けたいだけです。これをどのように行うことができますか?
11 backup  tar  archive 

9
オープンソースのメールアーカイブアプリケーションを探している[非公開]
現在のところ、この質問はQ&A形式には適していません。回答は事実、参考文献、または専門知識によってサポートされると予想されますが、この質問は議論、議論、世論調査、または広範な議論を求める可能性があります。この質問を改善し、場合によっては再開できると思われる場合は、ヘルプセンターをご覧ください。 7年前に閉鎖されました。 ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 メールをアーカイブするオープンソースのアプリケーションを探しています。定期的にPOP3アカウントにログインしてメールをコピーすることでこれを行うか、メールサーバー上のUnix mbox / maildirファイル/ディレクトリを直接読み取るだけです。 開いており、Linux(または実際に開いているOS)で実行する必要があります。理想的には、Webインターフェイスがありますが、これは主要な要件ではありません。 MXsense(http://www.mxsense.com/mxsense.html)は、開いていないことを除いて、私が望むものとかなり似ているようです。 MS Exchangeサポートの要件はありません。 助言がありますか? 理由は(おそらく少しばかげている)私はLinuxを排他的に実行していることと、すごい点でMS Outlookに近いメールクライアントがまだないということです。メールのアーカイブがあればもっと気分が良くなるので、今月どのメールクライアントを使用していても問題ありません。

2
正規表現を使用してTARアーカイブからファイルを除外する方法
簡単な質問がありますが、答えを見つけることも解くこともできません。tarアーカイブを作成したいのですが、正規表現を使用していくつかのファイルをアーカイブから除外したいと考えています。 除外するファイルの例は次のとおりです。 68x640X480.jpg 私は運なしでこれを試しました: tar cvf test.tar --exclude=[0-9]+x[0-9X]+\.jpg /data/foto 誰か助けてもらえますか?
10 linux  tar  regex  archive 

3
アーカイブソリューションに関する一般的なアドバイス。〜15TBと成長しています。
中小企業のファイルのためのより良いストレージとアーカイブシステムが必要です。具体的には、ファイルは完成したビデオプロジェクトです。時間とコストの制限を超えて、私を阻んでいるのは、私が考えたどのソリューションも信じていません。したがって、私は問題と私の考えを説明しています。ご意見をいただければ幸いです。 予算: 私はそれが必要とするものを使うと信じています。そうは言っても、私たちは中小企業です。私はこれから5k未満、さらには1〜3k程度で脱出できることを望んでいます。それはパイプの夢かもしれません。教えてください。 問題: 生のビデオファイルはファイルサイズが巨大です。これまでに10 TB以上を蓄積しており、それは急速に成長しています。 ビデオ編集にはファイルへの高速な読み取り/書き込みアクセスが必要なため、中央またはクラウドベースのファイルサーバーは十分に高速ではありません。したがって、おそらく古いプロジェクトのための達成ソリューションが必要であり、現在のプロジェクトはローカルに留まる必要があります。 ある種の冗長性とオフサイトのソリューションが必要です。 現在行っていること: 大型で高品質の外付けハードドライブを使用しています。 私たちは常にペアで購入し、手動でコンテンツを複製します。言い換えれば、私たちは一方から作業し、バックアップ/フォールバックとして機能するもう一方にファイルを複製します。 これらのHDは、firewire800またはUSB3で直接動作するのに十分な速度です。 記入したら、ペアを脇に置いておきます。 現在のソリューションの何が問題になっていますか: データは2つのドライブ間で複製されますが、これらのドライブは「バックアップ」されず、オフサイトに保存されません。 これらの多くの外部HD全体の編成は困難です。どのドライブにどのプロジェクトがありますか?等 結局、私たちはとんでもない量のハードドライブを持つことになります。 複製はRAIDではありません。 オプション: ローカルサーバー ラックマウントサーバーと、Norco(SAS)(20ベイ)などのラックマウントハードドライブアレイエンクロージャーを購入します。 すべてのビデオファイルはこのサーバーに保存されます。この1台のコンピューター/サーバーをバックアップするために、クラウドサービスをインストールして支払うことができます。CrashPlanはLinuxで動作し、データ量に制限はありません。ハードドライブはサーバーに接続された物理ドライブであり、CrashPlanのような企業が持っている「NASなし」ルールを回避します。これはパソコンではないため、同期は年中無休で実行できます。これはオフサイトの問題を解決します。 CrashPlanのようなオンラインバックアップサービスを使用する代わりに、これらのファイルをAmazon Glacierアカウントに同期するスクリプトを作成できます。 現在のプロジェクトでは外付けハードドライブからビデオを覗き見するが、完了時にプロジェクトをこの新しいコンピューターに配置する必要があるというポリシー。つまり、現在のプロジェクトに引き続き外部ハードドライブを使用し、アーカイブされたプロジェクトをこのサーバーに保存します。 クラウドベースのバックアップサービス(CrashPlan.com、BackBlaze.com、Carbonite.com) 通常は、コンピュータに物理的に接続されている外付けハードドライブのみをバックアップできます。(NASまたはネットワークドライブなし)。 通常、彼らはバックアップされた外付けドライブがコンピュータに接続されたままであり、すべてのデータがドライブ上に残ることを期待しています。何ヶ月も外付けハードドライブを接続しないと、バックアップはどうなりますか?古いプロジェクトを削除してスペースをクリーンアップすると、それらもオンラインサービスから削除されます。 すべてのデータがクラウドに保存されるまで、ユーザーは外付けハードドライブをコンピューターに接続したままにする必要があります。大きなプロジェクトの場合、これには数週間かかることがあります。 インターネットの転送速度が原因で、プロジェクトの復元は非常に遅くなります。 これらのクラウドバックアップアカウントは、通常、1人のユーザー/ 1台のコンピューターに固有です。したがって、ハードドライブが1人のユーザーによってバックアップされている場合。次に、2人目のユーザーがプロジェクトで作業しますが、それはどういう意味ですか? 大きなNAS NASは「ネットワークエリアストレージ」です。あなたはそれが保持するのと同じくらい多くのハードドライブを挿入します。彼らを襲撃します。これには、ネットワーク接続またはUSB3 / Firewireを介してアクセスできます。 ほとんどのオペレーティングシステムが組み込まれています。したがって、クラウドベースのバックアップサービスのような他のソフトウェアを実行することはできません。また、カスタマイズしたり、独自のソフトウェアを実行したりすることもできません。あなたはあなたが買うものを手に入れます。 大きなNASはかなり高価で、それほど大きくはありません。ベイが4つを超えるものは多くありません。現在、大きなHDは3TBです。したがって、4ベイは12 TB未満のストレージのどこかにある可能性があります。将来のために超快適ではありません。 その他のアイデアは次のとおりです。 テープバックアップ。 古いプロジェクトを直接Amazon Glacierにアーカイブし、ローカルサーバーの構築をスキップして保存します。 アドバイスありがとうございます!!! ジェド

7
どのアーカイブ/圧縮形式ですか?
ロックされています。質問はトピックから外れていますが、歴史的に重要であるため、この質問とその回答はロックされています。現在、新しい回答や相互作用を受け入れていません。 Zip、Rar、7z、Gzip、BZip2、Tarなど。7zが今月のフレーバーだと聞きましたが、なぜですか。すべての状況に最適ですか、それとも特定の状況に適した選択肢がありますか。 または、実際のファイルアーカイバ、つまりWinZip、WinRar、7Zipなど(形式ではなく)のほうが効果が大きいのではないでしょうか。 あなたの答えでは、あなたが言及したフォーマットがどのような速度/圧縮のトレードオフを使用するかを説明できますか? 回答を裏付ける実証テストへのリンクを提供してください。 背景:カスタム検索インデックスをバックアップする必要があります。これには、約3000の比較的小さなファイル(10 MB未満)が作成され、それぞれに多くの反復データが含まれています。 (いつものようにウィキペディアには関連記事がありますが、パフォーマンス比較に関するセクションは簡単です。) ありがとう
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.