私は何年もHDF5を使用していますが、データセットのサイズが大きくなるにつれて、ここにリストされているのと同じ問題を経験し始めています。
http://cyrille.rossant.net/moving-away-hdf5/
HDF5のようなフォーマットを指定してください-並列書き込みの良好なサポート-巨大なマトリックスのチャンクアクセスのサポート
私の典型的な使用例は、100k x 100k整数行列です。論理的な観点からファイル全体として保持したいのですが、並列ワーカーでチャンクごとに書き込む必要があります。
3
エクスポートする必要があるデータセットの種類を説明してください。これは、あなたの質問に答えようとしている人々に役立つかもしれません。netcfdと同様にHDF5を検討しました。ただし、これらは特定のデータセットにより適している場合があります。
—
チャールズ
圧縮VTKはチャンクをサポートします。多数のファイルを並行して保存し、PVDメタファイルを使用してそれらをマージできます。データセットのサイズは?
—
クレジストフBzowski
編集後-VTKのチャンクは良い決定ではありません。
—
クレジストフBzowski
何を使いましたか?
—
aidan.plenert.macdonald
@ aidan.penert.macdonald hdf5を使い、MPIで並列書き込みを使用しました。しかし、Pythonを放棄しなければなりませんでした
—
-MG