1
羽と寄木細工の違いは何ですか?
どちらも、データ分析システムで使用するための柱状(ディスク)ストレージ形式です。両方が内に一体化されているApacheの矢印(pyarrowのPython用のパッケージ)とに対応するように設計されている矢印柱状インメモリ分析層として。 両方のフォーマットはどのように異なりますか? 可能であれば、パンダを扱うときは常に羽を好むべきですか? 寄木細工よりも羽が適している、またはその逆のユースケースは何ですか? 付録 https://github.com/wesm/feather/issues/188でいくつかのヒントを見つけましたが、このプロジェクトの年齢が若いことを考えると、おそらく少し時代遅れです。 データフレーム全体をダンプしてロードしているだけなので、深刻な速度テストではありませんが、これまでフォーマットについて聞いたことがない場合は、印象を与えるためです。 # IPython import numpy as np import pandas as pd import pyarrow as pa import pyarrow.feather as feather import pyarrow.parquet as pq import fastparquet as fp df = pd.DataFrame({'one': [-1, np.nan, 2.5], 'two': ['foo', 'bar', 'baz'], 'three': [True, False, True]}) print("pandas df to …