PythonのPandasとNumPy + SciPyの違いは何ですか?[閉まっている]


195

どちらも非常に似ているようで、財務データ分析にどのパッケージがより有益であるかについて知りたいです。

回答:


313

パンダは、NumPyの上に構築された高レベルのデータ操作ツールを提供します。NumPy自体は、MATLABと同様、かなり低レベルのツールです。一方、パンダは、豊富な時系列機能、データ調整、NAフレンドリーな統計、groupby、マージおよび結合メソッド、およびその他の多くの便利な機能を提供します。近年、金融アプリケーションで非常に人気があります。私の次の本には、パンダを使用した財務データ分析に特化した章があります。


216
あなたはパンダの主要な作者であることを述べるべきだったのに。:)問題の本:shop.oreilly.com/product/0636920023784.do
Yktula

3
パンダは効率的な辞書を提供するのに対し、numpyは主に効率的な配列を提供すると言っても過言ではないでしょうか?(どちらの場合も、自由形式ではなく一貫したデータ型に制限されます。)私(今すぐ調べ始めたばかり)にとって、これは根本的な違いとして私に印象を与えます。 2D別名テーブル)。これによりデータの整列、結合などがすべて可能になりますが、その根本的な違いを理解しない人にとっては、それらの意味が明確ではありません(たとえば、2つの乱暴な配列の「データ整列」とは何ですか?)。
Brandyn 14

6
間抜けな質問かもしれませんがNA-friendly statistics、あなたの答えで言及されているとはどういう意味ですか?
Adil Abbasi

6
私は、彼は欠損データ(NA、 "Not Available")を考慮した統計を参照していると思います
user1319128

4
コールドスレッドですが、たとえばnumpyの複雑な操作でパフォーマンスの違いはどうですか?しかし、パンダでは構文的に単純化されていますか?高レベルで簡単な構文パスを実行するためのパフォーマンスコストはありますか?
ピット2018年

59

Numpyは、パンダ(およびPythonの実質的にすべての数値ツール)に必要です。Scipyはパンダには厳密には必要ありませんが、「オプションの依存関係」としてリストされています。パンダがNumpyやScipyの代わりになるとは言いません。むしろ、これはPythonで数値および表形式のデータを操作するためのより合理的な方法を提供する追加のツールです。パンダのデータ構造を使用できますが、それらを操作するためにNumpy関数とScipy関数を自由に利用できます。


4

パンダは、ビニングを簡単にし(Pythonのパンダでデータフレームをビニングする)、統計を計算できるため、テーブルを操作するための優れた方法を提供します。パンダで素晴らしい他のことは、さまざまなプロパティを持つ一連のレイヤーを結合し、それをgroupby関数を使用して組み合わせることができるPanelクラスです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.