タグ付けされた質問 「numpy」

NumPyは、Pythonプログラミング言語の科学および数値計算の拡張機能です。


6
Pythonでnumpyタイプを識別する方法は?
オブジェクトがnumpy型であるかどうかを確実に判断するにはどうすればよいですか? この質問はダックタイピングの哲学に反することを理解していますが、アイデアは、(scipyとnumpyを使用する)関数がnumpyタイプで呼び出されない限り、numpyタイプを返さないことを確認することです。 これは別の質問の解決策に現れますが、オブジェクトが派手なタイプであるかどうかを判断する一般的な問題は、元の質問から十分離れているため、それらを分離する必要があります。


2
Python Pandasで列をビニング
数値のデータフレーム列があります。 df['percentage'].head() 46.5 44.2 100.0 42.12 列をビン数として表示したい: bins = [0, 1, 5, 10, 25, 50, 100] どのようにしてビンの結果を得ることができvalue countsますか? [0, 1] bin amount [1, 5] etc [5, 10] etc ......

2
連続配列と非連続配列の違いは何ですか?
reshape()関数についての派手なマニュアルでは、 >>> a = np.zeros((10, 2)) # A transpose make the array non-contiguous >>> b = a.T # Taking a view makes it possible to modify the shape without modifying the # initial object. >>> c = b.view() >>> c.shape = (20) AttributeError: incompatible shape for a non-contiguous array 私の質問は: …
99 python  arrays  numpy  memory 

3
非フラットインデックスを返すnumpy配列のArgmax
Numpy配列の最大要素のインデックスを取得しようとしています。これは、を使用して実行できますnumpy.argmax。私の問題は、配列全体で最大の要素を見つけて、そのインデックスを取得したいということです。 numpy.argmax 私が望むものではない1つの軸に沿って適用することも、私が望むものの一種であるフラット化された配列に適用することもできます。 私の問題は、多次元インデックスが必要なときにnumpy.argmaxwithを使用するとaxis=Noneフラットインデックスが返されることです。 divmod平坦でないインデックスを取得するために使用できますが、これは醜い感じです。これを行うためのより良い方法はありますか?

5
pythonnumpy配列をゼロで埋める方法
numpyバージョン1.5.0でpython2.6.6を使用して、2Dnumpy配列にゼロを埋め込む方法を知りたいです。ごめんなさい!しかし、これらは私の制限です。したがって、使用できませんnp.pad。たとえばa、形状がに一致するようにゼロを埋めたいとしbます。私がこれをしたい理由は私ができるようにするためです: b-a そのような >>> a array([[ 1., 1., 1., 1., 1.], [ 1., 1., 1., 1., 1.], [ 1., 1., 1., 1., 1.]]) >>> b array([[ 3., 3., 3., 3., 3., 3.], [ 3., 3., 3., 3., 3., 3.], [ 3., 3., 3., 3., 3., 3.], [ 3., 3., 3., …
99 python  arrays  numpy  pad 

6
ディメンション情報を失うことなくNumpyインデックススライス
私はnumpyを使用していて、ディメンション情報を失わずに行にインデックスを付けたいです。 import numpy as np X = np.zeros((100,10)) X.shape # >> (100, 10) xslice = X[10,:] xslice.shape # >> (10,) この例では、xsliceは1次元になっていますが、(1,10)にしたいです。Rでは、X [10、:、drop = F]を使用します。numpyに似たものはありますか?ドキュメントでそれを見つけることができず、同様の質問が表示されませんでした。 ありがとう!
98 python  numpy 


7
Pythonで高速フーリエ変換をプロットする
NumPyとSciPyにアクセスでき、データセットの単純なFFTを作成したいと思います。2つのリストがあります。1つはy値で、もう1つはそれらのy値のタイムスタンプです。 これらのリストをSciPyまたはNumPyメソッドにフィードし、結果のFFTをプロットする最も簡単な方法は何ですか? 例を調べましたが、それらはすべて、特定の数のデータポイント、頻度などを使用して偽のデータのセットを作成することに依存しており、データのセットと対応するタイムスタンプだけでそれを行う方法を実際には示していません。 。 私は次の例を試しました: from scipy.fftpack import fft # Number of samplepoints N = 600 # Sample spacing T = 1.0 / 800.0 x = np.linspace(0.0, N*T, N) y = np.sin(50.0 * 2.0*np.pi*x) + 0.5*np.sin(80.0 * 2.0*np.pi*x) yf = fft(y) xf = np.linspace(0.0, 1.0/(2.0*T), N/2) import matplotlib.pyplot as plt …
98 python  numpy  scipy  fft 


4
DataFrame内の文字列、ただしdtypeはオブジェクト
選択した列のすべての項目が文字列であるにもかかわらず、明示的に変換した後でも、Pandasがオブジェクトを持っていると教えてくれるのはなぜですか。 これは私のデータフレームです: <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values attr3 56992 non-null values attr4 56992 non-null values attr5 56992 non-null values attr6 56992 non-null values dtypes: int64(2), object(5) それらの5つですdtype object。これらのオブジェクトを明示的に文字列に変換します。 for c …
96 python  pandas  numpy  types  series 

1
(フラットバイナリファイルの代わりに)大規模アレイストレージにHDF5を使用することには、分析速度やメモリ使用の利点がありますか?
大きな3Dアレイを処理しています。さまざまなデータ分析を行うために、さまざまな方法でスライスする必要があることがよくあります。典型的な「キューブ」は最大100GBになる可能性があります(将来的にはさらに大きくなる可能性があります) Pythonの大規模なデータセットの一般的な推奨ファイル形式は、HDF5(h5pyまたはpytables)を使用することです。私の質問は、HDF5を使用してこれらのキューブを単純なフラットバイナリファイルに保存するよりも保存および分析することで、速度やメモリ使用のメリットはありますか?HDF5は、操作しているような大きな配列とは対照的に、表形式のデータに適していますか?HDF5は適切な圧縮を提供できることがわかりますが、処理速度とメモリオーバーフローの処理により関心があります。 キューブの1つの大きなサブセットのみを分析したいことがよくあります。pytablesとh5pyの両方の欠点の1つは、配列のスライスを取得すると、常にメモリを使い切ってnumpy配列が返されることです。ただし、フラットバイナリファイルの面倒なmemmapをスライスすると、ディスクにデータを保持するビューを取得できます。したがって、メモリを使い果たすことなく、データの特定のセクターをより簡単に分析できるようです。 私はpytablesとh5pyの両方を調査しましたが、これまでのところ、どちらの目的でも自分の目的に役立つことはありません。
96 python  numpy  hdf5  pytables  h5py 

4
NumPy配列から特定の行と列を選択する
私はここで私が間違っているどんな愚かなことを理解しようとして夢中になっています。 NumPyを使用していますが、特定の行インデックスと特定の列インデックスから選択したいと考えています。これが私の問題の要点です: import numpy as np a = np.arange(20).reshape((5,4)) # array([[ 0, 1, 2, 3], # [ 4, 5, 6, 7], # [ 8, 9, 10, 11], # [12, 13, 14, 15], # [16, 17, 18, 19]]) # If I select certain rows, it works print a[[0, 1, 3], :] …

10
リストからNanを削除するにはどうすればよいですかPython / NumPy
カウント値のリストがあります。取得した値の1つは「nan」です。 countries= [nan, 'USA', 'UK', 'France'] 削除しようとしましたが、毎回エラーが発生します cleanedList = [x for x in countries if (math.isnan(x) == True)] TypeError: a float is required 私がこれを試したとき: cleanedList = cities[np.logical_not(np.isnan(countries))] cleanedList = cities[~np.isnan(countries)] TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported …
96 python  numpy 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.