タグ付けされた質問 「numpy」

NumPyは、Pythonプログラミング言語の科学および数値計算の拡張機能です。

12
datetime、Timestamp、datetime64間の変換
numpy.datetime64オブジェクトをdatetime.datetime(またはTimestamp)に変換するにはどうすればよいですか? 次のコードでは、datetime、timestamp、およびdatetime64オブジェクトを作成しています。 import datetime import numpy as np import pandas as pd dt = datetime.datetime(2012, 5, 1) # A strange way to extract a Timestamp object, there's surely a better way? ts = pd.DatetimeIndex([dt])[0] dt64 = np.datetime64(dt) In [7]: dt Out[7]: datetime.datetime(2012, 5, 1, 0, 0) In [8]: ts Out[8]: …
290 python  datetime  numpy  pandas 


10
numpy.random.seed(0)は何をしますか?
np.random.seedScikit-Learnチュートリアルの以下のコードで何をしますか?私はNumPyのランダムステートジェネレーターについてはあまり詳しくないので、素人の専門家による用語説明を本当に感謝します。 np.random.seed(0) indices = np.random.permutation(len(iris_X))
282 python  numpy 

6
Numpy配列からのPandas DataFrameの作成:インデックス列と列ヘッダーを指定するにはどうすればよいですか?
以下に示すように、行ラベルと列名を持つ2次元配列を表すリストのリストで構成されるNumpy配列があります。 data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) 結果のDataFrameにRow1とRow2をインデックス値として、Col1とCol2をヘッダー値として設定します インデックスは次のように指定できます。 df = pd.DataFrame(data,index=data[:,0]), ただし、列ヘッダーを最適に割り当てる方法がわかりません。
281 python  pandas  numpy 

7
派手な配列を逆にする最も効率的な方法
信じられないかもしれませんが、私の現在のコードをプロファイリングした後、numpy配列のリバートの繰り返し操作は、実行時間の巨大なチャンクを食べました。私が今持っているのは、一般的なビューベースの方法です: reversed_arr = arr[::-1] それをより効率的に行う他の方法はありますか、それとも非現実的な派手なパフォーマンスへの執着からの幻想ですか?
276 python  numpy 

21
パンダの軸はどういう意味ですか?
データフレームを生成するためのコードは次のとおりです。 import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) それから私はデータフレームを手に入れました: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ コマンドを入力すると: dff.mean(axis=1) 私は得た: 0 1.074821 dtype: float64 パンダのリファレンスによると、axis = 1は列を表し、コマンドの結果は A 0.626386 B 1.523255 dtype: float64 だからここに私の質問です:パンダの軸は何を意味していますか?

6
2つの1次元NumPy配列を連結する
NumPyに 2つの単純な1次元配列があります。numpy.concatenateを使用してそれらを連結できるはずです。しかし、以下のコードでこのエラーが発生します: TypeError:長さ1の配列のみをPythonスカラーに変換できます コード import numpy a = numpy.array([1, 2, 3]) b = numpy.array([5, 6]) numpy.concatenate(a, b) どうして?

10
パンダでデータフレームの列スライスを取得する方法
CSVファイルから機械学習データを読み込みます。最初の2列は観測値で、残りの列は特徴です。 現在、私は次のことをしています。 data = pandas.read_csv('mydata.csv') これは次のようなものになります: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 私は2つのデータフレームでは、このデータフレームをスライスしたいと思います:1列を含むaとb、もう1つは列を含むc、dとe。 次のようなものを書くことはできません observations = data[:'c'] features = data['c':] 私は最善の方法が何であるかわかりません。私は必要pd.Panelですか? ちなみに、データフレームのインデックス付けはかなり一貫性data['a']がdata[0]ありません。許可されていますが許可されていません。一方で、data['a':]許可されていませんが許可されていdata[0:]ます。これには実際的な理由はありますか?列がIntによってインデックス付けされている場合、これは本当に混乱します。data[0] != data[0:1]

19
Numpy配列を画像として保存する
Numpy配列のタイプの行列があります。イメージとしてディスクに書き込むにはどうすればよいですか?どの形式でも機能します(png、jpeg、bmp ...)。重要な制約の1つは、PILが存在しないことです。
261 python  image  numpy 

8
PILイメージを派手な配列に変換する方法は?
わかりました、PIL画像オブジェクトをnumpy配列に前後に変換するので、PILのPixelAccessオブジェクトが許可するよりも速いピクセル単位のピクセル変換を行うことができます。次の方法で、ピクセル情報を便利な3D numpy配列に配置する方法を理解しました。 pic = Image.open("foo.jpg") pix = numpy.array(pic.getdata()).reshape(pic.size[0], pic.size[1], 3) しかし、すごい変換をすべて実行した後、それをPILオブジェクトに読み込む方法を理解できないようです。私はそのputdata()方法を知っていますが、動作するようには思えません。

8
SciPyとNumPyの関係
SciPyは、NumPyの機能のほとんど(すべてではない)を独自の名前空間で提供しているようです。つまり、という関数がある場合numpy.foo、ほぼ確実にがありscipy.fooます。ほとんどの場合、2つはまったく同じに見え、多くの場合、同じ関数オブジェクトを指しています。 時々、彼らは異なっています。最近登場した例を挙げましょう。 numpy.log10あるufunc負の引数の返しNaNをそれは。 scipy.log10 負の引数に対して複雑な値を返し、ufuncではないようです。 同じことはについて語ったことができlog、log2かつlogn、しかしないことについてlog1p[2]。 一方、numpy.expおよびscipy.exp同じufuncのための別の名前であるように思われます。これはまた真実であるscipy.log1pとnumpy.log1p。 別の例はnumpy.linalg.solvevs scipy.linalg.solveです。それらは似ていますが、後者は前者にいくつかの追加機能を提供します。 なぜ明白な重複ですか?これが名前空間numpyへの大規模なインポートであることを意図している場合scipy、なぜ動作の微妙な違いと不足している関数があるのでしょうか?混乱を解消するのに役立つ包括的なロジックはありますか? [1] 、、numpy.min およびいくつかの他にはには対応していない名前空間を。numpy.maxnumpy.absscipy [2] NumPy 1.5.1およびSciPy 0.9.0rc2を使用してテスト。
254 python  numpy  scipy 

6
2つのNumPy配列を要素ごとに比較して比較する
2つのNumPy配列の等価性を比較する最も簡単な方法は何ですか(等価性は次のように定義されています:A =すべてのインデックスのB iff i:)A[i] == B[i]? 単純に使用==するとブール配列が得られます: >>> numpy.array([1,1,1]) == numpy.array([1,1,1]) array([ True, True, True], dtype=bool) 私がしなければならないのand配列が同じである、または比較する簡単な方法があるかどうかを決定するために、この配列の要素?


22
PythonでSoftmax関数を実装する方法
Udacityの深い学習クラス、Y_Iのソフトマックスは、単に全体のYベクトルの指数の合計で割った指数です。 どこS(y_i)のソフトマックス関数であるy_iとe指数関数的であるとjnoです。入力ベクトルYの列の数。 私は以下を試しました: import numpy as np def softmax(x): """Compute softmax values for each sets of scores in x.""" e_x = np.exp(x - np.max(x)) return e_x / e_x.sum() scores = [3.0, 1.0, 0.2] print(softmax(scores)) これは次を返します: [ 0.8360188 0.11314284 0.05083836] しかし、提案された解決策は: def softmax(x): """Compute softmax values for each sets of scores …

15
numpy:配列内の一意の値の最も効率的な頻度カウント
に numpy / scipyがあり、効率的な配列にユニークな値のための頻度カウントを取得する方法は? これらの線に沿った何か: x = array( [1,1,1,2,2,2,5,25,1,1] ) y = freq_count( x ) print y >> [[1, 5], [2,3], [5,1], [25,1]] (あなたのために、そこにいるRユーザーのために、私は基本的にtable()関数を探しています)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.