プログラミング dataframe

15

変数の値からpandas DataFrameを作成すると、「ValueError：すべてのスカラー値を使用する場合は、インデックスを渡す必要があります」

これは簡単な質問かもしれませんが、これを行う方法がわかりません。次のように2つの変数があるとしましょう。 a = 2 b = 3 これからDataFrameを構築したい： df2 = pd.DataFrame({'A':a,'B':b}) これはエラーを生成します： ValueError：すべてのスカラー値を使用する場合は、インデックスを渡す必要があります私もこれを試しました： df2 = (pd.DataFrame({'a':a,'b':b})).reset_index() これにより、同じエラーメッセージが表示されます。

370 python pandas dataframe scalar

6

シリーズの真理値があいまいです。a.empty、a.bool（）、a.item（）、a.any（）またはa.all（）を使用します

or条件付きの結果データフレームのフィルタリングに問題があります。私の結果は、0.25を超え、-0.25未満のdfすべての列のvar値を抽出する必要があります。以下のこのロジックは、あいまいな真理値を与えますが、このフィルタリングを2つの個別の操作に分割すると機能します。ここで何が起きてるの？提案された使用する場所がわからないa.empty(), a.bool(), a.item(),a.any() or a.all()。 result = result[(result['var']>0.25) or (result['var']<-0.25)]

368 python pandas dataframe boolean filtering

12

Pandasデータフレームの2つの列に関数を適用する方法

のdf列を持つがあるとします'ID', 'col_1', 'col_2'。そして私は関数を定義します： f = lambda x, y : my_function_expression。次に、の2つの列を要素ごとに適用しfて、新しい列を計算します。df'col_1', 'col_2''col_3' df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments (1 given)' 実行する方法？ ** 以下のように詳細サンプルを追加します *** import pandas as pd df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]}) mylist = ['a','b','c','d','e','f'] def get_sublist(sta,end): return mylist[sta:end+1] #df['col_3'] …

368 python pandas dataframe

10

データフレームから特定の列を抽出する

6列のRデータフレームがあり、列が3つだけの新しいデータフレームを作成します。私のデータフレームをされたと仮定するとdf、私は列を抽出したいA、Bと、Eこれが唯一の私が把握することができますコマンドです： data.frame(df$A,df$B,df$E) これを行うよりコンパクトな方法はありますか？

365 r dataframe r-faq

15

グループごとに変数を合計する方法

2列のデータフレームがあります。最初の列には「First」、「Second」、「Third」などのカテゴリが含まれ、2番目の列には「Category」から特定のグループを見た回数を表す数値が含まれています。例えば： Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 データをカテゴリ別に並べ替え、すべての頻度を合計したい： Category Frequency First 30 Second 5 Third 34 Rでこれをどのように実行しますか？

357 r dataframe aggregate r-faq

17

data.frame列を因子から文字に変換する

データフレームがあります。彼を呼んでみましょうbob： > head(bob) phenotype exclusion GSM399350 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399351 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399352 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399353 3- 4- 8- 25+ 44+ 11b- 11c- 19- …

352 r dataframe

11

データフレームのセルから値を取得するにはどうすればよいですか？

データフレームから1行だけを抽出する条件を作成しました。 d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] ここで、特定の列から値を取得したいと思います。 val = d2['col_name'] しかし、結果として、1つの行と1つの列（つまり 1つのセル）を含むデータフレームが得られます。それは私が必要とするものではありません。1つの値（1つの浮動小数点数）が必要です。パンダでどうすればいいですか？

344 python pandas dataframe

9

データフレームのリストを1つのデータフレームに変換する

ある場所で、実際に単一のビッグデータフレームに変換したいデータフレームのリストが作成されるコードがあります。似たような、しかしもっと複雑なことをしようとしていた以前の質問から、いくつかの指針を得ました。これは私が始めているものの例です（これは説明のために大幅に簡略化されています）： listOfDataFrames <- vector(mode = "list", length = 100) for (i in 1:100) { listOfDataFrames[[i]] <- data.frame(a=sample(letters, 500, rep=T), b=rnorm(500), c=rnorm(500)) } 私は現在これを使用しています： df <- do.call("rbind", listOfDataFrames)

336 list r dataframe

11

データフレーム内のランダムな行のサンプル

R言語のデータフレームから置換せずにランダムに取得した指定した数の行を返す適切な関数を見つけるのに苦労していますか？誰かが私を助けてくれますか？

333 r dataframe sample r-faq

14

パンダ：演算子チェーンを使用してDataFrameの行をフィルター処理する

でほとんどの操作pandasオペレータチェーン（で達成することができgroupby、aggregate、apply、など）が、私は、フィルタ行に見つけた唯一の方法は、通常のブラケットのインデックス経由で df_filtered = df[df['column'] == value] df値にフィルターをかける前に変数に割り当てる必要があるため、これは魅力的ではありません。次のようなものはありますか？ df_filtered = df.mask(lambda x: x['column'] == value)

329 python pandas dataframe

17

パンダ-列の階層インデックスをフラット化する方法

（groupby.agg操作からの）軸1（列）に階層インデックスを持つデータフレームがあります。 USAF WBAN year month day s_PC s_CL s_CD s_CNT tempf sum sum sum sum amax amin 0 702730 26451 1993 1 1 1 0 12 13 30.92 24.98 1 702730 26451 1993 1 2 0 0 13 13 32.00 24.98 2 702730 26451 1993 1 3 1 10 2 …

325 python pandas dataframe

23

パンダを使用して1つのデータフレームからテストとトレーニングサンプルを作成するにはどうすればよいですか？

データフレームの形式のかなり大きなデータセットがあり、トレーニングとテストのためにデータフレームを2つのランダムサンプル（80％と20％）に分割する方法を考えていました。ありがとう！

323 python python-2.7 pandas dataframe

7

パンダのread_csv low_memoryおよびdtypeオプション

電話するとき df = pd.read_csv('somefile.csv') 私は得る： /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130：DtypeWarning：列（4、5、7、16）には型が混在しています。インポート時にdtypeオプションを指定するか、low_memory = Falseを設定します。 dtypeオプションがに関連しているのはなぜですかlow_memory、なぜFalseこの問題を解決するのですか？

320 python parsing numpy pandas dataframe

11

パンダを使用してデータフレームを保存する方法

現在CSV、スクリプトを実行するたびにかなり大きなデータフレームをインポートしています。スクリプトが実行されるのを待つためにすべての時間を費やす必要がないように、実行間でそのデータフレームを常に利用できるようにするための良い解決策はありますか？

317 python pandas dataframe

8

シリーズ/データフレーム列のパンダ条件付き作成

以下の行に沿ってデータフレームがあります： Type Set 1 A Z 2 B Z 3 B X 4 C Y データフレームと同じ長さの別の列をデータフレームに追加（またはシリーズを生成）したい（=レコード/行の等しい数）。。これを行う最良の方法は何ですか？

314 python pandas numpy dataframe

タグ付けされた質問 「dataframe」

タグ付けされた質問「dataframe」