タグ付けされた質問 「dataframe」

データフレームは表形式のデータ構造です。通常、これには行が観測で列がさまざまなタイプの変数であるデータが含まれます。「データフレーム」または「データフレーム」は、いくつかの言語(R、Apache Spark、deedle、Maple、Pythonのpandasライブラリ、およびJuliaのDataFramesライブラリ)でこの概念に使用される用語ですが、「テーブル」は、 MATLABおよびSQL。

10
列の値に基づいてDataFrameから行を選択する方法は?
DataFramePythonパンダのいくつかの列の値に基づいてから行を選択するにはどうすればよいですか? SQLでは、次のように使用します。 SELECT * FROM table WHERE colume_name = some_value 私はパンダのドキュメントを見てみましたが、すぐには答えが見つかりませんでした。
1960 python  pandas  dataframe 

22
パンダのデータフレームの行を反復する方法は?
私はDataFrameパンダから来ました: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df 出力: c1 c2 0 10 100 1 11 110 2 12 120 次に、このフレームの行を反復処理します。すべての行について、列の名前でその要素(セルの値)にアクセスできるようにしたいと思います。例えば: for row in df.rows: print row['c1'], row['c2'] パンダでそれを行うことは可能ですか? 私はこの同様の質問を見つけました。しかし、それは私に必要な答えを与えません。たとえば、そこで使用することをお勧めします。 for date, row in df.T.iteritems(): または for row in df.iterrows(): しかし、私はrowオブジェクトが何であるか、そしてどうやってそれを扱うことができるのか分かりません。
1951 python  pandas  rows  dataframe 

26
パンダの列の名前を変更する
元の列ラベルを置き換えるために編集する必要があるパンダと列ラベルを使用するDataFrameがあります。 A元の列名が次のようなDataFrameの列名を変更したいと思います。 ['$a', '$b', '$c', '$d', '$e'] に ['a', 'b', 'c', 'd', 'e']. 編集した列名をリストに保存していますが、列名を置き換える方法がわかりません。

15
Pandas DataFrameから列を削除する
DataFrameの列を削除するとき、私は次のように使用します。 del df['column_name'] そして、これはうまくいきます。以下を使用できないのはなぜですか? del df.column_name 列/シリーズにとしてアクセスできるため、これが機能することdf.column_nameを期待していました。
1331 python  pandas  dataframe 

19
複数の列でデータフレームを並べ替える方法
data.frameを複数の列で並べ替えたい。たとえば、以下のdata.frameでは、列z(降順)で並べ替え、次に列b(昇順)で並べ替えます。 dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x = c("A", "D", "A", "C"), y = c(8, 3, 9, 9), z = c(1, 1, 1, 2)) dd b x y z 1 Hi A 8 1 2 Med D 3 1 …
1316 r  sorting  dataframe  r-faq 



19
パンダのDataFrame列ヘッダーからリストを取得する
パンダのDataFrameから列ヘッダーのリストを取得したいのですが。DataFrameはユーザー入力から取得されるため、列がいくつあるか、または何が呼び出されるかはわかりません。 たとえば、次のようなDataFrameが与えられたとします。 >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 6 7 7 5 4 8 3 6 8 2 8 7 9 9 10 8 6 6 4 9 10 10 7 私はこのようなリストを取得したいと思います: >>> header_list …
1015 python  pandas  dataframe 

23
Python pandasの既存のDataFrameに新しい列を追加する
名前付きの列と行ではなく、連続した番号を持つ次のインデックス付きDataFrameがあります。 a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 'e'既存のデータフレームに新しい列を追加し、データフレーム内の何も変更したくない(つまり、新しい列は常にDataFrameと同じ長さです)。 0 -0.335485 1 -1.166658 2 -0.385571 dtype: float64 e上記の例に列を追加するにはどうすればよいですか?

14
パンダのDataFrameの行数を取得するにはどうすればよいですか?
Pandasを使用してデータフレームdfの行数を取得しようとしています。これが私のコードです。 方法1: total_rows = df.count print total_rows +1 方法2: total_rows = df['First_columnn_label'].count print total_rows +1 どちらのコードスニペットでもこのエラーが発生します。 TypeError:+: 'instancemethod'および 'int'でサポートされていないオペランドタイプ 何が悪いのですか?
935 python  pandas  dataframe 

30
DataFrame列の順序を変更するにはどうすればよいですか?
次のものがありますDataFrame(df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) 割り当てによって列をさらに追加します。 df['mean'] = df.mean(1) どうすれば列meanを前に移動できますか。つまり、他の列の順序を変更せずに最初の列として設定するにはどうすればよいですか?
879 python  pandas  dataframe 

20
データフレームの列を名前で削除する
データフレームから削除したい列がいくつかあります。私はそれらを個別に削除できることを知っています: df$x <- NULL しかし、私はより少ないコマンドでこれを行うことを望んでいました。 また、次のような整数インデックスを使用して列を削除できることも知っています。 df <- df[ -c(1, 3:6, 12) ] しかし、私は変数の相対的な位置が変化するのではないかと心配しています。 Rがどれほど強力であるかを考えると、各列を1つずつ削除するよりも良い方法があると考えました。
874 r  dataframe  r-faq 

25
pandas DataFrameに1行追加する
私はパンダが完全に読み込まれたように設計されていることを理解していますが、空のDataFrameDataFrameを作成してから、行を1つずつ追加する必要があります。これを行う最良の方法は何ですか? 私は空のデータフレームを正常に作成しました: res = DataFrame(columns=('lib', 'qty1', 'qty2')) 次に、新しい行を追加して、フィールドに次のように入力します。 res = res.set_value(len(res), 'qty1', 10.0) 動作しますが非常に奇妙に見えます:-/(文字列値の追加に失敗します) DataFrameに新しい列を追加するにはどうすればよいですか(列の種類が異なります)。

16
data.frame内のすべてまたは一部のNA(欠損値)を持つ行を削除します
このデータフレームの次のような行を削除します。 a)すべての列にわたってsを含みNAます。以下は私のデータフレームの例です。 gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 NA NA 1 2 5 ENSG00000207431 0 NA NA NA NA 6 ENSG00000221312 0 1 2 3 2 …

9
パンダの列のデータ型を変更する
リストのリストとして表されたテーブルをに変換したいPandas DataFrame。非常に単純化した例として: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) 列を適切なタイプ、この場合は列2と3を浮動小数点数に変換する最良の方法は何ですか?DataFrameへの変換中にタイプを指定する方法はありますか?または、最初にDataFrameを作成し、次に列をループして各列のタイプを変更する方が良いでしょうか?理想的には、何百もの列が存在する可能性があり、どの列がどのタイプであるかを正確に指定したくないので、動的な方法でこれを実行したいと思います。私が保証できるのは、各列に同じタイプの値が含まれていることだけです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.