タグ付けされた質問 「dataframe」

データフレームは表形式のデータ構造です。通常、これには行が観測で列がさまざまなタイプの変数であるデータが含まれます。「データフレーム」または「データフレーム」は、いくつかの言語(R、Apache Spark、deedle、Maple、Pythonのpandasライブラリ、およびJuliaのDataFramesライブラリ)でこの概念に使用される用語ですが、「テーブル」は、 MATLABおよびSQL。


6
データフレームの行をベクトルに変換する
データフレームの行からベクトルを作成します。しかし、行と列の名前を付ける必要はありません。私はいくつかのことを試みました...しかし運がありませんでした。 これは私のデータフレームです: > df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3)) > df a b c 1 1 2 2.6 2 2 6 8.2 3 4 2 7.5 4 2 1 3.0 私は試した: > newV <- as.vector(df[1,]) > newV a b c 1 1 2 2.6 しかし、私は本当にこのようなものを望んでいます: > newV <- c( 1,2,2.6) > newV [1] …
116 r  vector  dataframe 


14
Pandas DataFrameで列をネスト解除(分解)する方法は?
列の1つがオブジェクト(リスト型セル)である次のDataFrameがあります。 df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] 私の予想される出力は: A B 0 1 1 1 1 2 3 2 1 4 2 2 これを達成するにはどうすればよいですか? 関連する質問 パンダ:セルの内容がリストの場合、リストの各要素の行を作成します 質問と回答だけ(私の答えでは自己DEF機能は、複数の列のために働くリストで1列を扱う良い、また、受け入れ答えは、最も時間のかかる使用しているapply詳細情報を確認し、推奨されていない、私が今までにしたいはずですとき私のコードでパンダapply()を使用するには?)
116 python  pandas  dataframe 

7
data.frameに列を追加する
以下のdata.frameがあります。h_no最初の一連のh_no 1,2,3,4がクラス1、2番目の一連のh_no(1〜7)がクラス2になるように、列1()に従ってデータを分類する列を追加します。最後の列に示されているような。 h_no h_freq h_freqsq 1 0.09091 0.008264628 1 2 0.00000 0.000000000 1 3 0.04545 0.002065702 1 4 0.00000 0.000000000 1 1 0.13636 0.018594050 2 2 0.00000 0.000000000 2 3 0.00000 0.000000000 2 4 0.04545 0.002065702 2 5 0.31818 0.101238512 2 6 0.00000 0.000000000 2 7 0.50000 0.250000000 2 1 …
115 r  dataframe 

14
パンダのデータフレームにすべての列名を表示するにはどうすればよいですか?
何百もの列で構成されるデータフレームがあり、すべての列名を確認する必要があります。 私がしたこと: In[37]: data_all2.columns 出力は次のとおりです。 Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) 切り捨てられたリストではなく、すべての列を表示するにはどうすればよいですか?
114 python  pandas  dataframe  show 

9
pandasデータフレームをプリティプリントする
次のように、パンダのデータフレームをテキストベースのテーブルとして印刷するにはどうすればよいですか? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 | ABCD | +------------+---------+-------------+

6
Pandas DataFrameからヒートマップを作成する
PythonのPandasパッケージから生成されたデータフレームがあります。pandasパッケージのDataFrameを使用してヒートマップを生成するにはどうすればよいですか。 import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols) >>> df A B C D aaa 2.431645 1.248688 0.267648 0.613826 bbb 0.809296 1.671020 1.564420 0.347662 ccc 1.501939 1.126518 0.702019 1.596048 ddd 0.137160 0.147368 1.504663 0.202822 eee …

11
パンダデータフレームに行を挿入する
私はデータフレームを持っています: s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] 取得するには、最初の行[2、3、4]を追加する必要があります。 A B C 0 2 3 4 1 5 6 7 2 7 …

4
Pandas DataFrameの行を列ヘッダーに変換し、
私が操作しなければならないデータは少し厄介です。データの中にヘッダー名があります。既存のパンダデータフレームから行を選択して列ヘッダーにする(名前を変更する)にはどうすればよいですか? 私は次のようなことをしたいです: header = df[df['old_header_name1'] == 'new_header_name1'] df.columns = header

4
UNIX時間をパンダデータフレームで読み取り可能な日付に変換する
UNIX時間と価格が含まれたデータフレームがあります。人間が読める日付で表示されるようにインデックス列を変換したいと思います。 したがって、たとえば、インデックス列にはdateas 1349633705がありますが、それを10/07/2012(または少なくとも10/07/2012 18:15)として表示したいとします。 いくつかのコンテキストでは、これが私が作業しているコードと私がすでに試したことです: import json import urllib2 from datetime import datetime response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json') data = json.load(response) df = DataFrame(data['values']) df.columns = ["date","price"] #convert dates df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d")) df.index = df.date ご覧のとおり、df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))ここでは文字列ではなく整数を使用 しているため、機能しません。私は使用する必要があると思いますdatetime.date.fromtimestampが、これを全体に適用する方法がよくわかりませんdf.date。 ありがとう。

5
Rのdata.frameの最初の4行を選択します
の最初の4行を選択するにはどうすればよいですかdata.frame。 Weight Response 1 Control 59 0.0 2 Treatment 90 0.8 3 Treatment 47 0.1 4 Treamment 106 0.1 5 Control 85 0.7 6 Treatment 73 0.6 7 Control 61 0.2
109 r  dataframe 


8
行ごとにRデータフレームを作成する
Rで行ごとにデータフレームを構築したいと思います。いくつかの検索を実行しました。私が思いついたのは、空のリストを作成し、リストのインデックススカラーを保持し、毎回リストに追加するという提案です。単一行のデータフレームで、リストのインデックスを1つ進めます。最後do.call(rbind,)に、リストにあります。 これは機能しますが、非常に扱いにくいようです。同じ目標を達成する簡単な方法はありませんか? 明らかに、一部のapply関数を使用できず、データフレームを行ごとに明示的に作成する必要がある場合を参照しています。少なくとも、push最後に使用されたインデックスを明示的に追跡する代わりに、リストの最後に移動する方法はありますか?
107 list  r  dataframe 

4
データフレームを転置する
大きなデータフレームを転置する必要があるため、以下を使用しました。 df.aree <- t(df.aree) df.aree <- as.data.frame(df.aree) これは私が得るものです: df.aree[c(1:5),c(1:5)] 10428 10760 12148 11865 name M231T3 M961T5 M960T6 M231T19 GS04.A 5.847557e+03 0.000000e+00 3.165891e+04 2.119232e+04 GS16.A 5.248690e+04 4.047780e+03 3.763850e+04 1.187454e+04 GS20.A 5.370910e+03 9.518396e+03 3.552036e+04 1.497956e+04 GS40.A 3.640794e+03 1.084391e+04 4.651735e+04 4.120606e+04 私の問題は、最初の行を列名として使用する必要があるため、削除する必要がある新しい列名(10428、10760、12148、11865)です。 col.names()関数で試しましたが、必要なものが手に入りません。 何か提案はありますか? 編集する あなたの提案をありがとう!!! それを使用して私は得ます: df.aree[c(1:5),c(1:5)] M231T3 M961T5 M960T6 M231T19 GS04.A …
107 r  dataframe 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.