プログラミング dataframe

11

Python Pandasを使用して、最大値のCountry＆を見つけようとしていPlaceます。これは最大値を返します： data.groupby(['Country','Place'])['Value'].max() しかし、どのように私は、対応するのですかCountryとPlace名前？

117 python pandas dataframe max

6

データフレームの行をベクトルに変換する

データフレームの行からベクトルを作成します。しかし、行と列の名前を付ける必要はありません。私はいくつかのことを試みました...しかし運がありませんでした。これは私のデータフレームです： > df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3)) > df a b c 1 1 2 2.6 2 2 6 8.2 3 4 2 7.5 4 2 1 3.0 私は試した： > newV <- as.vector(df[1,]) > newV a b c 1 1 2 2.6 しかし、私は本当にこのようなものを望んでいます： > newV <- c( 1,2,2.6) > newV [1] …

116 r vector dataframe

14

Apache Spark DataFrameで列を連結する

Apache Spark DataFrameで2つの列を連結するにはどうすればよいですか？Spark SQLに使用できる関数はありますか？

116 sql apache-spark dataframe apache-spark-sql

14

Pandas DataFrameで列をネスト解除（分解）する方法は？

列の1つがオブジェクト（リスト型セル）である次のDataFrameがあります。 df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] 私の予想される出力は： A B 0 1 1 1 1 2 3 2 1 4 2 2 これを達成するにはどうすればよいですか？関連する質問パンダ：セルの内容がリストの場合、リストの各要素の行を作成します質問と回答だけ（私の答えでは自己DEF機能は、複数の列のために働くリストで1列を扱う良い、また、受け入れ答えは、最も時間のかかる使用しているapply詳細情報を確認し、推奨されていない、私が今までにしたいはずですとき私のコードでパンダapply（）を使用するには？）

116 python pandas dataframe

7

data.frameに列を追加する

以下のdata.frameがあります。h_no最初の一連のh_no 1,2,3,4がクラス1、2番目の一連のh_no（1〜7）がクラス2になるように、列1（）に従ってデータを分類する列を追加します。最後の列に示されているような。 h_no h_freq h_freqsq 1 0.09091 0.008264628 1 2 0.00000 0.000000000 1 3 0.04545 0.002065702 1 4 0.00000 0.000000000 1 1 0.13636 0.018594050 2 2 0.00000 0.000000000 2 3 0.00000 0.000000000 2 4 0.04545 0.002065702 2 5 0.31818 0.101238512 2 6 0.00000 0.000000000 2 7 0.50000 0.250000000 2 1 …

115 r dataframe

14

パンダのデータフレームにすべての列名を表示するにはどうすればよいですか？

何百もの列で構成されるデータフレームがあり、すべての列名を確認する必要があります。私がしたこと： In[37]: data_all2.columns 出力は次のとおりです。 Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) 切り捨てられたリストではなく、すべての列を表示するにはどうすればよいですか？

114 python pandas dataframe show

9

pandasデータフレームをプリティプリントする

次のように、パンダのデータフレームをテキストベースのテーブルとして印刷するにはどうすればよいですか？ +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 | ABCD | +------------+---------+-------------+

113 python pandas dataframe printing

6

Pandas DataFrameからヒートマップを作成する

PythonのPandasパッケージから生成されたデータフレームがあります。pandasパッケージのDataFrameを使用してヒートマップを生成するにはどうすればよいですか。 import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols) >>> df A B C D aaa 2.431645 1.248688 0.267648 0.613826 bbb 0.809296 1.671020 1.564420 0.347662 ccc 1.501939 1.126518 0.702019 1.596048 ddd 0.137160 0.147368 1.504663 0.202822 eee …

112 python pandas dataframe heatmap

11

パンダデータフレームに行を挿入する

私はデータフレームを持っています： s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] 取得するには、最初の行[2、3、4]を追加する必要があります。 A B C 0 2 3 4 1 5 6 7 2 7 …

111 python pandas dataframe insert

4

Pandas DataFrameの行を列ヘッダーに変換し、

私が操作しなければならないデータは少し厄介です。データの中にヘッダー名があります。既存のパンダデータフレームから行を選択して列ヘッダーにする（名前を変更する）にはどうすればよいですか？私は次のようなことをしたいです： header = df[df['old_header_name1'] == 'new_header_name1'] df.columns = header

111 python pandas rename dataframe

4

UNIX時間をパンダデータフレームで読み取り可能な日付に変換する

UNIX時間と価格が含まれたデータフレームがあります。人間が読める日付で表示されるようにインデックス列を変換したいと思います。したがって、たとえば、インデックス列にはdateas 1349633705がありますが、それを10/07/2012（または少なくとも10/07/2012 18:15）として表示したいとします。いくつかのコンテキストでは、これが私が作業しているコードと私がすでに試したことです： import json import urllib2 from datetime import datetime response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json') data = json.load(response) df = DataFrame(data['values']) df.columns = ["date","price"] #convert dates df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d")) df.index = df.date ご覧のとおり、df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))ここでは文字列ではなく整数を使用しているため、機能しません。私は使用する必要があると思いますdatetime.date.fromtimestampが、これを全体に適用する方法がよくわかりませんdf.date。ありがとう。

110 python pandas unix-timestamp dataframe

5

Rのdata.frameの最初の4行を選択します

の最初の4行を選択するにはどうすればよいですかdata.frame。 Weight Response 1 Control 59 0.0 2 Treatment 90 0.8 3 Treatment 47 0.1 4 Treamment 106 0.1 5 Control 85 0.7 6 Treatment 73 0.6 7 Control 61 0.2

109 r dataframe

5

別の列パンダデータフレームに基づいて列値を抽出する

ある変数の値を別の変数で条件付けして抽出することに行き詰まっています。たとえば、次のデータフレーム： A B p1 1 p1 2 p3 3 p2 4 Aいつ値を取得できB=3ますか？の値を抽出するたびにA、文字列ではなくオブジェクトを取得しました。

109 python pandas dataframe

8

行ごとにRデータフレームを作成する

Rで行ごとにデータフレームを構築したいと思います。いくつかの検索を実行しました。私が思いついたのは、空のリストを作成し、リストのインデックススカラーを保持し、毎回リストに追加するという提案です。単一行のデータフレームで、リストのインデックスを1つ進めます。最後do.call(rbind,)に、リストにあります。これは機能しますが、非常に扱いにくいようです。同じ目標を達成する簡単な方法はありませんか？明らかに、一部のapply関数を使用できず、データフレームを行ごとに明示的に作成する必要がある場合を参照しています。少なくとも、push最後に使用されたインデックスを明示的に追跡する代わりに、リストの最後に移動する方法はありますか？

107 list r dataframe

4

データフレームを転置する

大きなデータフレームを転置する必要があるため、以下を使用しました。 df.aree <- t(df.aree) df.aree <- as.data.frame(df.aree) これは私が得るものです： df.aree[c(1:5),c(1:5)] 10428 10760 12148 11865 name M231T3 M961T5 M960T6 M231T19 GS04.A 5.847557e+03 0.000000e+00 3.165891e+04 2.119232e+04 GS16.A 5.248690e+04 4.047780e+03 3.763850e+04 1.187454e+04 GS20.A 5.370910e+03 9.518396e+03 3.552036e+04 1.497956e+04 GS40.A 3.640794e+03 1.084391e+04 4.651735e+04 4.120606e+04 私の問題は、最初の行を列名として使用する必要があるため、削除する必要がある新しい列名（10428、10760、12148、11865）です。 col.names()関数で試しましたが、必要なものが手に入りません。何か提案はありますか？編集するあなたの提案をありがとう!!! それを使用して私は得ます： df.aree[c(1:5),c(1:5)] M231T3 M961T5 M960T6 M231T19 GS04.A …

107 r dataframe

タグ付けされた質問 「dataframe」

タグ付けされた質問「dataframe」