プログラミング dataframe

11

この入力をどのように変更しますか（シーケンス：時間、入力、出力、ファイル）： Time In Out Files 1 2 3 4 2 3 4 5 この出力（シーケンス：時間、出力、入力、ファイル）に？ Time Out In Files 1 3 2 4 2 4 3 5 これがダミーのRデータです。 table <- data.frame(Time=c(1,2), In=c(2,3), Out=c(3,4), Files=c(4,5)) table ## Time In Out Files ##1 1 2 3 4 ##2 2 3 4 5

311 r sorting dataframe r-faq

11

データフレームに列を名前でドロップする方法

大きなデータセットを持っているので、特定の列を読み取るか、他のすべての列を削除したいと考えています。 data <- read.dta("file.dta") 興味のない列を選択します。 var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", "m_serv")] そして私がしたいことよりも： for(i in 1:length(var.out)) { paste("data$", var.out[i], sep="") <- NULL } 不要な列をすべて削除します。これは最適なソリューションですか？

304 r dataframe subset

15

Python dictをデータフレームに変換する

次のようなPython辞書があります。 {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06-29': 391, u'2012-06-30': 391, u'2012-07-01': 391, u'2012-07-02': …

299 python pandas dataframe

5

pandas DataFrameが空かどうかを確認するにはどうすればよいですか？

パンダDataFrameが空かどうかを確認するにはどうすればよいですか？私の場合、ターミナルDataFrameが空の場合にターミナルにメッセージを出力したいと思います。

296 python pandas dataframe

11

ベクトルの最後の値にアクセスする方法は？

1つまたは2つのレベルのデータフレームにネストされているベクトルがあるとします。length()関数を使用せずに最後の値にアクセスするための迅速でダーティーな方法はありますか？PERLの$#特別な変数の何か？だから私は次のようなものが欲しいです： dat$vec1$vec2[$#] の代わりに dat$vec1$vec2[length(dat$vec1$vec2)]

289 r dataframe vector

4

DataFrame列タイプを文字列から日時、dd / mm / yyyy形式に変換します

文字列のDataFrame列（dd / mm / yyyy形式）を日時に変換するにはどうすればよいですか？

283 python pandas dataframe datetime-format python-datetime

8

パンダで2つのシリーズをDataFrameに結合する

2つのシリーズがs1ありs2、同じ（非連続）インデックスがあります。どのように私は組み合わせないs1とs2データフレーム内の2つの列であることにし、3列目と指標の一つを保ちますか？

277 python pandas series dataframe

3

Pandasに列が存在するかどうかを確認する方法

Pandas DataFrameに列が存在するかどうかを確認する方法はありますか？次のDataFrameがあるとします。 >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) >>> df A B C 0 3 40 100 1 6 30 200 …

274 python pandas dataframe

21

パンダの軸はどういう意味ですか？

データフレームを生成するためのコードは次のとおりです。 import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) それから私はデータフレームを手に入れました： +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ コマンドを入力すると： dff.mean(axis=1) 私は得た： 0 1.074821 dtype: float64 パンダのリファレンスによると、axis = 1は列を表し、コマンドの結果は A 0.626386 B 1.523255 dtype: float64 だからここに私の質問です：パンダの軸は何を意味していますか？

269 python pandas numpy dataframe

6

Rのdata.frameから列全体を削除する

Rのdata.frameから列全体を削除する方法を知っている人はいますか？たとえば、このdata.frameが与えられた場合： > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon 2列目を削除します。

267 r dataframe

10

パンダでデータフレームの列スライスを取得する方法

CSVファイルから機械学習データを読み込みます。最初の2列は観測値で、残りの列は特徴です。現在、私は次のことをしています。 data = pandas.read_csv('mydata.csv') これは次のようなものになります： data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 私は2つのデータフレームでは、このデータフレームをスライスしたいと思います：1列を含むaとb、もう1つは列を含むc、dとe。次のようなものを書くことはできません observations = data[:'c'] features = data['c':] 私は最善の方法が何であるかわかりません。私は必要pd.Panelですか？ちなみに、データフレームのインデックス付けはかなり一貫性data['a']がdata[0]ありません。許可されていますが許可されていません。一方で、data['a':]許可されていませんが許可されていdata[0:]ます。これには実際的な理由はありますか？列がIntによってインデックス付けされている場合、これは本当に混乱します。data[0] != data[0:1]

264 python pandas numpy dataframe slice

18

データフレーム列を数値型に変換する方法

データフレーム列を数値型に変換するにはどうすればよいですか？

261 r dataframe type-conversion

9

リスト内の複数のdata.framesを同時にマージする

マージしたい多くのdata.framesのリストがあります。ここでの問題は、行と列の数の点で各data.frameが異なるということですが、（私が呼ばれてきた彼らのすべての共有キーの変数"var1"と"var2"以下のコードで）。data.framesが列の点で同一である場合、私は単にrbindplyrのrbind.fillがその仕事をすることができますが、これらのデータの場合はそうではありません。このmergeコマンドは2つのdata.framesでのみ機能するため、アイデアを求めてインターネットを利用しました。私はこれをここから入手しましたが、R 2.7.2で完全に機能しました。 merge.rec <- function(.list, ...){ if(length(.list)==1) return(.list[[1]]) Recall(c(list(merge(.list[[1]], .list[[2]], ...)), .list[-(1:2)]), ...) } そして、私はそのように関数を呼び出します： df <- merge.rec(my.list, by.x = c("var1", "var2"), by.y = c("var1", "var2"), all = T, suffixes=c("", "")) しかし、2.11と2.12を含む2.7.2以降のRバージョンでは、このコードは次のエラーで失敗します。 Error in match.names(clabs, names(xi)) : names do not match previous names （ちなみに、私は他の場所でこのエラーへの他の参照を見ますであり、解決策がありません）。これを解決する方法はありますか？

259 r list merge dataframe r-faq

6

既存のcsvファイルにパンダデータを追加する方法

to_csv()pandas関数を使用して既存のcsvファイルにデータフレームを追加できるかどうかを知りたいです。csvファイルの構造は、読み込まれたデータと同じです。

259 python pandas csv dataframe

6

パンダ：単一の列にapply（）関数を使用するにはどうすればよいですか？

2列のパンダデータフレームがあります。2番目の列に影響を与えずに最初の列の値を変更し、最初の列の値のみを変更してデータフレーム全体を取得する必要があります。パンダで適用を使用してそれをどのように行うことができますか？

258 python pandas dataframe python-3.5

タグ付けされた質問 「dataframe」

タグ付けされた質問「dataframe」