タグ付けされた質問 「dataframe」

データフレームは表形式のデータ構造です。通常、これには行が観測で列がさまざまなタイプの変数であるデータが含まれます。「データフレーム」または「データフレーム」は、いくつかの言語(R、Apache Spark、deedle、Maple、Pythonのpandasライブラリ、およびJuliaのDataFramesライブラリ)でこの概念に使用される用語ですが、「テーブル」は、 MATLABおよびSQL。

11
データフレームの列を並べ替える方法を教えてください。
この入力をどのように変更しますか(シーケンス:時間、入力、出力、ファイル): Time In Out Files 1 2 3 4 2 3 4 5 この出力(シーケンス:時間、出力、入力、ファイル)に? Time Out In Files 1 3 2 4 2 4 3 5 これがダミーのRデータです。 table <- data.frame(Time=c(1,2), In=c(2,3), Out=c(3,4), Files=c(4,5)) table ## Time In Out Files ##1 1 2 3 4 ##2 2 3 4 5
311 r  sorting  dataframe  r-faq 

11
データフレームに列を名前でドロップする方法
大きなデータセットを持っているので、特定の列を読み取るか、他のすべての列を削除したいと考えています。 data <- read.dta("file.dta") 興味のない列を選択します。 var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", "m_serv")] そして私がしたいことよりも: for(i in 1:length(var.out)) { paste("data$", var.out[i], sep="") <- NULL } 不要な列をすべて削除します。これは最適なソリューションですか?
304 r  dataframe  subset 

15
Python dictをデータフレームに変換する
次のようなPython辞書があります。 {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06-29': 391, u'2012-06-30': 391, u'2012-07-01': 391, u'2012-07-02': …
299 python  pandas  dataframe 


11
ベクトルの最後の値にアクセスする方法は?
1つまたは2つのレベルのデータフレームにネストされているベクトルがあるとします。length()関数を使用せずに最後の値にアクセスするための迅速でダーティーな方法はありますか?PERLの$#特別な変数の何か? だから私は次のようなものが欲しいです: dat$vec1$vec2[$#] の代わりに dat$vec1$vec2[length(dat$vec1$vec2)]
289 r  dataframe  vector 



3
Pandasに列が存在するかどうかを確認する方法
Pandas DataFrameに列が存在するかどうかを確認する方法はありますか? 次のDataFrameがあるとします。 >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) >>> df A B C 0 3 40 100 1 6 30 200 …
274 python  pandas  dataframe 

21
パンダの軸はどういう意味ですか?
データフレームを生成するためのコードは次のとおりです。 import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) それから私はデータフレームを手に入れました: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ コマンドを入力すると: dff.mean(axis=1) 私は得た: 0 1.074821 dtype: float64 パンダのリファレンスによると、axis = 1は列を表し、コマンドの結果は A 0.626386 B 1.523255 dtype: float64 だからここに私の質問です:パンダの軸は何を意味していますか?

6
Rのdata.frameから列全体を削除する
Rのdata.frameから列全体を削除する方法を知っている人はいますか?たとえば、このdata.frameが与えられた場合: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon 2列目を削除します。
267 r  dataframe 

10
パンダでデータフレームの列スライスを取得する方法
CSVファイルから機械学習データを読み込みます。最初の2列は観測値で、残りの列は特徴です。 現在、私は次のことをしています。 data = pandas.read_csv('mydata.csv') これは次のようなものになります: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 私は2つのデータフレームでは、このデータフレームをスライスしたいと思います:1列を含むaとb、もう1つは列を含むc、dとe。 次のようなものを書くことはできません observations = data[:'c'] features = data['c':] 私は最善の方法が何であるかわかりません。私は必要pd.Panelですか? ちなみに、データフレームのインデックス付けはかなり一貫性data['a']がdata[0]ありません。許可されていますが許可されていません。一方で、data['a':]許可されていませんが許可されていdata[0:]ます。これには実際的な理由はありますか?列がIntによってインデックス付けされている場合、これは本当に混乱します。data[0] != data[0:1]


9
リスト内の複数のdata.framesを同時にマージする
マージしたい多くのdata.framesのリストがあります。ここでの問題は、行と列の数の点で各data.frameが異なるということですが、(私が呼ばれてきた彼らのすべての共有キーの変数"var1"と"var2"以下のコードで)。data.framesが列の点で同一である場合、私は単にrbindplyrのrbind.fillがその仕事をすることができますが、これらのデータの場合はそうではありません。 このmergeコマンドは2つのdata.framesでのみ機能するため、アイデアを求めてインターネットを利用しました。私はこれをここから入手しましたが、R 2.7.2で完全に機能しました。 merge.rec <- function(.list, ...){ if(length(.list)==1) return(.list[[1]]) Recall(c(list(merge(.list[[1]], .list[[2]], ...)), .list[-(1:2)]), ...) } そして、私はそのように関数を呼び出します: df <- merge.rec(my.list, by.x = c("var1", "var2"), by.y = c("var1", "var2"), all = T, suffixes=c("", "")) しかし、2.11と2.12を含む2.7.2以降のRバージョンでは、このコードは次のエラーで失敗します。 Error in match.names(clabs, names(xi)) : names do not match previous names (ちなみに、私は他の場所でこのエラーへの他の参照を見ますであり、解決策がありません)。 これを解決する方法はありますか?
259 r  list  merge  dataframe  r-faq 



弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.