タグ付けされた質問 「dataframe」

データフレームは表形式のデータ構造です。通常、これには行が観測で列がさまざまなタイプの変数であるデータが含まれます。「データフレーム」または「データフレーム」は、いくつかの言語(R、Apache Spark、deedle、Maple、Pythonのpandasライブラリ、およびJuliaのDataFramesライブラリ)でこの概念に使用される用語ですが、「テーブル」は、 MATLABおよびSQL。

4
辞書のリストへのPandas DataFrame
次のDataFrameがあります。 顧客item1 item2 item3 アップルミルクトマト1個 ウォーターオレンジポテト2個 3ジュースマンゴーチップ 行ごとの辞書のリストに変換したい rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

8
data.frameをワイドフォーマットからロングフォーマットに変形
data.frame幅の広いテーブルから長いテーブルに変換するのに問題があります。現時点では、次のようになっています。 Code Country 1950 1951 1952 1953 1954 AFG Afghanistan 20,249 21,352 22,532 23,557 24,555 ALB Albania 8,097 8,986 10,058 11,123 12,246 これをdata.frameロングに変えていきたいdata.frameです。このようなもの: Code Country Year Value AFG Afghanistan 1950 20,249 AFG Afghanistan 1951 21,352 AFG Afghanistan 1952 22,532 AFG Afghanistan 1953 23,557 AFG Afghanistan 1954 24,555 ALB Albania 1950 …
164 r  dataframe  reshape  r-faq 

7
列のフォーマット文字列を使用してフロートのパンダデータフレームを表示する方法
とprint()IPython を使用して、特定の形式でパンダデータフレームを表示したいと思いますdisplay()。例えば: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 これをどうにかして印刷に強制したい cost foo $123.46 bar $234.57 baz $345.68 quux $456.79 データ自体を変更したり、コピーを作成したりすることなく、データの表示方法を変更するだけです。 これどうやってするの?

7
データフレームのグループ内の行に番号を付ける
次のようなデータフレームの操作: set.seed(100) df <- data.frame(cat = c(rep("aaa", 5), rep("bbb", 5), rep("ccc", 5)), val = runif(15)) df <- df[order(df$cat, df$val), ] df cat val 1 aaa 0.05638315 2 aaa 0.25767250 3 aaa 0.30776611 4 aaa 0.46854928 5 aaa 0.55232243 6 bbb 0.17026205 7 bbb 0.37032054 8 bbb 0.48377074 9 bbb 0.54655860 …
163 r  dataframe  r-faq 

13
2つのデータフレームを比較し、それらの違いを並べて出力する
2つのデータフレーム間で何が変わったかを正確に強調しようとしています。 2つのPython Pandasデータフレームがあるとします。 "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.21 False Graduated 113 …
162 python  html  pandas  dataframe  panel 

11
data.frame列をベクトルに変換しますか?
私は次のようなデータフレームを持っています: a1 = c(1, 2, 3, 4, 5) a2 = c(6, 7, 8, 9, 10) a3 = c(11, 12, 13, 14, 15) aframe = data.frame(a1, a2, a3) 次の列の1つをベクトルに変換しようとしましたが、機能しません。 avector <- as.vector(aframe['a2']) class(avector) [1] "data.frame" これが私が思いつくことができる唯一の解決策ですが、これを行うためのより良い方法がなければならないことを想定しています: class(aframe['a2']) [1] "data.frame" avector = c() for(atmp in aframe['a2']) { avector <- atmp } class(avector) …

13
2つのdata.framesを比較して、data.frame 2に存在しないdata.frame 1の行を見つけます。
次の2つのdata.framesがあります。 a1 <- data.frame(a = 1:5, b=letters[1:5]) a2 <- data.frame(a = 1:3, b=letters[1:3]) 行a1にa2にはない行を見つけたいのですが。 このタイプの操作のための組み込み関数はありますか? (ps:私はそれに対する解決策を書きました、誰かがすでにより巧妙に細工されたコードを既に作成しているかどうか私は単に興味があります) これが私の解決策です: a1 <- data.frame(a = 1:5, b=letters[1:5]) a2 <- data.frame(a = 1:3, b=letters[1:3]) rows.in.a1.that.are.not.in.a2 <- function(a1,a2) { a1.vec <- apply(a1, 1, paste, collapse = "") a2.vec <- apply(a2, 1, paste, collapse = "") a1.without.a2.rows …
161 r  merge  compare  rows  dataframe 

5
インデックスで2つのデータフレームをマージする
こんにちは私は次のデータフレームを持っています: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B どのようにしてインデックスをマージして取得しますか? id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 421 18 false 0.0 1 B merge()つまりdf1.merge(df2)、マッチングを行うために列を使用することは私の理解です。実際、これを行うと次のようになります。 Traceback …

4
追加されていない特定の行インデックスで、データフレームに新しい行を追加しますか?
次のコードは、ベクターとデータフレームを組み合わせています。 newrow = c(1:4) existingDF = rbind(existingDF,newrow) ただし、このコードは常にデータフレームの最後に新しい行を挿入します。 データフレーム内の指定した位置に行を挿入するにはどうすればよいですか?たとえば、データフレームに20行あるとします。行10と11の間に新しい行を挿入するにはどうすればよいですか?
160 r  dataframe  insert 

5
特定の順序のベクトルに従ってデータフレーム行を順序付け
以下の短い例で実装したもののように、「ターゲット」ベクトルに従ってデータフレームの行が確実に順序付けられるようにする簡単な方法はありますか? df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE # 4 d FALSE target <- c("b", "c", "a", "d") これはどういうわけか、仕事を成し遂げるには少し複雑すぎるようです: idx <- sapply(target, function(x) { which(df$name == x) }) df <- …
158 r  sorting  dataframe 


9
論理条件でdata.frame行をフィルタリングする
data.frame論理条件に基づいてから行をフィルタリングします。私のようなデータフレームがあるとしましょう expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.156971 hips 14 7.197543 hips 15 7.035404 …
155 r  subset  dataframe 

3
パンダのマルチインデックスを列に変える
2つのインデックスレベルのデータフレームがあります。 value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 これに変えたいのは: Trial measurement value 1 0 13 1 1 3 1 2 4 2 0 NaN 2 1 12 3 0 34 これを行うにはどうすればよいですか? ここで説明されているようにデータを集計したいので、これが必要ですが、インデックスとして使用されている場合、そのような列を選択することはできません。


5
キーでパンダのグループ化データフレームにアクセスする方法
キーでgroupbyオブジェクトの対応するgroupbyデータフレームにアクセスするにはどうすればよいですか? 次のgroupbyを使用します。 rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) 反復してキーとグループを取得できます。 In [11]: for k, gp in gb: print 'key=' + str(k) print gp key=bar A B C 1 bar -0.611756 18 3 bar -1.072969 10 5 bar -2.301539 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.