プログラミング dataframe

4

次のDataFrameがあります。顧客item1 item2 item3 アップルミルクトマト1個ウォーターオレンジポテト2個 3ジュースマンゴーチップ行ごとの辞書のリストに変換したい rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

165 python list dictionary pandas dataframe

8

data.frameをワイドフォーマットからロングフォーマットに変形

data.frame幅の広いテーブルから長いテーブルに変換するのに問題があります。現時点では、次のようになっています。 Code Country 1950 1951 1952 1953 1954 AFG Afghanistan 20,249 21,352 22,532 23,557 24,555 ALB Albania 8,097 8,986 10,058 11,123 12,246 これをdata.frameロングに変えていきたいdata.frameです。このようなもの： Code Country Year Value AFG Afghanistan 1950 20,249 AFG Afghanistan 1951 21,352 AFG Afghanistan 1952 22,532 AFG Afghanistan 1953 23,557 AFG Afghanistan 1954 24,555 ALB Albania 1950 …

164 r dataframe reshape r-faq

7

列のフォーマット文字列を使用してフロートのパンダデータフレームを表示する方法

とprint()IPython を使用して、特定の形式でパンダデータフレームを表示したいと思いますdisplay()。例えば： df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 これをどうにかして印刷に強制したい cost foo $123.46 bar $234.57 baz $345.68 quux $456.79 データ自体を変更したり、コピーを作成したりすることなく、データの表示方法を変更するだけです。これどうやってするの？

164 python python-2.7 pandas ipython dataframe

7

データフレームのグループ内の行に番号を付ける

次のようなデータフレームの操作： set.seed(100) df <- data.frame(cat = c(rep("aaa", 5), rep("bbb", 5), rep("ccc", 5)), val = runif(15)) df <- df[order(df$cat, df$val), ] df cat val 1 aaa 0.05638315 2 aaa 0.25767250 3 aaa 0.30776611 4 aaa 0.46854928 5 aaa 0.55232243 6 bbb 0.17026205 7 bbb 0.37032054 8 bbb 0.48377074 9 bbb 0.54655860 …

163 r dataframe r-faq

13

2つのデータフレームを比較し、それらの違いを並べて出力する

2つのデータフレーム間で何が変わったかを正確に強調しようとしています。 2つのPython Pandasデータフレームがあるとします。 "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.21 False Graduated 113 …

162 python html pandas dataframe panel

11

data.frame列をベクトルに変換しますか？

私は次のようなデータフレームを持っています： a1 = c(1, 2, 3, 4, 5) a2 = c(6, 7, 8, 9, 10) a3 = c(11, 12, 13, 14, 15) aframe = data.frame(a1, a2, a3) 次の列の1つをベクトルに変換しようとしましたが、機能しません。 avector <- as.vector(aframe['a2']) class(avector) [1] "data.frame" これが私が思いつくことができる唯一の解決策ですが、これを行うためのより良い方法がなければならないことを想定しています： class(aframe['a2']) [1] "data.frame" avector = c() for(atmp in aframe['a2']) { avector <- atmp } class(avector) …

162 r dataframe vector type-conversion

13

2つのdata.framesを比較して、data.frame 2に存在しないdata.frame 1の行を見つけます。

次の2つのdata.framesがあります。 a1 <- data.frame(a = 1:5, b=letters[1:5]) a2 <- data.frame(a = 1:3, b=letters[1:3]) 行a1にa2にはない行を見つけたいのですが。このタイプの操作のための組み込み関数はありますか？（ps：私はそれに対する解決策を書きました、誰かがすでにより巧妙に細工されたコードを既に作成しているかどうか私は単に興味があります）これが私の解決策です： a1 <- data.frame(a = 1:5, b=letters[1:5]) a2 <- data.frame(a = 1:3, b=letters[1:3]) rows.in.a1.that.are.not.in.a2 <- function(a1,a2) { a1.vec <- apply(a1, 1, paste, collapse = "") a2.vec <- apply(a2, 1, paste, collapse = "") a1.without.a2.rows …

161 r merge compare rows dataframe

5

インデックスで2つのデータフレームをマージする

こんにちは私は次のデータフレームを持っています： > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B どのようにしてインデックスをマージして取得しますか？ id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 421 18 false 0.0 1 B merge()つまりdf1.merge(df2)、マッチングを行うために列を使用することは私の理解です。実際、これを行うと次のようになります。 Traceback …

161 python pandas dataframe merge concat

4

追加されていない特定の行インデックスで、データフレームに新しい行を追加しますか？

次のコードは、ベクターとデータフレームを組み合わせています。 newrow = c(1:4) existingDF = rbind(existingDF,newrow) ただし、このコードは常にデータフレームの最後に新しい行を挿入します。データフレーム内の指定した位置に行を挿入するにはどうすればよいですか？たとえば、データフレームに20行あるとします。行10と11の間に新しい行を挿入するにはどうすればよいですか？

160 r dataframe insert

5

特定の順序のベクトルに従ってデータフレーム行を順序付け

以下の短い例で実装したもののように、「ターゲット」ベクトルに従ってデータフレームの行が確実に順序付けられるようにする簡単な方法はありますか？ df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE # 4 d FALSE target <- c("b", "c", "a", "d") これはどういうわけか、仕事を成し遂げるには少し複雑すぎるようです： idx <- sapply(target, function(x) { which(df$name == x) }) df <- …

158 r sorting dataframe

12

日付でのPandas DataFramesのフィルタリング

「日付」列のあるPandas DataFrameがあります。次の2か月外の日付を持つDataFrameのすべての行をフィルターで除外する必要があります。基本的に、今後2か月以内の行のみを保持する必要があります。これを達成するための最良の方法は何ですか？

157 python datetime pandas filtering dataframe

9

論理条件でdata.frame行をフィルタリングする

data.frame論理条件に基づいてから行をフィルタリングします。私のようなデータフレームがあるとしましょう expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.156971 hips 14 7.197543 hips 15 7.035404 …

155 r subset dataframe

3

パンダのマルチインデックスを列に変える

2つのインデックスレベルのデータフレームがあります。 value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 これに変えたいのは： Trial measurement value 1 0 13 1 1 3 1 2 4 2 0 NaN 2 1 12 3 0 34 これを行うにはどうすればよいですか？ここで説明されているようにデータを集計したいので、これが必要ですが、インデックスとして使用されている場合、そのような列を選択することはできません。

155 python pandas dataframe flatten multi-index

8

Pythonデータフレームパンダはintを使用して列をドロップします

列をドロップするには、df.drop（ 'column name'、axis = 1）を使用することを理解しています。列名の代わりに数値インデックスを使用して列を削除する方法はありますか？

154 python pandas dataframe

5

キーでパンダのグループ化データフレームにアクセスする方法

キーでgroupbyオブジェクトの対応するgroupbyデータフレームにアクセスするにはどうすればよいですか？次のgroupbyを使用します。 rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) 反復してキーとグループを取得できます。 In [11]: for k, gp in gb: print 'key=' + str(k) print gp key=bar A B C 1 bar -0.611756 18 3 bar -1.072969 10 5 bar -2.301539 …

154 python pandas dataframe group-by pandas-groupby

タグ付けされた質問 「dataframe」

タグ付けされた質問「dataframe」