プログラミング binning

9

私の.datファイルに既に適切にビニングされたデータがある場合、gnuplotでヒストグラムを作成する方法を知っています（「ボックス付き」を使用するだけです）。数値のリストを取り、gnuplotがユーザーが提供する範囲とビンサイズに基づいてヒストグラムを提供する方法はありますか？

202 gnuplot histogram binning

2

Python Pandasで列をビニング

数値のデータフレーム列があります。 df['percentage'].head() 46.5 44.2 100.0 42.12 列をビン数として表示したい： bins = [0, 1, 5, 10, 25, 50, 100] どのようにしてビンの結果を得ることができvalue countsますか？ [0, 1] bin amount [1, 5] etc [5, 10] etc ......

99 python pandas numpy dataframe binning

6

パンダ：カテゴリを数字に変換する

次のような国のデータフレームがあるとします。 cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 国を「ワンホットエンコーディング」に変換するpd.get_dummies関数があることを私は知っています。ただし、代わりに取得できるように、代わりにインデックスに変換したいと思いcc_index = [1,2,1,3]ます。以下に示すように、get_dummiesをnumpywhere句と一緒に使用するよりも高速な方法があると思います。 [np.where(x) for x in df.cc.get_dummies().values] これは、Rで「factors」を使用して行う方がやや簡単なので、パンダにも同様の機能があることを期待しています。

86 python pandas series categorical-data binning

10

ヒストグラムプロットのデータを取得する

MySQLでビンサイズを指定する方法はありますか？現在、次のSQLクエリを試しています。 select total, count(total) from faults GROUP BY total; 生成されているデータは十分ですが、行が多すぎます。必要なのは、データを事前定義されたビンにグループ化する方法です。スクリプト言語からこれを行うことはできますが、SQLで直接行う方法はありますか？例： +-------+--------------+ | total | count(total) | +-------+--------------+ | 30 | 1 | | 31 | 2 | | 33 | 1 | | 34 | 3 | | 35 | 2 | | 36 | 6 | | 37 …

82 mysql histogram binning

8

numpy 1D配列：n回以上繰り返されるマスク要素

次のような整数の配列が与えられます [1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5] N何度も繰り返す要素をマスクする必要があります。明確にするために：主な目的は、ブール値のマスク配列を取得し、後でビニング計算に使用することです。かなり複雑な解決策を思いついた import numpy as np bins = np.array([1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5]) N = 3 …

18 python arrays numpy binning

タグ付けされた質問 「binning」

タグ付けされた質問「binning」