タグ付けされた質問 「binning」

9
gnuplotを使用したヒストグラム?
私の.datファイルに既に適切にビニングされたデータがある場合、gnuplotでヒストグラムを作成する方法を知っています(「ボックス付き」を使用するだけです)。数値のリストを取り、gnuplotがユーザーが提供する範囲とビンサイズに基づいてヒストグラムを提供する方法はありますか?

2
Python Pandasで列をビニング
数値のデータフレーム列があります。 df['percentage'].head() 46.5 44.2 100.0 42.12 列をビン数として表示したい: bins = [0, 1, 5, 10, 25, 50, 100] どのようにしてビンの結果を得ることができvalue countsますか? [0, 1] bin amount [1, 5] etc [5, 10] etc ......

6
パンダ:カテゴリを数字に変換する
次のような国のデータフレームがあるとします。 cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 国を「ワンホットエンコーディング」に変換するpd.get_dummies関数があることを私は知っています。ただし、代わりに取得できるように、代わりにインデックスに変換したいと思いcc_index = [1,2,1,3]ます。 以下に示すように、get_dummiesをnumpywhere句と一緒に使用するよりも高速な方法があると思います。 [np.where(x) for x in df.cc.get_dummies().values] これは、Rで「factors」を使用して行う方がやや簡単なので、パンダにも同様の機能があることを期待しています。

10
ヒストグラムプロットのデータを取得する
MySQLでビンサイズを指定する方法はありますか?現在、次のSQLクエリを試しています。 select total, count(total) from faults GROUP BY total; 生成されているデータは十分ですが、行が多すぎます。必要なのは、データを事前定義されたビンにグループ化する方法です。スクリプト言語からこれを行うことはできますが、SQLで直接行う方法はありますか? 例: +-------+--------------+ | total | count(total) | +-------+--------------+ | 30 | 1 | | 31 | 2 | | 33 | 1 | | 34 | 3 | | 35 | 2 | | 36 | 6 | | 37 …

8
numpy 1D配列:n回以上繰り返されるマスク要素
次のような整数の配列が与えられます [1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5] N何度も繰り返す要素をマスクする必要があります。明確にするために:主な目的は、ブール値のマスク配列を取得し、後でビニング計算に使用することです。 かなり複雑な解決策を思いついた import numpy as np bins = np.array([1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5]) N = 3 …
18 python  arrays  numpy  binning 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.