複数のデータベース(oracle、mssqlなど)があり、コマンドのシーケンスを同等のSQLにすることができないため、pandasをdbの代替として使用しています。
いくつかの列を持つデータフレームに読み込まれたテーブルがあります。
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
SQLでは、1年あたりのさまざまなクライアントの数を数えるには、次のようにします。
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
そして結果は
201301 5000
201302 13245
パンダでどうすればいいですか?
私はtable.groupby(['YEARMONTH'])['CLIENTCODE']。unique()を実行し、YEARMONTHでインデックス付けされた2つのシリーズとすべての一意の値が付属しています。各シリーズの値の量を数える方法は?
—
アドリアーノアルメイダ
いくつかのために、
—
sachinruk
value_counts
:あなたが探している答えかもしれませんpandas.pydata.org/pandas-docs/stable/generated/...