プログラミング pandas

6

これを行うための明白な方法があると私は確信していますが、現在、滑らかなものについて考えることはできません。基本的に例外を発生させる代わりに、パンダインデックスに値が存在するかどうTrueかFalseを取得または確認したいと思いdfます。 import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) 私が今取り組んでいるのは次のとおりです sum(df.index == 'g')

139 python pandas ipython

6

URLからパンダread_csv

IPythonでPython 3.4を使用しており、次のコードがあります。指定されたURLからcsvファイルを読み取ることができません。 import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) 次のエラーがあります「予期されるファイルパス名またはファイルのようなオブジェクト、タイプを取得しました」どうすれば修正できますか？

138 python csv pandas request

6

パンダ：設定なし。最大行数

以下の表示に問題がありますDataFrame。 n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo 問題は、ipythonノートブックではデフォルトですべての行が印刷されないことですが、結果の行を表示するにはスライスする必要があります。次のオプションでも出力は変わりません。 pd.set_option('display.max_rows', 500) 誰かが配列全体を表示する方法を知っていますか？

138 python formatting pandas ipython-notebook

7

名前に特定の文字列を含む列を検索する

列名を含むデータフレームがあり、特定の文字列を含むが、完全に一致しないものを見つけたいのですが。私が探してる'spike'ような列名で'spike-2'、'hey spike'、'spiked-in'（'spike'一部は常に連続しています）。列名が文字列または変数として返されるようにしたいので、後で、df['name']またはdf[name]通常どおりに列にアクセスします。私はこれを行う方法を見つけようとしましたが、役に立ちませんでした。任意のヒント？

137 python python-3.x string pandas dataframe

5

パンダのデータフレームは各グループの最初の行を取得します

DataFrame次のようなパンダがいます。 df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) これを["id"、 "value"]でグループ化し、各グループの最初の行を取得します。 id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 first 6 3 third 7 3 fourth 8 3 fifth 9 4 second 10 4 fifth 11 …

137 python pandas dataframe

6

sklearnによるパンダデータフレーム列のスケーリング

混合型の列を持つpandasデータフレームがあり、sklearnのmin_max_scalerをいくつかの列に適用したいと思います。理想的には、これらの変換を適切に実行したいのですが、その方法をまだ理解していません。機能する次のコードを作成しました。 import pandas as pd import numpy as np from sklearn import preprocessing scaler = preprocessing.MinMaxScaler() dfTest = pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68], 'C':['big','small','big','small','small']}) min_max_scaler = preprocessing.MinMaxScaler() def scaleColumns(df, cols_to_scale): for col in cols_to_scale: df[col] = pd.DataFrame(min_max_scaler.fit_transform(pd.DataFrame(dfTest[col])),columns=[col]) return df dfTest A B C 0 14.00 103.02 big 1 90.20 107.26 small 2 90.95 110.35 …

137 python pandas scikit-learn dataframe

4

2つのpandas Dataframe列の辞書を作成する最も効率的な方法は何ですか？

次のパンダデータフレームを整理する最も効率的な方法は何ですか。データ= Position Letter 1 a 2 b 3 c 4 d 5 e のような辞書にalphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']？

136 python dictionary pandas dataframe

4

パンダの結合の問題：列はオーバーラップするが、サフィックスが指定されていない

次の2つのデータフレームがあります。 df_a = mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 df_b = mukey niccdcd 0 190236 4 1 190237 6 2 190238 7 3 190239 4 4 190240 7 これらの2つのデータフレームを結合しようとすると： join_df = df_a.join(df_b,on='mukey',how='left') エラーが発生します： …

136 python join pandas

6

tsvファイルをPandas DataFrameに読み込む方法は？

私はpythonとpandasが初めてです。tsvファイルをパンダにロードしようとしていますDataFrame。これが私が試していることと私が得ているエラーです： >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not properly called!') PandasError: DataFrame constructor not properly called!

136 python pandas csv

8

パンダはリストの列を複数の列に分割します

私は1列のパンダデータフレームを持っています： import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) 出力： teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] 5 [SF, NYG] 6 …

136 python pandas

6

パンダ：列内のテキストを複数の行に分割するにはどうすればよいですか？

大きなcsvファイルを使用していて、最後から2番目の列に、特定の区切り文字で分割するテキストの文字列があります。パンダやパイソンを使ってこれを行う簡単な方法があるかどうか疑問に思っていましたか？ CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300 スペース(' ')で区切っ(':')てからSeatblocks列のコロンで区切りたいのですが、セルごとに異なる列数になります。Seatblocks列がシートの最後になるように列を再配置する機能がありますが、そこから何をするかわかりません。組み込みtext-to-columns関数とクイックマクロを使用してExcelで実行できますが、データセットにExcelで処理するにはレコードが多すぎます。最終的には、John Lennonのようなレコードを取り、複数の行を作成し、座席の各セットからの情報を別々の行に入れたいと思います。

135 python pandas dataframe

8

パンダの一意の値の複数の列

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) 「Col1」と「Col2」の一意の値を返す最良の方法は何ですか？望ましい出力は 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

134 python pandas dataframe unique

9

ImportError：dateutil.parserという名前のモジュールはありません

プログラムでインポートpandasすると、次のエラーが表示されますPython monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning up... monas-mbp:book mona$ python t1.py No module named dateutil.parser Traceback (most recent call last): File "t1.py", line 4, in <module> import pandas as pd File "/Library/Python/2.7/site-packages/pandas/__init__.py", line 6, in <module> from . …

134 python pandas pip

3

パンダ：データフレームのインデックス作成中に複数の条件-予期しない動作

2つの列の値でデータフレームの行をフィルタリングしています。何らかの理由で、OR演算子は、AND演算子の動作と同じように動作し、逆も同様です。私のテストコード： import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1 values df['a'][1] = -1 df['b'][1] = -1 df['a'][3] = -1 df['b'][4] = -1 df1 = df[(df.a != -1) & (df.b != -1)] df2 = df[(df.a != -1) | (df.b != -1)] …

134 python pandas boolean-logic

4

Pythonパンダ：データフレームを行ごとに埋める

行をpandas.DataFrameオブジェクトに追加するという単純なタスクは、実行するのが難しいようです。これに関連する3つのStackoverflow質問があり、どれも有効な回答を提供しません。これが私がやろうとしていることです。行と列の名前だけでなく形状も知っているDataFrameがあります。 >>> df = pandas.DataFrame(columns=['a','b','c','d'], index=['x','y','z']) >>> df a b c d x NaN NaN NaN NaN y NaN NaN NaN NaN z NaN NaN NaN NaN これで、行の値を繰り返し計算する関数ができました。行の1つを辞書またはaで埋めるにはどうすればよいpandas.Seriesですか？失敗したさまざまな試みを以下に示します。 >>> y = {'a':1, 'b':5, 'c':2, 'd':3} >>> df['y'] = y AssertionError: Length of values does not match length of index …

133 python dataframe row pandas

タグ付けされた質問 「pandas」

タグ付けされた質問「pandas」