タグ付けされた質問 「pandas」

2
パンダ/ Statsmodel / Scikit-learn
パンダ、Statsmodels、およびScikitは、機械学習/統計操作の異なる実装を学習していますか、またはこれらは相互に補完的ですか? どれが最も包括的な機能を備えていますか? 積極的に開発および/またはサポートされているのはどれですか? ロジスティック回帰を実装する必要があります。これらのどれを使用すべきかについての提案はありますか?

1
ilocを使用して値を設定する[終了]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新して、相互検証のトピックになるようにします。 2年前に閉店。 このラインは、データフレームの最初の4行を返すcombinedためfeature_a combined.iloc[0:4]["feature_a"] 予想どおり、この次の行はcolumnのデータフレームの2行目、4行目、および16行目を返しますfeature_a。 combined.iloc[[1,3,15]]["feature_a"] この行は、データフレームの最初の4行をに設定feature_aし77ます。 combined.iloc[0:4]["feature_a"] = 77 この行は何かをします。長いリストに適用すると時間がかかるため、ある種の計算が行われています。 combined.iloc[[1,3,15]]["feature_a"] = 88 2行目、4行目、および16行目は、次のようにチェックすると設定されません88。 combined.iloc[[1,3,15]]["feature_a"] 大規模なコーディングの迂回をせずに、データフレームの列の行の任意のリストを値に設定するにはどうすればよいですか? このシナリオは、非常に単純で一般的であるように思われます。
13 python  pandas 

5
この散布図の解釈方法は?
x軸の人数とy軸の給与の中央値に等しいサンプルサイズの散布図があります。サンプルサイズが給与の中央値に影響するかどうかを確認しようとしています。 これはプロットです: このプロットをどのように解釈しますか?

1
(パンダ)自己相関グラフは何を示していますか?
私は初心者で、自己相関グラフが何を示しているかを理解しようとしています。 このページや関連するウィキペディアのページなど、ここでは引用していないさまざまなソースからの説明をいくつか読んだことがあります。 私はこの非常に単純なコードを使用しており、1年間のインデックスに日付があり、値はインデックスごとに0から365に単純に増加しています。(1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365) import numpy as np import pandas as pd from pandas.plotting import autocorrelation_plot import matplotlib.pyplot as plt dr = pd.date_range(start='1984-01-01', end='1984-12-31') df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"]) autocorrelation_plot(df) plt.show() 印刷されるグラフがどこにあるか 私はなぜグラフが始まったのかを理解して見ることができます1.00: ラグゼロの自己相関は常に1です。これは、各項とそれ自体の間の自己相関を表すためです。値と遅延ゼロの値は常に同じになります。 これはいいですが、なぜこのラグ50のグラフの値が約0.65なのですか?そして、なぜそれが0を下回るのですか?私が持っているコードを示していなかった場合、この自己相関グラフが増加する値の時系列を示していると推定することは可能ですか?もしそうなら、それをどのように推論できるかを初心者に説明してみてください。

1
相互情報量の計算方法は?
私は少し混乱しています。誰かが2項間の相互情報を計算する方法を説明できますか? D O C U M E N T 1D O C U M E N T 2D O C U M E N T 3』Wh y』111』Ho w』101』W時間のE N』111』WH E R E』100′Why′′How′′When′′Where′Document11111Document21010Document31110 \begin{matrix} & 'Why' & 'How' & 'When' & 'Where' \\ Document1 & 1 & 1 & 1 & …

2
なぜ治療コーディングはランダムな傾きと切片の間の相関をもたらすのですか?
実験的処理変数に2つのレベル(条件)がある被験者内および項目内の要因計画を考えます。をm1最大モデルとm2非ランダム相関モデルにします。 m1: y ~ condition + (condition|subject) + (condition|item) m2: y ~ condition + (1|subject) + (0 + condition|subject) + (1|item) + (0 + condition|item) Dale Barr はこの状況について次のように述べています。 編集(2018年4月20日):Jake Westfallが指摘したように、次のステートメントはこの Webサイトの図1および2に示されているデータセットのみを参照しているようです。ただし、基調講演は変わりません。 偏差コーディング表現(条件:-0.5 vs. 0.5)m2では、被験者のランダムな切片が被験者のランダムな傾きと無相関である分布が可能です。最大モデルのみm1が、2つが相関している分布を許可します。 治療コーディング表現(条件:0対1)では、被験者のランダム切片が被験者のランダムな傾きと無相関であるこれらの分布は、無作為相関モデルを使用してフィッティングできません。治療コード表現における勾配と切片。 なぜ治療コーディングは 常に ランダムな傾きと切片の間に相関関係が生じますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.