複数の被験者と複数の変数を持つ時系列


8

私はWeb開発者であり、初心者の統計学者です。

私のデータはこのようなものです

Subject  Week   x1  x2  x3  x4  x5  y1
A        1      .5  .6  .7  .8  .7  10
B        1      .3  .6  .2  .1  .3  8
C        1      .3  .1  .2  .3  .2  6  
A        2      .1  .9  1.5 .8  .7  5
B        2      .3  .6  .3  .1  .3  2
D        2      .3  .1  .4  .3  .5  10  

x1変数の積としてy1を予測しようとしています。ただし、y1に対する複数のx変数の影響に遅れがある可能性があると私は信じる理由があります。

すべての被験者が毎週データポイントを持っているわけではないことに注意してください(実際にはほとんどありません)。被験者は、1、2、3、4週目などのデータポイントを持ち、その後ドロップして7、8、9週目まで再び表示されない傾向があります。ラグに関する私の仮説を踏まえて、過去N週間のデータがあるデータポイントに分析を制限することをいとわない。

私が言ったように、私は初心者であり、この形式のデータセットを処理する最良の方法がわかりません。この分析をR、Python、またはこの2つの組み合わせで実行したいと思っています。今週のx変数は効果がないとは思いません。それらは、おそらく前の週よりも大きな効果があると思います。先週はある程度の効果があると思います。

2週間から3週間の遅れが予想されます。少し説明すると、私がここで試みている分析は、オンライントラフィックの品質を判断することに関するものです。毎週、特定のWebサイトに送信する特定のユーザーストリームの品質をスコアで評価します。ブラウザーの分布、重複したクリックアウトの割合などの二次的な指標を見つけようとしています。これにより、そのスコアが事前に何になるかを予測できます。


これは完全な答えにはならないだろうと思いますが、開始するための場所を提供する必要があります。Peter Congdon著の本「Bayesian Statistical Modeling」の第7章/セクション6/7/8の資料から始めます。私の問題はIEDイベントの空間/時間予測に関係し、あなたよりも少し複雑でしたが、すべてが揃っています。私は古いWinBUGSコード(R / JAGS実装に再加工できる)を見つけようとしています。ただし、Congdonの例で使用できるWinBUGSコードがあり、それらは良い出発点を提供するはずです。
Aengus

私は初心者なので、私にとって何をする必要があるか、そしてこれが分析の観点から何を表しているかを高レベルで分析してくれると思いますか?どうもありがとうございました。提供していただけるコードがあれば、感謝されます。私はPythonとR.に精通しています
スペンサー

どのくらいのラグについて話しているのですか?1週間だけですか、それとも複数週間ですか。が前の1週間だけ、または前の数週間のの関数であることを期待していますか?あなたの例はうまくレイアウトされていますが、実際の変数のセットを提供すると、回答者があなたが何をしようとしているのかを見ることができるので、より良い答えが得られる可能性があります。 xyweek nx
naught101 2012

2〜3週間のラグがあることを期待しています。実際の例を示すために質問を編集しました。
スペンサー

私はそれを単純な回帰と考えます。共変量は、x1(t)、x2(t)、...、x5(t)に遅延変数x1(t-1)、x1(t-2)などを加えたものです。単にラグを推測してx1(t-lag)対y1をプロットし、関係を探すか、自己相関を実行することができます。データフレームを使用してRで前者を非常に迅速に実行できるはずです。多くのラグの増分が心配されます。私は主題についての議論を省略しましたが、私は搭乗しています。それらから始める最も簡単な方法は、それらを離散変数としてコーディングすることです。
Aengus

回答:


1

上記のメモで述べたように、これを回帰問題として扱います。以下は、Rでデータ(R Head)からラグ(およびリード)変数を作成するためのリンクです。

投稿には、結果のデータを回帰モデルで使用するための簡単な紹介が含まれています。また、Rパッケージdynlm(動的線形回帰)を少しバックグラウンドで掘り下げることもできます。


私は動的線形回帰について読んでおり、私が探しているものに適合しているようです。参考資料はありますか?
スペンサー

申し訳ありませんが、頭から離れていません。Rの 'dlm'パッケージをすでにご存じでしょう。これは、いくつかのRコードリンクとのリンクです
Aengus 2012

0

y1を0、1、2、3、4週間シフトしたテーブルを作成できます。

次に、それらに対して分析を実行します。たとえば、xからy1を予測しようとするニューラルネットワークを作成できます。いくつかのアイデアについては、Wekaを試してみることができます。

次に、各ラグについてxからy1を予測するいくつかの尺度があります。これを使用して、最適なラグを見つけることができます。


または、今週のx、前週のx、...、y1を含む1つのテーブルを作成することもできます。次に、影響の分析(PCAなど)を実行して、最も影響力のある週と変数を確認します。


今週のx変数は効果がないとは思いません。おそらく前の週よりも大きな効果があると思います。先週はある程度の効果があると私は信じています。さらに、私はすでにRとpythonに精通しているので、これらのツールを使用したいと思います。
スペンサー

@Spencer Wekaのすべてのツールのpython / Rパッケージが見つかります。更新された回答をご覧ください。
j13r 2012
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.