ランダムウォークは正確に何をしますか?


8

正直なところ、私はこの質問に関する多くのWebサイトと回答を読みましたが、理解しやすい簡単な言葉では説明していません。私がしたいのは、ランダムウォークの機能と、それを遺伝子セット濃縮分析にどのように使用できるかを理解することです。

ここに公開された論文があります

誰かがそれを簡単な言葉で説明できますか?


2
これらは2つの非常に異なる質問です!
Alexis

1
@アレクシス私はあなたの修正を受け入れました、私は今それが明確であることを望みます!
学習者2015年

1
@Nemo無関係なタグを削除し、時系列タグを追加しまし。変更を編集したり、タグを追加したりしてかまいませんが、r統計的有意性数学などのタグはここでは無関係に見えます。
Tim

回答:


11

最初の質問に答えようと思います

ランダムウォークは一連の測定値であり、一連の任意のポイントの値は、一連の前のポイントの値にランダムな数量を加えたものです。

たとえば、一連のトスで公正なコインを裏返して、コインが表に出るたびにシリアル変数の前の値に1加え、コインが上に上がるたびに前の値から1引くとします。シリアル変数の。開始値が0で、次の一連のコイントスを反転した場合:

T H T T T H H H T T H T H T H

y

0 -1 0 -1 -2 -3 -2 -3 -1 -2 -2 -1 -2 -1 -2 -1

y

yt=yt1+2Bernoulli(0.5)1

の分布は時間に依存し、さまざまな時間にわたってサンプルにいくつかの興味深い特性を与えます。t yyty

  1. 平均の定義されていません。yバランスのとれたコインの表と裏がゼロを中心とすることが予想されるため、これは直観に反するように見えるかもしれません。これはそれだけでは当てはまりますが、ゼロは単に任意の開始値でしただから、本当の意味はありません!yy

  2. 分散の。y=t時間(フリップの数)が増加すると、分散も増加します。例えば、第1のフリップフロッ(AT)、可能な値は又は、実際の分散は、その後、1である。しかし、第2のフリップフロッで()の可能な値は、又は、および分散は、フリップの無限数について2に等しい(ですべての可能な値の範囲、から行くへ)、分散が無限大です。1 - 1 、T = 2 2 0 - 2 T = Y - t=111t=2202t=y

これらの2つの事実は、統計的推論の基本的なツールを使用する場合にサンプルのみが与えられた場合、の分布について(特定のではなく)推論を引き出そうとすることを混乱させます。(有限のは未定義と推定できますか?有限どのようにと推定できますか?)Y のT Y 0 ˉ Y S 2 Y σ 2 、Y = yyty0y¯sy2σy2=

ランダムウォークには多くの種類があり、より一般的には、自動漸進的なプロセス(つまり、以前の値に何らかの形で依存する変数)があります。ここの例では、単純なベルヌーイ確率変数(コイン投げ)を使用していますが、次のことができます。

  • 代わりに、正規分布のランダム値を連続する値に追加してください...または、実際、あらゆる種類の分布から抽出されたランダム値。y
  • 値作るある時点での以前の値に依存する例えば(時間内の複数の点から);y y t = y t 1 + y t 2 + ランダムな何かyyyt=yt1+yt2+Something Random
  • 値ペアのランダム値での二次元ランダムウォークを作成します。xyx
  • メイク一部空想の機能の、簡単な例は、、、つまり特定の瞬間の記憶は時間とともに減衰する(記憶はが1に近いほど長く続く)— Alecosのコメントによれば、これは単に「自己回帰」(純粋なランダムウォーク)になるを持つことになります);、Y T - 1つの Y T = α yのT - 1 + 何かランダム| α | < 1つのY | α | | α | = 1ytyt1yt=αyt1+Something Random|α|<1y |α||α|=1
  • ランダムウォークや自己回帰プロセスをより複雑にするために、他にもたくさんのことをします。

しかし、彼らはすべて、基本的な方法を使用して試して分析するディケンズです。これが、これらの種類のデータ(他のラベルの中で「非統合」、「長期記憶」、または「単位根」と呼ばれることもある)を扱うための共積分回帰エラー修正モデルおよびその他の時系列分析手法がある理由です、詳細によって異なります)。

「ランダムウォーク」という言葉の起源は、1905年にネイチャーに送信された非常に短い手紙のペアからです。

参考文献
ピアソン、K(1905)。編集者への手紙:ランダムウォークの問題。自然、72(1865):294。

ピアソン、K。(1905)。編集者への手紙:ランダムウォークの問題。自然、72(1867):342。


2
「ランダムウォークは一連の測定値であり、一連の任意のポイントの値は、一連の以前のポイントの値に依存します。」しかし、これはすべての自己回帰プロセスを説明しており、すべての自己回帰プロセスがランダムウォークであるとは限りません。明らかにあなたは主題を知っているので、ランダムウォークの固有の特性を明らかにするためにこのステートメントを修正すると役立つと思います。
Alecos Papadopoulos 2015

@AlecosPapadopoulos TY!ここで私を助けてください...主題にそれほど深く精通していません。ランダムウォークを自己回帰プロセスと区別するにはどうすればよいですか?
Alexis

喜んで。ランダムウォークに関する大きな文献があり、主題は非常に多様です。しかし、最初のレベルでランダムウォークを区別するのは、各ステップの過去のすべての値が、それらの合計の現在の値(ランダムウォーク)に完全な値で寄与することです。自己回帰プロセスでは、通常、過去の影響徐々に消えていきます。あなたは本質的にあなたの投稿でこれについて議論しますまた、私はあなたの答えをもう一度読みます、おそらくあなたは「人口」という単語の使用を再考したいと思います:各は異なる分布を持っているので、どのような意味で同じ母集団に属していますか?y ty t + 1ytyt,yt+1...
Alecos Papadopoulos 2015

1
あなたは(通常は時間をかけて)行動の特定のタイプを取得@Nemo: -過去は完全にあなたがどこを決定するが、進化、パスは次回になる場所には影響しません。どのプロセスが現在の位置に到達し、将来のために重要ではありません。
Alecos Papadopoulos 2015

1
ランダムウォークは、実際には「コルモゴロフ-スミルノフ検定に似ている」わけではありません。帰無仮説の下でのKS検定統計量の漸近分布の導出は、ランダムウォークに関連する概念を使用します。そのつながりを描くことのポイントは、私の素早い見方から、次のセクション(GSEAテスト)で開発を動機付けることにあるようです。それが良い選択だったとは思えません。何が起こっているのかを理解するのを助けるのではなく、混乱に導いたようです。ランダムウォークとGSEAの関係を理解する前に、ランダムウォークを個別に理解することをお勧めします。
Glen_b-2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.