誰かが独立とランダムの違いを説明するのを助けることができますか?


21

統計では、独立とランダムは同じ特性を記述していますか?それらの違いは何ですか?「2つの独立したランダム変数」や「ランダムサンプリング」などの説明によく出くわします。それらの正確な違いは何だろうと思っています。誰かがこれを説明し、いくつかの例を挙げることができますか?たとえば、独立ではないがランダムなプロセスですか?


以下に、2つの異なる(それほど深いレベルではない)概念をマージします。「独立」という意味では、独立して観測値が生成され、「独立変数」はその分布に基づいています。
ttnphns

3
これは奇妙な質問です。「ランダム変数」と「独立」の正式な定義(「統計上」が示唆するもの)を調べると、共通点がほとんどないためです。
whuber

@ttnphns、はい、「独立して生成された観測」という用語と「ランダムに生成された」という用語について、私はもっと混乱していたと思います。サンプリングでは、しばしば(単純な)ランダムサンプリングが聞こえます。これにより、独立したサンプルのように感じられます。サンプリング方法を記述する際に両方の特性を本当に組み合わせたいのであれば、観測の選択は相互に依存せず(=独立)、観測が選択される確率は(=ランダムに)?
tiantianchen

1
wikiから独立の定義を確認する場合:「確率論では、2つのイベントは独立、統計的に独立、または一方の発生が他方の確率に影響しない場合は確率的に独立です。」、2つの観測の依存関係はデータ内での表示方法ではなく、生成/選択方法について。次に、上記の場合の2つの同一の観測値は、まだ独立している必要があります。
tiantianchen

2
ウィキペディアのエントリの冒頭にあるヒューリスティックな説明と定義を混同しないでください。定義は、同じ記事の「定義」という見出しの下にあります。こちらがティムの回答で提供されているものです。
whuber

回答:


35

非技術用語で説明しようと思います。ランダム変数は実験の結果を表します。正確な結果が何であるかを事前に知ることはできませんが、いくつかの情報があります。どの結果が可能かは知っており、各結果について、その確率を知っています。

たとえば、公正なコインを投げる場合、頭か尻かを事前に知ることはできませんが、これらが起こり得る結果であり、それぞれが50%の確率で発生することを知っています。

独立性を説明するには、2つの公正なコインを投げる必要があります。最初のコインを投げた後、2回目の投げの場合、頭の確率はまだ50%であり、尻尾の確率もまだであることを知っています。最初のトスが2番目のトスの確率に影響を与えない場合、両方のトスは独立しています。最初のトスが2番目のトスの確率に影響する場合、それらは依存しています。

依存するトスの例は、2つのコインを接着する場合です。


3
従属変数のもう1つのペアは、「ヘッドを取得したかどうか」と「テールを取得したかどうか」です。両方ともランダムですが、互いに独立しているわけではありません。
user253751

3
@immibisまたは公正なサイコロを振って、値を書き留めます。その後、もう一度ロールバックし、値に書き留めた値を掛けます。この値はランダムですが、最初のロールに依存します。
クローリー

8

ランダムランダム変数に関連し、独立は確率的独立に関連します。独立我々は場合は、1つの変数を観察することは、私たちに別の、またはより正式な用語ではについては何も教えてくれないことを意味しYは、その後、我々は場合、彼らは独立していると言う、2つの確率変数でありますXY

pX,Y(x,y)=pX(x)pY(y)

さらに

E(XY)=E(X)E(Y)

そして、それらの共分散はゼロです。ランダム変数は、Xの関数として記述できる場合、Xに依存します。YXX

Y=f(X)

したがって、この場合にはあり、ランダムな依存XYX

プロセスを「非独立」と呼ぶのはかなり誤解を招く-何から独立しているか?何らかのプロセスからの独立した同一分布のランダム変数(こちら、またはこちら)があることを意味していると思います。ここで独立とは、それらが互いに独立していることを意味します。従属ランダム変数を生成するプロセスがあります。例えばX1,,Xk

Xi=Xi1+ε

ここで、はランダムノイズです。このような場合、明らかにX iX i 1に依存しますが、ランダムでもあります。εXiXi1


何をしない Xは確率変数である場合に意味ですか?私はあなたがRV車やイベント混乱していると思う:2 RV車XとYを独立している場合は、イベントP X R PはY S すべてのRについて、sは独立しているP(X) P(Xr)P(Ys)
マシュー・タワーズ

その場合、2つの連続したランダム変数は独立しています。
マシュータワーズ

@m_t_表記法について議論することはどこにもつながるとは本当に思わない(例えば、en.wikipedia.org / wiki /…を参照)
ティム

1
@m_t_これは髪を分割します。stats.stackexchange.com / questions
ティム

2
@tiantianchen逆の場合:iidランダム変数がある場合、独立しているため個々のpdfを乗算することにより尤度関数を構築できます。
ティム

1

変数は数学のすべての分野で使用されます。変数の独立性とランダム性の定義は、統計だけでなく、あらゆる形式の数学に一方的に適用されます。

たとえば、2次元ユークリッドジオメトリのX軸とY軸は独立変数を表しますが、それらの値は(通常)ランダムに割り当てられません。

指定された2つの変数は、ランダム、独立(互いに独立)、両方、またはどちらでもない可能性があります。統計は、ランダム性(より正確には確率)に焦点を当てる傾向があり、2つの変数が独立しているかどうかは、観察される特定の結果の確率に多くの影響を与えます。

統計を学習するとき、これら2つの特性(独立性とランダム性)が一緒に説明される傾向があります。両方とも知っておくことが重要であり、手元の質問の答えに影響を与える可能性があるためです。ただし、これらのプロパティは同義ではなく、数学の他の分野では必ずしも一緒に発生するわけではありません。


ありがとう。「2つの変数が独立しているかどうかが、観察される特定の結果の確率に多くの影響を与える可能性がある」ことについて詳しく説明してください
tiantianchen

3
これは、質問で使用されているものとは異なる「独立」の感覚に対処する非統計的な回答です。また、「変数」の2つの意味を混同します。1つは数学的なものであり、もう1つはランダム変数の統計的な定義です(これは幾何学的軸上の変数とは明らかに異なります)。
whuber

1

独立の概念は相対的ですが、自分でランダムにすることもできます。この例では、「2つの独立したランダム変数」があり、いくつかの「ランダムサンプリング」について話す必要はありません。

完璧なダイを数回キャストするとします。結果先験的にランダムです。:過去を知って、私は、ダイの反対側からシーケンスを生成すると仮定4.次の数を予測することはできません6 13 4。私が得る1 2 4 2 3 ...。それは最初のものと同じくらいランダムです。3の後に何が来るか推測できません。しかし、2つのシーケンスは完全に依存しています。6,5,3,5,461341,2,4,2,33

2つのサイコロを(それらの間の相互作用なしで)並列にキャストすると、それぞれのシーケンスはランダムで独立します。


1
OPのレベルを考えるとこれは少し技術的かもしれませんが、「プロセス(シーケンス)として(何かから)単独で独立することはできません」というステートメントについては、次のことを考慮してください。確率1で、それ自体を含む「すべて」から独立しています。つまり、このようなXの場合、XはXから独立しています。独立性の定義に従って、Xを簡単に確認できます。
マークL.ストーン

@Mark L. Stoneこの虚偽の陳述を訂正します。単独で私は「それ自体」を意味しました。:あなたの定義では、あなたが言うことを許可されている独立して、またはXおよびXは独立していますか?XXX
ローランデュバル

Xはそれ自体から独立しています。すなわち、Xは、Xの独立して
マーク・L・ストーン

0

最初の値がランダムに生成され、2番目の値が最初の値に依存しているときに値のペアがある場合。たとえば、男の身長と体重。それらの間には相関関係があります。しかし、両方ともランダムです。


この投稿では「ランダム」と「依存」という言葉を使用していますが、それらを定義したり明確に区別したりすることはありません。確かに、「ランダム=依存」を示唆しているようです!
whuber

0

コインの例は、ランダムで独立した変数の素晴らしい図解です。ランダムであるが従属変数を考える良い方法は、トランプの7デッキシューズから引き出される次のカードです。以前に配られたカードに応じて変化しますが、靴にカードの値が1つだけ残るまで、次に来るカードの値はランダムのままです。



1
他のイベントに依存する確率(多くの場合、以前のイベントですが、将来のイベントまたは同時イベ​​ントの知識に基づいている場合があります-実際にはこれに対する時間的な方向はありません)は、条件付き確率と呼ばれます。尤度という言葉は、一種の「逆確率」(または連続した場合は確率密度)を指すために使用されます。つまり、モデルパラメーターを条件とする結果(データなど)の確率を計算します。 )、ただし、これを逆に考えると、データが与えられると、そのパラメーターが発生する可能性があります
シルバーフィッシュ

1
ππ=1/6

-1

David Bohmは、現代物理学の因果関係と偶然(ロンドン:Routledge、1957/1984)で、因果関係、偶然、ランダム性、独立性について説明しています。

「自然界では何も一定ではありません。すべてが変化、運動、変化の永続的な状態にあります。絶対にそれが後に存在するものを絶対に生じないという感覚.....すべては他のものから来て、他のものを生じさせる。この原則は、まだ自然の因果関係の存在の声明ではない。次のステップは、さまざまな条件下で行われるプロセスを研究する際に、変化と変換の複雑さのすべての中に関係があることを発見することです実質的に一定のままです。....しかし、この時点で、新しい問題に直面します。因果律の必要性は絶対的ではありません。したがって、偶発事象から抽象化する場合にのみ、必要に応じて自然法則を考えなければならないことがわかります。これは、検討中の法律で扱うことができるものの範囲外に存在する可能性があり、必ずしも従わない本質的に独立した要因を表すこれらの法律の文脈の下で指定される可能性のあるものから。そのような偶然性は偶然につながる。」(pp.1-2)

「特定のコンテキストの外にある偶発事象がそのコンテキスト内の出来事とは無関係に変動する傾向は、それが原則として、つまりランダム性の原則として宣言できるほど広く広がっていることを証明しました。さまざまな可能性にわたって非常に複雑な方法でこれらの偶発事象を変動させますが、統計的平均が規則的でほぼ予測可能な動作を持つようにします。」(p.22)


3
「ランダム」の定義は珍しいようです。「予測可能性」と「パターン」の概念と密接に関連しているように見えますが、それらはどういう意味ですか?たとえば、潜在的に任意の数の実験を0 そして 1 一貫していずれかの値をもたらすことが観察された 1/3 または 4/7、それは「パターン」であると思われ、-元の無限の可能な値のセットとは異なる範囲で-少なくとも部分的に「予測可能」です。「もしプロットすれば...」と書いているところでは単変量変数がランダムになることはないと主張しているようです!
whuber

3
ランダム性とランダム変数ではなく、確率的プロセス(時間内)について議論しているようです。
whuber

4
I believe part of the difficulty we are having in communicating is that you appear to be thinking of "independent" in the sense of an independent variable in regression. Although some elements of the question might suggest that, the phrases "two independent random variables" and "random sampling" indicate otherwise.
whuber

1
あなたの答えが定義を提供しないので、私はあなたの理解が何であるかさえ言うことができません。あなたが与えている例と説明からあなたが言おうとしていることを推測しなければなりません。これらは、以前のコメントで説明した方法で、「ランダム」および「独立」の感覚とは異なるように見えます。
whuber

1
@whuberのコメントに、相互に影響を与えるランダム変数に言及している定義が誤解を招く可能性があることを追加します。「影響力」は何らかの因果関係などを意味する非常に強力な用語です。一方、独立の正式な定義は因果関係や影響力を必要とせず、単に結合確率と個人確率の関係についてです。
ティム
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.