「ランダム変数」とはどういう意味ですか?


回答:


35

ランダム変数は、値が不明なイベントに依存する変数です。未知のイベントを「状態」として要約すると、ランダム変数は状態の関数になります。

例:

3つのサイコロロール(、、)があるとします。次に、状態。 D 2 D 3 S = D 1D 2D 3D1D2D3S=(D1,D2,D3)

  1. 1つのランダム変数は5の数です。これは:X

X=(D1=5?)+(D2=5?)+(D3=5?)
  1. 別のランダム変数は、サイコロの合計です。これは:Y

Y=D1+D2+D3

明確で簡潔な回答をありがとう。未知の状態を結果から分離する目的について疑問を投げかけます(これは確率論で「ランダム変数」の領域と範囲がどのように呼ばれるかと思います)。未知の状態が呼び出されると思われa sampleている、私は成果と区別するように依頼しました。絶対に決定的であり、変数ではないのに、なぜ関数を導入してランダム変数と呼ぶ必要があるのですか?結果をすぐにサンプリングできないのはなぜですか?
ヴァル14

2
「イベント」が「既知」になると、ランダム変数はどうなりますか?この答えによると、もはや存在することはできません!「既知」などの曖昧なアイデアに対するこの回答の信頼-純粋に主観的である-は、ランダム変数の定義または説明として満足のいくものではありません。
whuber

1
@whuber英語およびその他の人間の言語は、必ずしも不正確です。実際には、「既知」ではなく「依存」という言葉を選んでいるようです。「の関数」はより正確ですが、「未知のイベント」はあいまいであるため、数学者は「確率空間」、「シグマ代数」、「測定可能な関数」などを定義します。持っている: en.wikipedia.org/wiki/Random_variable
ポール

1
@whuberウィキペディアは正確さを得るために数学の専門用語に急ぎますが、あなたの答えは、まともな素人の例であり、読む価値はありますが、実行するには約16段落必要です。しかし、読むのに5秒かかる答えを望んでいる学部生に何を伝えるべきでしょうか?顧客は定義の簡潔さを高く評価しています。
ポール

5
これは、確率空間で測定可能な実数値関数です。「測定可能」、「実数値関数」、および「確率空間」という各技術用語では、潜在的な視聴者の90%が失われ、実際に定義を理解し、評価しているのは0.1%だけです。ちなみに、それは純粋に数学的な定義です。実際の統計問題にどのように適用できるかを指定するまでは役に立ちませんが、少なくとも(完全に一般的でないとしても)正しいのです。
whuber

69

前書き

最近のコメントを考えると、これまでのすべての返信は、「変数」のような未定義の用語や「不明」のような曖昧な用語の使用や、「関数」や「確率空間」のような技術的な数学概念に訴えていることに気づきました。「ランダム変数」の単純で直感的でありながら正確な定義を望む非数学的な人に何を言うべきでしょうか?ランダム現象の単純なモデルを説明するいくつかの予備的な説明の後、1行に収まるほど短い定義を提供します。cognoscentiを完全に満たしていない可能性があるため、後でこれを通常の技術的定義に拡張する方法を説明します。

箱入りチケット

ランダム変数の背後にある考え方にアプローチする1つの方法は、ランダムチケットインボックスモデルにアピールすることです。このモデルは、実験または観察をチケットでいっぱいの箱に置き換えます。各チケットには、実験の可能な結果が書かれています。(結果は「ヘッド」または「テール」と同じくらい簡単ですが、実際には株価の履歴、長い実験の完全な記録、または文書内のすべての単語のシーケンスなど、より複雑なものです。)すべての可能な結果は、チケットの中で少なくとも1回現れます。一部の結果は多くのチケットに表示される場合があります。

実際に実験を行う代わりに、すべてのチケットをミックスして1つだけを選択することを完全に想像します。実際の実験このように行われたかのように振る舞うことを示すことができれば、潜在的に複雑な(そして高価で長く)実世界の実験を単純で直感的な思考実験(または「統計モデル")。このモデルが提供する明快さとシンプルさにより、実験の分析が可能になります。

標準的な例は、コインとサイコロを投げてトランプを引くことの結果に関するものです。これらは自明性にやや気を散らすので、2016年の米国大統領選挙の結果を懸念していることを例証するために。または民主党(D)-勝ちます。(現在入手可能な情報では)結果が不確実であるため、チケットをボックスに入れることを想像してください。結果のモデルは、このボックスからチケットを1つだけ引き出すことです。

不足しているものがあります。各結果に対していくつのチケットが存在するかについてはまだ規定していません。実際、これを見つけることが統計の主要な問題です。観測(および理論)に基づいて、ボックス内の各結果の相対的な割合については何が言えるでしょうか。

(私はあることは明らかです願う割合ボックス内のチケットの種類ごとのではなく、各チケットの実際の数字よりも、その特性を決定する割合が規定されている- 。いつものように-で割ったチケットの種類ごとの数であることをたとえば、1つの「D」チケットと1つの「R」チケットがあるボックスは、100万の「D」チケットと100万の「R」チケットがあるボックスとまったく同じように動作します。すべてのチケットの50%であるため、チケットが完全に混合されると、それぞれが50%の確率で描かれます。

モデルを定量化する

しかし、ランダム変数を定義するという目標に近づいているため、ここではこの質問を追求しません。これまでのモデルの問題点は、定量化できないことですが定量的な質問に答えられるようにしたいのです。そして、私は些細なことも意味しませんが、「私の会社が米国のオフショア化石燃料開発に10億ユーロを投資している場合、2016年の選挙の結果、この投資の価値はどのくらい変化しますか」 ?」この場合、モデルは非常に単純なので、この質問に対する現実的な答えを得るためにできることはあまりありませんが、経済スタッフに相談し、2つの可能な結果について意見を求めることができます。

  1. 民主党が勝った場合、投資はどの程度変化しますか?(答えがドルだとします。)d

  2. 共和党が勝利した場合、それはどのくらい変わりますか?(答えがドルであると仮定します。)r

答えは数字です。モデルでそれらを使用するには、ボックス内のすべてのチケットとすべての「D」チケットで「ドル」を書き込み、「R」チケットで「ドル」を書き込むようにスタッフに依頼します。これで、投資の不確実性を明確かつ定量的にモデル化できます。価値の選挙後の変化は、このボックスからランダムに引き出された単一のチケットに書かれた金額を受け取ることと同じです。rdr

このモデルは、投資に関する追加の質問に答えるのに役立ちます。たとえば、投資の価値についてどの程度不確実である必要がありますか?この不確実性には(単純な)数式がありますが、実際にどのような結果が発生するかを確認し、その広がりを測定するために、モデルを繰り返し使用する(おそらく1000倍)だけで、回答を合理的に正確に再現できます。 チケットインボックスモデルは、不確実な結果について定量的に推論する方法を提供します。

ランダム変数

不確実または変動する現象に関する定量的な答えを得るには、チケットインボックスモデル採用し、チケットに番号を書き込むことができます。 数字を書くこのプロセスは、単一のルールに従う必要がありますそれは一貫している必要がありますこの例では、すべての民主党のチケットに「ドル」を書き込む必要があります(例外はありません)。また、すべての共和党のチケットには「ドル」を書き込む必要があります。rdr

確率変数は、ボックス内のチケットの数字を書くための任意の一貫した方法です。

(これの数学的な表記は、番号の変更プロセスに名前を付けることです。通常、またはような大文字のラテン文字を使用します。チケットに記載される識別情報は、通常、( ")。ランダム変数によってチケット関連付けられた値は、と示されます。この例では、「は投資の値の変化を表すランダム変数」のようになります。 。 "およびと記述することで完全に指定されます。Y ω X ω X ω X X D = D X R = R X X XXYωXωX(ω)XX(D)=dX(R)=r。より複雑な場合、の値は、より複雑な説明と、多くの場合式によって与えられます。たとえば、チケットは株式の1年分の終値を表し、ランダム変数はプットオプションなど、その株式のデリバティブの特定の時点の値になる場合があります。オプションコントラクトは、計算方法を説明します。オプションのトレーダーは、まさにこの種のモデルを使用して製品の価格を決定します。XXX

このようなはランダムでも変数でもないことに気づきましたか?「不確実」でも「不明」でもありません。これは(結果に対する数値の)明確な割り当てであり、完全な知識と完全な確実性で書き留めることができます。何であるランダムボックスからは、チケットを描画するプロセスです。何である変数は、描画される可能性がチケット上の値です。X

X


その後:測定可能性について

ランダム変数の定義に「測定可能な」警告が伴う場合、定義者が念頭に置いているのは、チケットインボックスモデルを無限に多くの可能な結果を​​伴う状況に一般化することです。(技術的には、無数の無限の結果がある場合、または不合理な確率が関係する場合にのみ必要であり、後者の場合でも回避することができます。)無限に多くの結果がある場合、合計の割合が何であるかを言うのは困難です。「D」チケットと「R」チケットが無限に多数ある場合、それらの相対的な割合はどのくらいですか?無限大を別の無限大で分割するだけではわかりません!

これらの場合、比率を指定する別の方法が必要です。「測定可能な」チケットのセットは、その割合を定義できるボックス内のチケットのコレクションです。これが完了すると、私たちが「割合」と考えていた数を「確率」と呼びます。(チケットのすべてのコレクションに確率が関連付けられている必要はありません。)

XX(ω)abab


7
以前にランダム変数またはチケットインボックスモデルに慣れていない人のために、私のウェブサイトquantdec.com/envstats/notes/class_06/tutorial.htmのクイックインタラクティブチュートリアルで実践といくつかの追加概念を提供します。
whuber

2
これらの概念を示す実用的な例がstats.stackexchange.com/a/68782にあります。
whuberの

2
NB多くの人が、ボックス内のチケットという意味で「人口」という用語を使用していると思います。実際の(物理)母集団をサンプリングするための確率モデルしか作成できないように聞こえるので、この用語は避けます。サンプリングされる物理的な人口がある場合でも、それとチケットの間に完全な1対1の対応があることはまれです。たとえば、2014年1月1日に生きている中国人を列挙することはできません。その理由の一部は、人々が生まれる時期、死ぬ時期、さらには中国人かどうかに関する不確実性です。
whuberの

4
@jskこの答えの紹介では、そのような注意が必要であると思われる理由を説明しています。このスレッドの他の2つの回答には、正確で完全な定義(「確率空間から状態空間として知られる測定可能な空間への測定可能な関数」)が含まれているのは事実ですが、その定義には、シグマ代数、確率測定、および測定可能な機能。読者は「それは大学院レベルのものだ」と文句を言うでしょう。
whuberの

4
@ user4205580数学者にとって、ランダム変数は単に「与えられる」ため、純粋に数学的な定義では、「一貫性」はまったく必要ありません。ここで説明する統計アプリケーションでは、多くのデータが数値ではないため、これは重要な条件です。ランダム変数は、モデルと分析目的に適した方法で構築する必要があります。この概念上の違いに価値があるかどうかを自分で決めることができます。
whuber

16

非公式には、ランダム変数は、可能な各結果に数値コードを割り当てる方法です。*

例1

{H,T}

XX(H)=1X(T)=010

例2

{A,K,,2,A,K,,2,A,K,,2,A,K,,2}.

ブリッジでは、エースは4つの高いカードポイント、キング3、クイーン2、ジャック1の価値があります。他のカードは0ポイントの価値があります。

YY(A)=4Y(J)=1Y(7)=0


HTA

*正式には、ランダム変数は、各結果(サンプル空間内)を実数にマッピングする関数です。


5
+1。この答えは要点を示しており、正確であり、明確です。それにより、このスレッドの他の応答に浸透する「不明な」値や「変化する」値についてのナンセンスを避けることができます。
whuber

12

通常の変数とは異なり、ランダム変数は単一の不変の値に置き換えることはできません。むしろ、統計的特性分布確率変数のを記述することができます。分布は、変数が特定の値を取る確率、または平均や標準偏差などの特定のパラメーターが与えられる範囲内に収まる確率を提供する関数です。

分布が整数などの可算セットの値を記述する場合、ランダム変数は離散として分類される場合があります。ランダム変数の他の分類は連続的であり、分布が実数などの不可算セットの値をカバーする場合に使用されます。


2
正規分布されたランダム変数を意味しない場合は、ここで「正規変数」という用語を使用しないことをお勧めします。
ロブハインドマン

同意した。私は個人的に「普通の変数」と言って、「ランダム」または「分散」という言葉をどこかに投げなかった場合、それが彼らが議論していることを私に合図するために数秒間面白い人を見ます。しかし、私はエンジニアでもあり、統計学者でもないので、ドメイン固有の表記法はあまり使いません。
シャーピー

7
ランダム変数は、自分自身に注意を向けない場合、控えめに分類される場合があります。それらが単に数えることができる場合、私たちは離散と言います:-Pまた、あなたは禁止するのではなく処方することを意味しますが、説明がより適切かもしれないと思います。とにかく、いい答えです-できれば+1がピッキングの軽減に役立つことを願っています
walkytalky

@walkytalky修正してくれてありがとう-私はいくつかの修正を行いました。
シャーピー

1
変数は値のプレースホルダーです。この値またはその値を変数に割り当てることができます(割り当てることができる値のセットは、typeと呼ばれるセットによって制約される場合があります)。単一の不変の値を保持する変数は、「定数」と呼ばれます。ランダム変数の値は不明であるのに対して、ランダム変数は既知の値を保持していると言いたいかもしれません。これは、ランダム変数は変数ではなく、未知の状態を他の何かに(決定的に)マッピングする関数であると言う他の回答と矛盾しています。ランダムではなく、変数でもない、と彼らは言います。
ヴァル14

6

私はこの話を聞かれました:

ランダム変数は、神聖ローマ帝国と比較できます。神聖ローマ帝国は神聖ではなく、ローマではなく、帝国でもありませんでした。

同様に、ランダム変数はランダムでも変数でもありません。これは単なる機能です。(物語はここで語られた: source)。

これは少なくとも説明するのが簡単な方法であり、人々の記憶に役立つかもしれません!


3

ウィキペディアから:

数学(特に確率理論と統計)では、ランダム変数(または確率変数)は(一般的に)確率空間を測定可能な空間にマッピングする測定可能な関数です。イベントの考えられるすべての結果を実数にマッピングするランダム変数は、基本統計で頻繁に研究され、科学で使用され、科学実験から得られたデータに基づいて予測を行います。科学的応用に加えて、偶然のゲームと確率的イベントの分析のためにランダム変数が開発されました。確率変数の有用性は、確率論的な質問に答えるために必要な数学的特性のみをキャプチャする能力にあります。

cnx.orgから:

ランダム変数は、固定条件下でのランダム実験のすべての可能な結果に一意の数値を割り当てる関数です。ランダム変数は変数ではなく、イベントを数値にマッピングする関数です。


4
cnx.orgの定義はどちらも正しいものではありません。1つ目は曖昧で、誤解を招く可能性があるため、「一意」と「固定された条件」を使用し、2つ目は単に間違っているためです。RVは、イベント(測定可能な一連の結果)ではなく、結果(サンプル空間の要素)で定義されます。
whuberの

P=κλeλtκ=0P(t)dtED(t)=λeλtED(t)

1
f(x)

3

通常Xで示される確率変数は、結果が不確実な変数です。この変数の特定の結果の観察は、実現と呼ばれます。より具体的には、通常状態空間と呼ばれる測定可能な空間に確率空間をマッピングする関数です。ランダム変数は、離散的(多数の異なる値を取ることができる)または連続的(無限数の値を取ることができます)です。

2つのサイコロを振ったときに得られる合計であるランダム変数Xを考えます。値は2〜12のいずれか(公正なサイコロが与えられると等しい確率で)を取ることができ、サイコロが振られるまで結果は不確実です。


5
単なる考えですが、これは、12(1/36)を振る確率は7(1/6)と同じだと言っているように見えます。
jefflovejapan

0

私の数学以外の大学の研究では、確率変数は変数が確率にとることができる値からのマップであると言われました。これにより、確率分布を描くことができました

http://mathbits.com/MathBits/TISection/Statistics2/normaldistribution.htm

最近、私は数学者が念頭に置いているものとはどれほど違うかを認識しました。ランダム変数によって、それらは単純な関数Xを意味することがわかります:Ω→R、これはサンプル空間Ωの要素(別名、上記で説明した結果、チケットまたは個人)を取り、範囲内の実数Rに変換します( -∞、∞)。つまり、ランダムではなく、変数でもないことが適切に上記で指摘されました。通常、ランダム性には、測定空間の一部としての確率測定P(Ω、P)が伴います。Pはランダム変数と同様にサンプルをRにマッピングしますが、この時間範囲は[0,1]に制限されており、ランダム変数は(Ω、P)を(R、P)に変換すると言うことができます。 P:R-> [0,1]を測定します。これにより、Rのすべてのxについて、その発生確率を確認できます。

なぜこの種のランダム変数が必要なのか、そもそもRの要素をサンプリングできないのかはわかりませんが、サンプルを数値に変換すると、サンプルの順序付け、分布の描画、期待値の計算が可能になるようです。メジャー理論のチュートリアル(ダミーのメジャー理論)を読んでこのアイデアを手に入れました。数学者はランダム変数のより良いアプリケーションを念頭に置いているかもしれませんが、私の余分な研究ではそれらを見つけることができません。同じテキストは、特にアルファベットエントロピーを計算するために、サンプルを常に数値に変換する必要がないことを示唆していますΩ

H(Ω)=P(Ωi)ln(Ωi)

積分は、ランダム変数の実数値を必要としません。


XAσA
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.