タグ付けされた質問 「decision-theory」

結果に応じて異なるリスクまたは利益または損失の期待を伴うオプション間の最適な意思決定のための戦略の数学的研究。

6
期待される実用新案と矛盾する実験
これは認知科学ベータ版で私が尋ねた質問ですが、そこでは何の答えも得られませんでした。質問の移行/再投稿のポリシーがどうあるべきかはわかりません(メタで議論する価値があるのでしょうか?)が、ここでより多くの回答(少なくとも1つ;)が得られることを望みました。 予想される実用新案では説明できない実験のリストを探しています。予想される実用モデルとは、不確実なイベントのベクトルに対する個々の好みのモデルを意味します(例:および)Von NeumanとMorgernsternによって提案された公理のリスト、すなわち( P(r a i n )= 0.4 、P(s u n s h i n e )= 0.6 )(P(ra私n)=0.4、P(sあなたはnsh私ne)=0.6)\Big(P(rain) = 0.4, P(sunshine) = 0.6\Big)( P(r a i n )= 0.6 、P(s u n s h i n e )= 0.4 )(P(ra私n)=0.6、P(sあなたはnsh私ne)=0.4)\Big(P(rain) = 0.6, P(sunshine) = 0.4\Big) 完全 推移性 連続 …

2
エプスタインジンの好みの重要性は何ですか?
最近、Epstein-Zinの設定を適用する多くの作業が行われていると聞きました。ウィキペディアのページはあまりいっぱいではないようです。 Epstein-Zinの設定が重要なのはなぜですか? 一般に、再帰的ユーティリティは他の選好モデルとどのように異なりますか?他の方法ではキャプチャできないものをキャプチャしますか? それらについてさらに学ぶための良いリソースは何ですか?

5
経済理論における位相概念
質問:1960年代以降の数学のミクロ経済学への主要なまたは体系的な応用は何ですか? たとえば、19世紀後半、フィッシャーはギブズの数学的アイデアを最初に使用して現代の効用理論を構築しました。20世紀に、マス・コレルは一般的な平衡を研究するためにトポロジカルなアイデアを取り入れました。20世紀後半、21世紀初頭はどうですか? たとえば、有向グラフ理論、測度理論、トポロジ、カテゴリ理論、現代のホモロジーまたはコホモロジー、トポス法、機能統合などを検討します。 注1:モデリングなしの計量経済学/統計は除外されます。そこで使用される唯一の現代数学は、ランダムウォーク理論と、複雑な解析によって解決されるエルゴード問題です。RWおよびEPは、経済に固有のものではありません。 適切な経済学の出版物が答えです。これには、非厳密経済学ジャーナル、たとえばJournal of Mathematical Psychologyなどに掲載されたものも含まれます。 注2:はい、私は知っています、このタイプの仕事はまれです(不明瞭と混同しないでください:それのいくつかはよく知られています)。それが、公開されたときにそのような参照を見逃しやすくする理由です。したがって、質問。

3
宝くじを購入する合理性の経済分析はありますか?
宝くじチケットの期待収益が1未満であることは明らかです。 ただし、宝くじを購入することは、消費者による経済的に合理的な決定であることに変わりはないと考えることができます。 推論にはいくつかの行があります。 消費者は予想される支払いを購入するだけでなく、「夢」を購入しています。ファンタジー映画を見たり本を読んだりするのは経済的に合理的な決定であるように(物語は「本当」ではないのですが)、「宝くじに当たったらどうするか」という考えは消費者の商品です買います。 宝くじのペイアウトの価値は額面以上の価値があります。通常の決定で期待されるリターンを分析するとき、リターンは同じコンテキストで与えられると仮定します。(たとえば、ボブがストックA、ストックBのいずれかを選択するか、銀行にお金を貯める場合、どの支払いを受け取るかに関係なく、残りの状況は変わりません)。宝くじに勝つということは、ほとんどの人にとって、仕事を辞めることを意味します。これは、支払いそのものよりも価値があります。 また、ロトチケットのコストは、一部慈善団体と見なすこともできるため、多くの場合軽減されることを考慮する必要があります。 問題は、この主題は経済学でよく考慮されているかどうかです。 おそらく、宝くじチケットを購入する経済的な理由を繰り返すのが良い答えでしょう。 NB。私は、ポイント2に関する別のフォローアップの質問、予想されるリターンが増加する宝くじの支払いに関する質問をする予定です。

3
有界合理性の統一理論の構築における最近の進歩は何ですか?
有界合理性モデルは、特定の心理的バイアスを非常に具体的な方法で説明することに焦点を当てているようです。特に、最先端のコンセンサスでは、1つのサイズがすべてに適合するわけではないようです。フレーミング効果のpre延により、この問題は非常に困難になりますが、有界合理性のモデリングに対する一般的なアプローチを考える方法はありますか。それは後悔の最小化、またはランダムな選択、または合理的な不注意ですか?

3
相対正規化効用関数をpmfとして扱う場合、シャノンエントロピーまたはシャノン情報の解釈は何ですか?
仮定ΩΩ\Omega離散確率変数との相互に排他的な結果の集合であり効用関数であり、等、fff0&lt;f(ω)≤10&lt;f(ω)≤10 < f(\omega) \leq 1∑Ωf(ω)=1ΣΩf(ω)=1\sum_\Omega f(\omega) = 1 場合均一に分配される及びある確率質量関数、シャノンエントロピーであります最大化(、および 1つの要素がすべてのの質量を持っている場合、シャノンエントロピーは最小化されます(実際は)。これは、驚き(または不確実性の低減)および結果と不確実性(または予想される驚き)および確率変数に関する直観に対応します。fffΩΩ\OmegafffH(Ω)=∑Ωf(ω)log1f(ω)H(Ω)=∑Ωf(ω)log1f(ω)H(\Omega) = \sum_{\Omega}f(\omega)log\frac{1}{f(\omega)}=log|Ω|)=log|Ω|)=log|\Omega|)ΩΩ\Omegafff000 とき均一に分布され、不確実性が最大化され、そしてより多くの成果があっ質量が均一に分散させるために、より多くの不確実我々はされています。fff とき、そのすべての質量が一つの結果に集中しており、私たちは何の不確実性を持っていません。fff 結果に確率を割り当てると、実際に観察しても情報は得られません(「驚きません」)。111 に近い確率を結果に割り当てると、実際に発生する結果の観察はますます有益になります(「驚くべき」)。000 (もちろん、これははるかに具体的ですが、認識論的ではありませんが、シャノンの情報/エントロピーのコーディング解釈については何も述べていません。) ただし、効用関数の解釈がある場合、l o g 1の意味的な解釈はありますか?fffまたは∑f(ω)log1log1f(ω)log1f(ω)log\frac{1}{f(\omega)}?あるかもしれないように私には思われる:∑f(ω)log1f(ω)∑f(ω)log1f(ω)\sum f(\omega)log\frac{1}{f(\omega)} 場合 PMFとしては、一様分布を表しΩを、次に、fのに効用関数の対応として無関心大きくすることができなかった結果オーバー*fffΩΩ\Omegafff 1つの結果にすべての効用があり、残りには何もない効用関数(存在する可能性があるように効用が歪んでいる)は、非常に強い相対的な好み、つまり無関心の欠如に対応します。 これを拡張するリファレンスはありますか?離散質量変数に対する確率質量関数と正規化された相対効用の比較の制限について何か見落としましたか? *私は無差別曲線を知っていますが、カテゴリカルなサンプル空間への私の焦点から始めて、「無差別」自体には興味がないという事実から始めて、さまざまな理由でそれらが私の質問にどのように関連しているのかわかりません、むしろ、ユーティリティを確率として解釈する方法、および問題の(離散)「確率分布」が実際に、または(さらに)ユーティリティ関数の解釈を持っている場合に、確率の汎関数を解釈する方法。

2
Machina Paradoxは、選択肢セットを拡張することで解決できますか?
別の質問では、Machinaのパラドックスは、期待される実用新案に対する可能な反例として言及されています。 パラドックスのリストに加えて、マキナのパラドックスを検討してください。それはマスコレル、ウィンストン、グリーンのミクロ経済理論で説明されています。 人は、パリについてのテレビ番組を見ることよりも、パリへの旅行を好む。 ギャンブル1:パリへの旅行に99%の確率で、テレビ番組に1%の確率で勝利します。 ギャンブル2:パリへの旅行に99%の確率で勝利します。1%の確率では勝利しません。 アイテムよりも優先度が高い場合、2番目のギャンブルが最初のギャンブルよりも優先されると考えるのは妥当です。パリへの旅行に負けた人はとてもがっかりして、プログラムの素晴らしさについて番組を見守ることができなくなるかもしれません。 しかし、州に依存する可能性のあるユーティリティを説明するために決定空間を拡張することで、これを解決できるように思えます。たとえば、とt = 1の 2つの期間を持つモデルを考え ます。最初は、パリへの旅行の勝利を取り巻く不確実性の解決の前に表します。2番目の期間は、ギャンブルの解決後です。:次のように今、この潜在的な結果をモデル Aをt = 0t=0t=0t = 1t=1t=1 ここでAはパリへの旅行に勝利した結果に対応します(その後、何をしてもかまいません)、Bは旅行に勝利せずにあなたが勝利した結果ですその後TVを見ると、Cは勝てず、その後何もしない場合です。次に、ある期間にテレビよりもパリを何もせずに(...?)好きになるかもしれませんが、(ある種の相補性のため)時間とともに一緒に考えると、CよりもBよりもAを優先します。あBC= { P、∅ }= { PC、T}= { PC、N} 、A={P,∅}B={PC,T}C={PC,N}, \begin{align} A &= \{P, \emptyset\} \\ B &= \{P^C, T\} \\ C &= \{P^C, N\}, \end{align} あAABBBCCCあAABBBCCC 私の質問はこれです。これは、このパラドックスを解決するための合理的な方法ですか?人々がこれを解決しようとした方法は何ですか?

1
Anscombe-Aumannの公理のうち、Sure-Thingの原理を示唆するものはどれですか。
Anscombe-Aumann設定を検討し、優先関係が元のすべてのAnscombe-Aumannの公理(合理性、連続性、独立性、および単調性)を満たすと仮定します。 注意を純粋な競馬に限定する場合(つまり、客観的な不確実性なしに行動する場合)、Anscombe-Aumannモデルは、サベージの主観的期待ユーティリティ表現に要約されます。したがって、純粋な競馬では、意思決定者はサベージの公理すべて、特に確実な原則(サベージの用語ではP2)を満たします。 アンスコム・オーマンの公理とシュアシングの原理との間の直接的な関係を見ることはできません。確かな原則がアンスコンベオーマンの公理によってどのように暗示されているかを誰かが知っていますか?特に、それは独立性のみから生じるのですか、それとも独立性と単調性が必要ですか?

1
期待効用理論における連続性公理
次の連続性の定義を考えます。 ≿≿\succsimLL\mathcal LL,L′,L′′∈LL,L′,L″∈LL,L',L''\in\mathcal LS1={α∈[0,1]:αL+(1−α)L′≿L′′}S1={α∈[0,1]:αL+(1−α)L′≿L″}S_1=\{\alpha\in[0,1]:\alpha L+(1-\alpha)L'\succsim L''\}S2={α∈[0,1]:L′′≿αL+(1−α)L′}S2={α∈[0,1]:L″≿αL+(1−α)L′}S_2=\{\alpha\in[0,1]:L''\succsim \alpha L+(1-\alpha)L'\} であることは必ずしも本当ですか?もしそうなら、なぜですか?S1∪S2=[0,1]S1∪S2=[0,1]S_1\cup S_2=[0,1]

1
独立の公理のない宝くじよりも優先
一連の仮定:成果は、以下の順にランク付けすることができる1 \ succの2 \ succsim \ cdots \ succsim N。さらに、意思決定者がこれらの結果よりも宝くじよりも優先権を持っているとします。宝くじよりも好みが合理的で継続的であるが、独立の公理と必ずしも一致するとは限りません。NNN1≻2≿⋯≿N1≻2≿⋯≿N1\succ 2\succsim\cdots\succsim N この場合の最高の宝くじは縮退した宝くじ(1,0,…,0)(1,0,…,0)(1,0,\dots,0)ですか? 独立の公理に違反した場合はどうなりますか?

2
リスク中立エージェントによるモラルハザード
私たちは、プリンシパルがリスクを嫌い、エージェントがリスクに中立である隠されたアクションを持つプリンシパルエージェントモデルを持っています。また、2つのレベルの出力xxxとx′x′x'(x′&gt;xx′&gt;xx'>x)と2つのアクションがあると仮定しa,a′a,a′a,a'ます。アクションa 、a ' の下でのx 'の確率それぞれ定義します。また、アクションa ´からのエージェントの非効用は− 1です。p(a),p(a′)p(a),p(a′)p(a),p(a')x′x′x'a,a′a,a′a,a'a′a′a'−1−1-1。関連付けられている賃金x,x′x,x′x,x'は、それぞれw,w′w,w′w,w'です。 私の問題は、最適な契約でx′−w′=x−wx′−w′=x−wx'-w' =x-wであること、つまり、リスクニュートラルなエージェントがプロジェクトに関連するすべての変動性を引き受けることを示す方法がわからないことです。 私は(誘導するために主要な欲求を想定し、問題形式化する「そう、私の質問は自明です、)a′a′a' max{w,w′}u(x′−w′)p(a′)+u(x−w)(1−p(a′))max{w,w′}u(x′−w′)p(a′)+u(x−w)(1−p(a′))\max\limits_{\{w,w'\}} u(x'-w')p(a') + u(x-w)(1-p(a')) st w′p(a′)+w(1−p(a′))−1≥0w′p(a′)+w(1−p(a′))−1≥0w'p(a') + w(1-p(a')) - 1 \geq 0 w′p(a′)+w(1−p(a′))−1≥w′p(a)+w(1−p(a))w′p(a′)+w(1−p(a′))−1≥w′p(a)+w(1−p(a))w'p(a') + w(1-p(a')) - 1 \geq w'p(a) + w(1-p(a)) 特に、「標準」の個別の合理性(λλ\lambda乗数を使用)およびインセンティブの互換性(μμ\mu乗数を使用)の制約に従ってプリンシパルの期待されるペイオフを最大化することで問題を解決しようとする場合(プリンシパルはより多くに興味があると思います)費用のかかるアクションa′a′a')上記の結果と一致しない2つの方程式になります。特に: u′(x−w)=λ+μ[1−(1−p(a))(1−p(a′))]u′(x−w)=λ+μ[1−(1−p(a))(1−p(a′))] u'(x-w) = \lambda + \mu [1- \frac{(1-p(a))}{(1-p(a'))}] u′(x′−w′)=λ+μ[1−p(a)p(a′)]u′(x′−w′)=λ+μ[1−p(a)p(a′)] u'(x'-w') = \lambda + \mu [1- \frac{p(a)}{p(a')}] がの場合に成り立つことは明らかですが、この問題にはません(ここでは、)。別の可能性は、インセンティブの互換性制約がスラックであると仮定することです(したがって)。しかし、プリンシパルが最もコストのかかるアクション(ここで助けます)を誘発したいとき、なぜそれが成り立つのか理解できません。 P …

1
サベージ確実なものの原理と主観的ユーティリティの表現
私は、Savageの主観的効用表現の証明を読んで理解しようとしましたが、複雑すぎます。これのより短い/よりエレガントな証明を知っている人はいますか?有限の価格セットを想定しても問題ありません。 オリジナルはサベージ、LJ 1954にあります。統計の基礎。ニューヨーク:ジョン・ワイリーとサンズ。 良い要約は http://www.econ2.jhu.edu/people/Karni/savageseu.pdfにあります。 サベージの証明は非常に精巧で長いことが知られています。それはその主な公理として確実なものの原則を使用しています。もっと「モダン」な証明があるのだろうかと思っていました。あるいは、混合空間のようないくつかの現代の数学を使って共同で証明しようとするのもいいでしょう(私はAnscombe-Aumannを知っています)。

1
ファンタジーフットボール
ドラフトの3つの異なる領域を見て、ファンタジーフットボールの実験を行うアイデアがあります。これらの3つの領域は、各ピックの位置と、取引の頻度と価値です。 私は文献を掘り下げましたが、このトピックに関する論文をいくつか見つけました。この審査を以前に聞いたことや、このアイデアをより具体的にする方法についてのアイデアを聞いたことがある人はいないだろうか。あいまいな場合は、後で説明します。 助けてくれてありがとう 更新: もう少し情報があります。このペーパーでは、ファンタジーフットボールに関するレベルkのプレイについて説明します。このペーパーの実装は、最終的に企業がプレーヤーのプレイ方法を学び、より優れた製図システムとより適切なインテリジェントプレーヤープールを開発できるようにすることです。このように考えてみてください:ランキングにおける群衆のメンタリティは、自分のランキングシステムよりも優れていますか?

1
マルコフ決定過程、収縮および価値反復
私はマルコフ決定過程(MDP)を検討しています、そして収縮論に関して私が見逃していることがあります。私はそれがどこかで愚かな間違いであると確信しています(おそらく計算上)が、とにかく、私はそれを理解することができません。ここに行きます。 次のように定義された2つの状態と2つのアクションを持つ単純なMDPを考えます。 $$ r(s、a)= \ begin {pmatrix} 1&amp; 2 1 \\ 1&amp; 1 \ end {pmatrix}、$$ $$ P(s、s '、1)= \ begin {pmatrix} 1&amp; 2 0 \\ 1&amp; A 0 \ end {pmatrix}、$$ $$ P(s、s '、2)= \ begin {pmatrix} 0.5&amp; 2 0.5 \\ 0.5&amp; A 0.5 \ end {pmatrix}、$$ $$ \ …

1
モディリアーニのLCHに従って実際に消費を計画した人はいますか?
https://en.wikipedia.org/wiki/Life-cycle_hypothesis?wprov=sfti1 地球上の誰も実際にこれを行っていないことは私には自明のようです。実在の人々は近視眼的で、規律がなく、すべての変数を説明する計算能力に欠けています。 何人かは試みようとするかもしれませんが、常に失敗します、そして、ほとんどの人々は試みさえせず、代わりに短期間生きます。リチャード・ターラーは彼の本「Misbehaving:The Making of Behavioral Economics」でこれをカバーしています。 LCH動作のインスタンスが1つでも文書化されていますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.