タグ付けされた質問 「finance」

マネー、バンキング、クレジット、投資、資産、負債の管理、作成、研究を説明する科学。

3
クレジットの採点に関する優れた本/論文
採点に関する本の推薦を探しています。私はこの問題のすべての側面に興味がありますが、主に次の点に関心があります。それらを構築する方法?どちらが良いことが証明されていますか?2)ニューラルネットワーク。彼らのクレジットスコアリング問題への応用。3)ニューラルネットワークを選択しましたが、他の方法にも興味があります。

2
ARMA-GARCHモデルを使用した外国為替価格のシミュレーション
ARIMA(1,1,1)-GARCH(1,1)モデルを、数年にわたって1分間隔でサンプリングされたAUD / USD為替レートログ価格の時系列に適合させ、2つ以上のモデルを推定する100万のデータポイント。データセットはこちらから入手できます。明確にするために、これはログ価格の1次積分により、ログのリターンに適合したARMA-GARCHモデルでした。元のAUD / USD時系列は次のようになります。 次に、当てはめたモデルに基づいて時系列をシミュレートしようとしましたが、次のようになりました。 シミュレーションされた時系列が元の時系列と異なることを期待し、望んでいますが、それほど大きな違いがあるとは思っていませんでした。本質的に、私はシミュレートされたシリーズがオリジナルのように動作するか、概して見たいと思っています。 これは、モデルの推定とシリーズのシミュレーションに使用したRコードです。 library(rugarch) rows <- nrow(data) data <- (log(data[2:rows,])-log(data[1:(rows-1),])) spec <- ugarchspec(variance.model = list(model = "sGARCH", garchOrder = c(1, 1)), mean.model = list(armaOrder = c(1, 1), include.mean = TRUE), distribution.model = "std") fit <- ugarchfit(spec = spec, data = data, solver = "hybrid") sim …

2
巨大な尖度?
株価指数の日次リターンの説明統計を行っています。即ち、もし及びP 2は、次いで、それぞれ、1日目と2日目に指数のレベルであるL O のG E(P 2P1P1P_1P2P2P_2は、私が使用しているリターンです(文献では完全に標準です)。loge(P2P1)loge(P2P1)log_e (\frac{P_2}{P_1}) したがって、これらのいくつかでは尖度が巨大です。私は約15年分の日次データを見ている(つまり、約∗ 15時系列観測)260∗15260∗15260 * 15 means sds mins maxs skews kurts ARGENTINA -0.00031 0.00965 -0.33647 0.13976 -15.17454 499.20532 AUSTRIA 0.00003 0.00640 -0.03845 0.04621 0.19614 2.36104 CZECH.REPUBLIC 0.00008 0.00800 -0.08289 0.05236 -0.16920 5.73205 FINLAND 0.00005 0.00639 -0.03845 0.04622 0.19038 2.37008 HUNGARY -0.00019 0.00880 -0.06301 0.05208 …

1
シャープレシオの有意性のテスト
シャープ比または情報比の重要性をテストする適切な方法は何ですか?シャープレシオはさまざまな株式指数に基づいており、ルックバック期間が変動する場合があります。 私が説明した1つの解決策は、dfをルックバック期間の長さに設定して、スチューデントのt検定を適用するだけです。 以下の懸念のため、私は上記の方法を適用するのをためらっています。 t検定は歪度の影響を受けやすいと思いますが、株式のリターンは一般的にマイナスに歪んでいます。 ログリターンを使用して計算された平均リターンは、単純なリターンを使用して計算された平均リターンよりも小さくなります。これにより、単純なリターンベースのシャープレシオが、ログリターンベースのシャープレシオと比較して有意であると登録される可能性が高くなると思いますが、基本的なアセットリターンは技術的に同じです。 ルックバック期間が短い(つまり、サンプルサイズが小さい)場合は、t検定が適切である可能性がありますが、別の検定を使用するのに適切なしきい値はどれですか。 私の最初の傾きは、学生のt分布の使用を避け、代わりに私がしている非対称パワーディストリビューションに基づいてテストを作成することです読み尖度と歪度のコントロールを可能にし、株式市場のリターンの非常に近い近似値であることが示されているが。 私の2番目の傾向は、ノンパラメトリックテストを調べることですが、それらの使用法の経験が限られているため、どこから始めればよく、どのような落とし穴を避けるべきかわかりません。 私はこの問題を考えすぎていますか、私の懸念は無関係ですか?


6
なぜボラティリティは金融計量経済学の重要なトピックなのですか?
それが完全にトピック外であるかどうかはわかりませんが、なぜボラティリティが金融計量経済学において重要なトピックであるのかについての意見と総合的な回答があると役立つと思いました。 私はそれがポートフォリオ理論から始まり、資産リターンの根本的な二次モーメントの特性を理解する必要性から始まったと思います。その後、ブラック・ショールズの公式とデリバティブの人気により、このエンティティはファイナンスにおいて非常に重要になりました。

7
サイズが等しくない2つの変数間の相関
私が取り組んでいる問題で、XとYの2つの確率変数があります。2つがどれほど密接に相関しているかを理解する必要がありますが、それらは次元が異なります。Xの行スペースのランクは4350であり、Yの行スペースのランクは数万とかなり大きくなっています。XとYの両方に同じ数の列があります。 2つの変数間の相関関係の測定が必要です。ピアソンのrは、XとYの次元が等しい必要があります(少なくともRは、2つのrvが必要です)。 これらの2つの間に相関関係を作る希望はありますか、それともYからの観測を切り捨てる方法を見つける必要がありますか? EDIT 質問に含まれるべきコメントから情報を追加します。 私はこれについて言及するのを忘れたと思います。XとYは株価です。X社はY社よりもはるかに短い期間公開されました。XとYの価格がどのように相関しているかを教えてください。XとYの両方が存在する期間の相関関係を確実に得ることができました。Xが存在しないというYの余計な数年間の株価を知ることで、追加情報が得られるかどうか知りたいと思いました。

2
ドリフトを伴うランダムウォークの最大ドローダウンの累積分布を計算する
ランダムウォークの最大ドローダウンの分布に興味がありますここで、。期間後の最大ドローダウンはです。Magdon-Ismail らによる論文。al。ドリフトを伴うブラウン運動の最大ドローダウンの分布を与えます。式には、暗黙的にのみ定義されたいくつかの項を含む無限和が含まれます。収束する実装の記述に問題があります。CDFの代替表現やコードのリファレンス実装を知っている人はいますか?X0=0,Xi+1=Xi+Yi+1X0=0,Xi+1=Xi+Yi+1X_0 = 0, X_{i+1} = X_i + Y_{i+1}Yi∼N(μ,1)Yi∼N(μ,1)Y_i \sim \mathcal{N}(\mu,1)nnnmax0≤i≤j≤n(Xi−Xj)max0≤i≤j≤n(Xi−Xj)\max_{0 \le i \le j \le n} (X_i - X_j)

2
時間遅延ニューラルネットワークとリカレントニューラルネットワークの違い
ニューラルネットワークを使用して財務時系列を予測したいと思います。私はIT出身で、ニューラルネットワークについてある程度の知識があり、次のことについて読んでいます。 TDNN RNN 私はそれらのRパッケージを探していましたが、RNNの1つだけを見つけました。これは、RNNであるelmanおよびjordan実装を持つRSNNSパッケージです。 では、リカレントニューラルネットワークは(財務)時系列で使用すると便利ですか?彼ら(以前に引用されたRNNのwikipediaリンクからの引用)以来: 各タイムステップで、入力は標準のフィードフォワード方式で伝播され、次に学習ルールが適用されます。固定されたバック接続により、コンテキストユニットは常に非表示のユニットの以前の値のコピーを維持します(学習ルールが適用される前に接続を介して伝播されるため)。したがって、ネットワークは一種の状態を維持でき、標準の多層パーセプトロンの能力を超えるシーケンス予測などのタスクを実行できます。 実際にはむだ時間ニューラルネットワークと同じではありませんか?そうでない場合、むだ時間ニューラルネットワークとの違いは何ですか?どちらも時系列での使用に適していますか、どちらが適していますか? よろしくお願いします!

1
「機械学習者」からの統計的な金融時系列モデルに関するいくつかの質問
なぜ私がこれらの愚かな質問をするのかを説明するために、以下で見つけることができます。私はより機械学習の人であると言わなければなりません。私はバイオインフォマティクスの問題に取り組みましたが、すべてが順調でした。「回帰」や「尖度とゆがみ」などの言葉を聞いたとき、最初は微笑んだだけで、2番目のケースは「はい、聞いたことがある。それを計算する方法を知っていますが、なぜ地球上で誰もがそれを必要とするのですか?」 1年前の状況は劇的に変化しました。楽しみのために、機械学習の知識をいくつかの財務時系列に適用しようとしました。 「テクニカル」「分析」「指標」から提供される信号からベイジアンネットワークを作成することから始めました。アイデアは失敗しました。また、このサイト(ベイジアンの代わりにニューラルネットワークを使用)で同様のアイデアを持つ少なくとも2つのトピックを見つけることは、いくらか喜ばしいことでした。 次に、多くの努力の結果、kNNとシンボリック回帰の混合を構築することができました。これは、2000年から2006年までの1時間のデータでトレーニングし、2007年のデータでテストしました。しかし、それを最新のデータに適用すると、経済の急激な変化により精度が大幅に低下し、市場で何かが変化し、2-5でしか取得できない新しいデータが必要になったため、精度が低下していることに気付きました。年。 後で、たくさんのことを試しましたが、もしこのすべてが「ただの楽しみ」として始まったとしたら、それはもう楽しくありませんでした。私がARIMA、GARCH、TARやその他のまったく新しいものについてRuey S. Tsayのオンライン講義を見つけるまでは。 基本的に私は全く新しい世界を見つけ、それを本当に楽しんでいます。現在、私は最初のARIMAモデルに適合させることができました。次に、ACF、PACF、季節性などを検討することにより、rms-errorを2回削減するように調整しました。 さて、楽しみは戻ってきました、私はそれをたくさん持っていました、そして私はもっと持っていると期待しています しかし、いくつか質問があり、この素晴らしいサイトを見つけました。ここでは、ARIMAとその他の関連技術に関するほぼすべてのトピックを読み、同様のアプローチに関連する他の多くの一般的なトピックも読んでください。確かにもっと読むでしょう。私はまだ機械学習アプローチの考え方の枠内で考えています。それは多くの愚かな質問につながり、そのほとんどはこのサイトで答えを見つけます。 だから、この長い紹介の後に、私の残りの愚かな質問があります: 機械学習アプローチはデータ内の「パターン」を見つけることについてより関心がありますが、ランダムウォーク理論を広く使用する金融時系列の統計モデル(パターンの存在を少なくとも疑わしくします)と矛盾します。非常にナイーブで誤った説明ですが、私が言いたいのは、ほとんどの機械学習手法は、問題に対する統計的アプローチと概念的に矛盾しているということです。いくつかのアプローチの方が優れていると言っているのではなく、矛盾していると言っているだけです。それは正しいですか、この矛盾はどのくらい大きいですか? 機械学習と統計の融合のように見えるTARモデルの説明とアイデアが本当に気に入りました。これは、ARIMAにGARCHを追加した後で次に試してみたいモデルです。しかし、私はそれについていくつか質問があります: TARは統計的手法と機械学習手法の両方を使用しています。それで、私の最初の質問を念頭に置いて、モデルのセットのパターンを見つけようとすると、基本的にパターンを除外する理論に基づいて構築されていますが、エラーはありませんか?または、同じ問題のさまざまな側面を研究する2つのモデルを1つのさらに強力なモデルに結合する方法の単なるアイデアですか? このサイトで「ARIMA」というキーワードで検索すると、15ページのトピックが表示されますが、TARの場合は1つしかありません。また、なぜARの適用をやめたのですか?このアイデアをより複雑なモデル(ARIMAなど)に拡張してみませんか?TARがARに対して期待された改善を提供しなかったからでしょうか? MCMCの手法やその他の機械学習の要素が現在統計モデルと混合されていることを知っています。個人的には、隠れマルコフモデルと条件付きランダムフィールドの大ファンでもあります。これらの方法と統計モデルの混合について知っていますか?

1
ベイズの定理を使用する場合の信頼区間
いくつかの条件付き確率と、95%の信頼区間を計算しています。私のケースの多くでは、(分割表からの)試行からのx成功の単純なカウントがあるnため、で提供さbinom.confint(x, n, method='exact')れてRいるような二項信頼区間を使用できます。 しかし、他の場合では、そのようなデータがないので、ベイズの定理を使用して、持っている情報から計算します。たとえば、イベントおよび与えられた場合:baaabbb P(a | b )= P(B |)⋅ P(a )P(b )P(a|b)=P(b|a)⋅P(a)P(b) P(a|b) = \frac{P(b|a) \cdot P(a)}{P(b)} \ textrm {binom.confint}(\#\ left(b \ cap {} a)、\#(a)\ right)を使用してP(b | a)の周りの95%信頼区間を計算でき、比率P(a)/ P(b)を周波数比\#(a)/ \#(b)として。この情報を使用してP(a | b)の周囲の信頼区間を導出することは可能ですか?P(b | a )P(b|a)P(b|a)binom.confint(#(B ∩a )、#(a ))binom.confint(#(b∩a),#(a))\textrm{binom.confint}(\#\left(b\cap{}a),\#(a)\right)P(a )/ P(b )P(a)/P(b)P(a)/P(b)#(a )/#(b )#(a)/#(b)\#(a)/\#(b)P(a | b )P(a|b)P(a|b) ありがとう。

4
確率的な中断の犠牲になることなく、時間の経過とともに生産性または費用を理解する
ここで私を助けてください。おそらく私に答えを与える前に、私が質問をするのを手助けする必要があるかもしれません。私は時系列分析について学んだことがなく、それが本当に必要なものかどうかわかりません。私は時間平滑化平均について学んだことがなく、それが本当に私が必要とするものかどうかわかりません。私の統計の背景:私は生物統計学に12のクレジットを持っています(多重線形回帰、多重ロジスティック回帰、生存分析、多因子分散分析、ただし反復測定分析はありません)。 以下のシナリオをご覧ください。私が検索すべき流行語は何ですか、そして私が学ぶ必要があることを学ぶためのリソースを提案できますか? まったく異なる目的でいくつかの異なるデータセットを確認したいのですが、それらすべてに共通するのは、1つの変数として日付があるということです。そのため、いくつかの例が思い浮かびます。時間の経過に伴う臨床生産性(手術の回数やオフィスへの訪問回数など)または時間の経過に伴う電気料金(電気会社に毎月支払われる金額など) 上記の両方について、ほぼ普遍的な方法は、月または四半期のスプレッドシートを1つの列に作成し、もう1つの列に電気代や診療所で見られる患者の数などを作成することです。ただし、1か月に数えると意味のない多くのノイズが発生します。たとえば、通常は毎月28日に電気料金を支払うが、ある場合には忘れてしまい、その翌日3日の5日後にのみ支払う場合、1か月は費用がゼロであるかのように表示され、来月は莫大な費用が表示されます。支払いの実際の日付があるので、非常に細かいデータを暦月ごとに費用にボックス化して意図的に破棄するのはなぜでしょうか。 同様に、私が会議に6日間出かける場合、その月は非常に非生産的であるように見え、それらの6日間が月末近くになると、待機リスト全体があるため、翌月は特徴的に忙しくなります。私に会いたかったが、私が戻るまで待たなければならなかった人々の それからもちろん、明らかな季節変動があります。エアコンは電気をたくさん使うので、明らかに夏の暑さを調整する必要があります。何十億人もの子供たちが、冬の再発性急性中耳炎について私に紹介され、夏と初秋にはほとんど紹介されません。夏休みの後に学校が戻ってくる最初の6週間は、学齢期の子供が選択手術を受ける予定はありません。季節性は、従属変数に影響を与える1つの独立変数です。推測できる変数や未知の変数が他にもあるはずです。 長年にわたる臨床研究への登録を見ると、さまざまな問題がたくさん発生します。 イベントとその実際の日付を確認するだけで、実際には存在しない人工的なボックス(月/四半期/年)を作成せずに、時間の経過とともにこれを確認できる統計のブランチはどれですか。 どんなイベントでも加重平均をすることを考えました。例えば、今週見られる患者数は、今週見られる0.5 * nr +先週見られる0.25 * nr +来週見られる0.25 * nrに等しい。 これについてもっと知りたい。どのような流行語を検索する必要がありますか?

2
「テキスト」と「データ」の間の統計的相関の自動化
特定の企業の製品やパフォーマンスに関するプレスリリース、ブログ投稿、レビューなどに関するテキストデータを収集しています。 具体的には、そのような「テキスト」コンテンツの特定のタイプやソースと、会社の銘柄記号の市場評価との間に相関関係があるかどうかを確認したいと考えています。 このような明らかな相関関係は、人間の心でかなり早く見つけることができますが、それはスケーラブルではありません。このような異種ソースの分析を自動化するにはどうすればよいですか?

9
財務データの統計分析について学ぶためのリソース
私は財務データの統計分析が大きなトピックであることを認識していますが、それがまさに私が財務分析の世界に侵入しようとするときに私の質問をする必要がある理由です。 この時点で私はこの件についてほとんど何も知らないので、私のグーグル検索の結果は圧倒的です。試合の多くは、専門的なツールやRプログラミング言語の学習を提唱しています。必要なときにこれらを学びますが、私は最初に、特に財務データのための統計分析の最新の方法を説明する本、記事、またはその他のリソースに興味があります。私はデータを分析するための非常に多様なさまざまな方法があると思いますので、理想的には、実際に適用できるさまざまな方法の概要を探しています。初心者は理解できるが、過度に単純化されていない実世界の例を利用するものが欲しいです。 財務データの統計分析について学習するための優れたリソースは何ですか?

2
予測財務時系列のk倍CV —最後の倍のパフォーマンスはより関連性がありますか?
財務時系列のANNベースの予測モデルに取り組んでいます。私は5分割交差検証を使用しており、平均パフォーマンスはそうです。最後のフォールド(最後のセグメントがトレーニングから省略され、検証に使用される反復)のパフォーマンスは、平均よりも優れています。 これは偶然/データ依存ですか、それとも通常、最後の折り目の検証パフォーマンスは優れていますか?(おそらく、先行するすべてのデータを使用したトレーニングは、時系列内の後続のデータにより関連しているため) これは少し奇妙な質問のように感じますが、とにかくいくつかの応答を期待しています。前もって感謝します :)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.