金融サービスはビッグデータの大ユーザーであり、革新者でもあります。一例は、住宅ローン債券取引です。質問に答えるには:
これらの企業が使用したデータ。データのサイズは?
- 過去数年間に発行された各住宅ローンの長い履歴、およびそれらに対する月ごとの支払い。(数十億行)
- クレジット履歴の長い履歴。(数十億行)
- 住宅価格指数。(それほど大きくない)
データを処理するためにどのようなツールテクノロジーを使用しましたか?
それは異なります。NetezzaやTeradataなどのデータベース上に構築された社内ソリューションを使用する企業もあります。その他は、データプロバイダーが提供するシステムを介してデータにアクセスします。(Corelogic、Experianなど)一部の銀行は、KDBや1010dataなどのカラム型データベーステクノロジーを使用しています。
彼らが直面した問題は何であり、彼らがデータを得た洞察がどのように彼らが問題を解決するのを助けたか。
重要な問題は、住宅ローン債券(住宅ローン担保証券)の期限前償還またはデフォルトの決定です。これは、政府の保証がない債券にとって特に重要です。支払い履歴、クレジットファイルを掘り下げ、家の現在価値を理解することにより、デフォルトの可能性を予測することができます。金利モデルと前払いモデルを追加すると、前払いの可能性を予測するのにも役立ちます。
ニーズに合わせてツールやテクノロジーを選択した方法。
プロジェクトが社内のITによって推進されている場合、通常はOracle、Teradata、Netezzaなどの大規模データベースベンダーを基盤としています。それがクォンタットによって駆動される場合、データベンダー、またはサードパーティの「オールイン」システムに直接アクセスする可能性が高くなります。
データからどのようなパターンを特定したか、データからどのようなパターンを探していたか。
100 、000 、000 BのE iがN Gw o r t h t h a t a m o u n t 、or r a s l i t t l e a s