マトリックス分解に関する重要な論文


18

最近、マトリックス分解に関するSkillicornの本を読みましたが、学部の聴衆を対象としていたため、少しがっかりしました。マトリックス分解に関する重要な論文(調査だけでなく、画期的な論文)の短い参考文献を(自分や他の人のために)編集したいと思います。私が念頭に置いているのは、主にSVD / PCA(および堅牢/スパースバリアント)とNNMFに関するものです。みなさんは、何か提案/提案がありますか?私は答えを偏らせないために私のものを控えています。各回答を2〜3論文に限定してください。

PS:これら2つの分解は、データ分析で最もよく使用されるものです。もちろん数値解析では、QR、コレスキー、LU、およびポーラーが非常に重要です。しかし、それは私の質問の焦点では​​ありません。

回答:


16

SVDとNMFが最もよく使用されていることをどのようにして知っていますか LU、Cholesky、QRではなくマトリックス分解である?私の個人的なお気に入りの「ブレークスルー」は、保証されたランクを明らかにするQRアルゴリズムでなければなりません。

  • チャン、トニーF.「QR分解を明らかにするランク」。 線形代数とその応用巻88-89、1987年4月、67-82ページ。DOI:10.1016 / 0024-3795(87)90103-0

...列ピボットを使用したQRの以前のアイデアの開発:

  • Businger、ピーター。ゴラブ、ジーン・H(1965)。ハウスホルダー変換による線形最小二乗ソリューション。Numerische Mathematik Volume 7、Number 3、269-276、DOI:10.1007 / BF01436084

A(?)古典的な教科書は次のようになります。

  • ゴラブ、Gene H .; ヴァン・ローン、チャールズ・F(1996)。行列の計算(第3版)、ジョンズ・ホプキンス大学、ISBN 978-0-8018-5414-9

(教科書を求めなかったのは知っているが、抵抗できない)

編集: もう少しグーグル検索では、私たちがわずかにネズミイルカにいる可能性があることを示唆する論文を見つけます。私の上記のテキストは「数値線形代数」(NLA)の観点から来ていました。おそらく、「応用統計/心理測定」(AS / P)の観点に関心がありますか?おそらく明確にできますか?


2
スチュワートのマトリックスアルゴリズム両方の 部分)を使って、私は自分で "the"教科書を読みます。私は先駆的な論文のリストを自分で提供しますが、OPは数値の観点または統計の観点が必要かどうかを本当に説明する必要があります(前者を助けることはできますが、後者はあまり助けません)。
JMは

1
ゴラブとヴァンローンの+1。そして、はい、決定的な記事は適切です。
みすぼらしいシェフ

2
統計の部分に焦点を合わせていることを明確にするために質問を編集しました。Golub and Van Loanがマトリックス分解の標準リファレンスであることに全員が同意します。しかし、ランダムな投影による非常に大規模な分解のトピックは省略しています。私がリストに載せる調査論文は、ハルコらによる「ランダム性を持つ構造の発見:近似行列分解を構築するための確率的アルゴリズム」です。
ギャッピー

4

NNMFについて、LeeとSeungは、実装が非常に簡単な反復アルゴリズムについて説明します。実際には、フロベニウスの残差ノルムを最小化するためのアルゴリズムと、近似と元の行列のKullback-Leibler発散を最小化するためのアルゴリズムの2つの類似したアルゴリズムを提供します。


3

たぶん、あなたは面白いを見つけることができます

  1. [行列因子分解による学習]によるネイサン・スレブロによる博士論文、
  2. [大規模推薦システムのためのさまざまな行列因数分解法の調査]、GáborTakácset.al. ここで説明したほぼ同じテクニック

最後の2つのリンクは、協調フィルタリングでスパース行列因数分解がどのように使用されるかを示しています。ただし、SGDのような因数分解アルゴリズムは他のどこかで役立つ可能性があると思います(少なくともコーディングは非常に簡単です)


2

Witten、Tibshirani-ペナルティ付きマトリックス分解

http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf

http://cran.r-project.org/web/packages/PMA/index.html

Martinsson、Rokhlin、Szlam、Tygert-ランダム化されたSVD

http://cims.nyu.edu/~tygert/software.html

http://cims.nyu.edu/~tygert/blanczos.pdf


5
ありがとう。私は両方の論文を知っています。疎分解に関するより重要な論文があると思うので、私はWitten [not Whitten]らの大ファンではありません。ランダム化されたSVDについては、特にMartinssonが共著した「ランダム性のある構造を見つける:近似行列分解を構築するための確率的アルゴリズム」(arxiv.org/abs/0909.4061)のレビューペーパーが気に入っています。
ギャッピー

同意する。誰も言及しなかった論文を2つだけ公開していました。
pslice

2

今年のNIPSでは、ストリーミング入力マトリックスのシングルパスで機能する分散型の非常に大規模なSVDに関する短い論文がありました。

この論文はより実装指向ですが、実際の壁時計時間などすべてを考慮して物事を見通します。冒頭近くの表も良い調査です。


NIPSは何の略ですか?
ワンストップ

@onestopリンクが追加されました。NIPS =ニューラル情報処理システム。これはコミュニティです(システムではありません:))。しかしpiskは2010をニップ会議について話している
ロビンはジラール
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.