数学と統計のためのscala用の優れたオープンソースライブラリを探しています。うまくいけば、Apache MathやColtのようなものですが、Scalaで実装されています。
誰かが私を正しい方向に向けることができますか?
数学と統計のためのscala用の優れたオープンソースライブラリを探しています。うまくいけば、Apache MathやColtのようなものですが、Scalaで実装されています。
誰かが私を正しい方向に向けることができますか?
回答:
はい。いくつかあります:
ScalaLabプロジェクトは、Java仮想マシンに効率的な科学プログラミング環境を提供することを目的としています。スクリプト言語は、Scalaプログラミング言語に基づいており、高度な科学演算子と、Matlabのような作業スタイルを提供する統合環境で強化されています。
スクリプトコードは非常に高速で、Javaに近く(時には遅く、時には速く)、通常は同等のMatlab .mスクリプトより高速です。
Scala用の高性能数値線形代数ライブラリー。ベクトルと行列にMatlabに似た演算子が豊富に用意されています。数値ルーチンのライブラリ; プロットのサポート。
FACTORIEは、Scalaのソフトウェアライブラリとして実装された、展開可能な確率的モデリングのためのツールキットです。関係因子グラフの作成、パラメーターの推定、推論の実行のための簡潔な言語をユーザーに提供します。
Twitterによるグラフ処理:
Cassovaryは、何十億ものエッジを持つグラフを効率的に処理できるように、ゼロから設計されています。いくつかの一般的なノードとグラフのデータ構造とトラバーサルアルゴリズムが付属しています。典型的な使用法は、大規模なグラフのマイニングと分析を行うことです。
Twitterでは、Cassovaryはスタックの最下層を形成し、「フォローする人」や「類似する人」など、グラフベースの機能の多くを強化するために使用します。また、Twitter検索との関連性や、ユーザーが表示するプロモート製品を決定するアルゴリズムにも使用されます。今後、これらの製品機能の一部から独自のロジックをより多くCassovaryに導入したいと考えています。
ツイッターの抽象代数ライブラリ:
コードは、(ScaldingまたはStormを介して)集約システムの構築を対象としています。もともとはScaldingのMatrix APIの一部として開発されたもので、マトリックスにはモノイド、グループ、またはリングの要素である値がありました。その後、コードがScalding内やTwitter内の他のプロジェクトでより幅広いアプリケーションを持つことは明らかでした。
!実験的なステータスがあります!
sb_probdslは、scalaの新しい区切られた継続サポートを使用して、単純な離散確率プログラミングサポートを提供します。
Scala用のマルコフ連鎖ライブラリー
マルコフ連鎖は、次のステップの確率分布が現在のステップに自明ではないが前のステップには依存しない確率過程を表します。このライブラリにいくつかのトレーニングデータを与えると、統計的にそれに似た新しいランダムデータが生成されます。
Signal / Collectは、大規模なグラフ処理のためのプログラミングモデルおよびフレームワークです。このモデルは、フレームワークが処理を透過的に並列化できるようにしながら、グラフ上で多くの反復アルゴリズムとデータフローアルゴリズムを簡潔に定式化するのに十分な表現力を備えています。
statおよびユーティリティパッケージが含まれます。標準的な手段などの非常に基本的でよく知られているものが含まれています...
ライブラリではありませんが、確率を処理する上で非常に役立ちます。
Figaroは、確率的プログラミングのためのScalaライブラリーです。フィガロの詳細については、フィガロリファレンスをご覧ください。
フィガロはフィガロGithubからダウンロードできます。
このライブラリの著者は現在、フィガロを使用した確率的プログラミングに関する本を書いています。本ページへのリンクは次のとおりです。確率的プログラミング本