Java / Scala用の完全な機械学習ライブラリ[終了]


8

PythonにはMLライブラリがたくさんあります(すばらしいscikit-learnなど)。多くのアルゴ(回帰、分類、クラスタリング、相互検証、特徴処理)を含み、安定して維持され、大規模なデータセットを処理できるjava / scalaに何か良いものはありますか?

私は、Mahout、Breeze / Nak、Wekaを見つけたばかりですが、Pythonのものほど見栄えがよくありません。

さらに、同等のものがない場合、JavaコードをPythonに効率的に接続するにはどうすればよいですか?


Mahout&cと比較してscikit-learnが優れている理由について少し詳細を追加することを検討してください。
Scortchi-モニカの回復

分類、回帰、特徴選択、特徴削減などのアルゴリズムがたくさんあります。さらに、貢献者とサポートの大きなコミュニティがあります
boskaiolo

達成しようとしていることについてもう少し具体的に教えてください。JavaとPythonを「接続」する一般的な方法は、jython、jython.orgを使用することです。
Sandris 14

回答:


16

MLのライブラリ、フレームワーク、ソフトウェアツールの厳選されたこのリスト役立つ場合があります。特に、探しているリソース(JavaおよびScalaの MLリスト)が含まれています。


7
私はそのリストの所有者です-私はそれが定期的に更新されることを追加したいと思います
Joseph Misiti

@JosephMisiti:アップデートありがとうございます。知っておくと便利です。継続してください。
Aleksandr Blekh、2015年

5

Apache Spark、特にそのコンポーネントMLlibは、まさにあなたが探しているもののように見えます。MLlibには、分類、回帰、次元削減などの実装が含まれています。Scala、Java、Pythonでプログラミングできます。

基本的には、Hadoopクラスターで実行できる非常に高速な分散コンピューティングフレームワークです。開発目的で、ローカルマシンでもスタンドアロンモード(Hadoopなし)で簡単に実行できます。

こちらのMLlibガイドをご覧ください。https://spark.apache.org/docs/latest/mllib-guide.html


1

JavaML(http://java-ml.sourceforge.net/)およびEncog(http://www.heatonresearch.com/encog)を見てください。後者は、多くのアルゴリズムよりもニューラルネットワークに重点を置いています。

また、wekaにはあまり友好的なJava APIがないかもしれませんが(まず第一に、それはライブラリではなくGUIアプリケーションであるため)、それに慣れると、そこに実装されているものの数がわかるようになります。

私はそれらすべてをうまく使いました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.