大学院の統計コースが提供するレベルの統計用のオープンソースJavaライブラリ


15

GK BhattacharyyaとRA Johnsonによる、統計の概念と方法の次のテキストを使用して、応用統計の大学院コースを受講しています。

教授は、宿題にSASを使用することを要求しています。

私の質問は、そのようなクラスで一般的に見られる問題のためにSASの代わりに使用できるJavaライブラリがありますか?

私は現在、Apache Math Commonsで間に合わせようとしていますが、ライブラリには感銘を受けていますが(使いやすさと理解しやすさ)、ヒストグラムを描画する機能(チャートライブラリと組み合わせることを考えると)のような単純なことすら欠けているようです)。

私はコルトを見てきましたが、私の最初の関心はすぐになくなりました。

ご意見をお寄せいただければ幸いです。Stackoverflowで同様の質問を見ましたが、説得力のあるものは見つかりませんでした。

注:R、SciPy、Octave、およびそれらを呼び出すjavaライブラリを認識しています-一緒に探している機能を提供できるJavaネイティブライブラリまたはライブラリのセットを探しています。

注:このようなクラスでカバーされるトピックには、通常、1標本および2標本検定、平均値と中央値の信頼区間、記述統計、適合度検定、一元配置および二元配置分散分析、同時推論、検定が含まれます。分散、回帰分析、およびカテゴリーデータ分析。


2
Rを検討しましたか?
RioRaider

こんにちは、メモをありがとう、ほぼ完全にJavaであるライブラリを探しています。したがって、R、SciPy、Octave、およびそれらを呼び出すjavaライブラリを認識しています。これを反映するように質問を編集します。ありがとう。
user1172468

「R、SciPy、Octave、およびそれらを呼び出すjavaライブラリを知っています」Javaを使用して「R統計ソフトウェア」で記述されたコードをどのように呼び出すのか教えてください。
アマンチャウラ

5
基本的な統計テストにJavaライブラリを使用するのはなぜですか?
アンダーマイナー14年

3
@Underminerはここで正しい質問をします。Javaで統計を行うことは、ネジにハンマーを使用するようなものです。十分な決意とブルートフォースがあれば、ネジを確実に配置できますが、非常にエレガントで効率的な方法ではありません。ネジが破損し、指が痛みます。
マーククレセン14年

回答:


10

基本的な統計にjavaを使用せざるを得ない場合は、Apache Commons Mathを使用します。プロットには、JFreeChartを使用し、推奨します。後者は広く普及しているため、stackoverflowにはタグが追加されています。

編集

スイートを探す場合は、Deducerがオプションかもしれません。GUIはJGRに基づいていますが、統計部分はRで呼び出されます。Rとjavaの両方を介して拡張できるようです。たとえば、Rengineの呼び出しをスキップし、代わりに参照されたJavaライブラリを呼び出すことができます。しかし、私は認めます、私はまだそれを試みませんでした。

OPを理解している限り、RapidminerはGUIアクセス(視覚化を含む)、ライブラリとしての使用、カスタムプラグイン開発をサポートする純粋なJavaフレームワークであるためRapidminer for Statisticsのようなものが最適です。私の知る限り、統計のようなものは存在しません。私の知る限りでは、最も基本的な統計テストのみが含まれているため、Rapidminer はその特定のタスクはお勧めません。視覚化は最近拡張されましたが、私はそれらが現在どれほどカスタマイズ可能かを見積もることができません。


こんにちは、これは私がやろうとしていることの一種です。もっと包括的なスイートがあればいいのにと思います。
user1172468

@ user1172468私は答えを更新しました
-steffen

4

Suan Shu:NumericalMethod.comをご覧ください。一般に無料ではありませんが、アカデミックな使用は無料です。


これは、実際にはOPの質問に対する答えではありません。それはもっとコメントです。もっと答えになるように拡張してくれませんか?または、それをコメントに変換することもできます。
GUNG -復活モニカ

おそらくそれが答えではない理由を詳しく説明することができます。彼はJavaライブラリを探しています。私は彼が探している機能の大部分を備えたライブラリを示しました。
user765195 14年

そうです、この状況は標準的な状況よりも少し曖昧です。それにもかかわらず、これは本質的にリンクのみの回答です。SEはそれらを答えではなくコメントと考えています。これをコメントとして提供するのに十分な評判があります。単にリンクはここでの答えの一種であり、それは賛成票を持っているので、コメントへの変換のためにフラグを立てませんでしたが、少し追加することができればいいかもしれません。できない場合、コメントしないことを選択した場合、私はあなたの決定を尊重します。だから私はあなたにメモを残しただけです。
GUNG -復活モニカ

アカデミックな使用には無料ではないようです。
コスモス

残念ながら、もはや明らかにはなりませんが、学生版はまだ100ドルで利用できるようです。
user765195

3

steffenの RapidMiner の提案と同様に、Wekaを検討することをお勧めします。あなたが望んでいるよりも、機械学習により具体的に向けられているかもしれません。クラスタリング、分類、回帰などのタスク用の多くのアルゴリズムがあります。WekaにはGUIがありますが、ソフトウェアライブラリとしても使用できます。GUIでヒストグラムを見たことがありますが、ライブラリで再利用するのが簡単かどうかはわかりません。


回答に感謝します。GradStatisticsコースで取り上げられている資料を本当に考えていました。トピックには、平均値と中央値の1サンプルと2サンプルのテストと信頼区間、記述統計、適合度テスト、1と2が含まれます-way ANOVA、同時推論、テスト分散、回帰分析、およびカテゴリデータ分析。
user1172468

1

http://www.roguewave.com/Portals/0/products/imsl-numerical-libraries/java-library/docs/5.0.1/api/overview-summary.htmlを試して ください

十分に文書化されており、多くの有用な統計および数学関数を提供します。しかし、残念ながらオープンソースではありません。だからそれが気にならなければ、ライブラリは大丈夫です。

ただし、グラフィカルな出力を提供するかどうかはわかりません。


1
こんにちは、リンクのおかげで、Apache Commons Mathと比較する方法を知っていますか。
user1172468

1

DataMeltコンピューティング環境には、ほぼすべてのトピックに対応するJava統計ライブラリが多数あります。Webサイトで提唱されているJythonを使用して使用できますが、JavaとGroovyで使用します。

さらに言うことができます:DataMeltプロジェクトは、次の統計トピックをカバーしています。

  • 乱数
  • 最も人気のある離散および継続配布
  • 記述統計分析
  • データ適合(線形および非線形)
  • 各種統計検定
  • 2Dおよび3Dのヒストグラム

これは、対数尤度アプローチを使用してエラーのあるデータを近似する非線形回帰の例です。

ここに画像の説明を入力してください

パッケージは無料です。


3
サイトへようこそ、@ Remi。これは、実際にはOPの質問に対する答えではありません。それはもっとコメントです。[回答]フィールドのみを使用して回答を入力してください。イライラすることは承知していますが、評判が50を超えるとどこでもコメントできるようになります。または、それを展開して、より回答にすることもできます。ここは初めてなので、新しいユーザー向けの情報を含むツアーページをご覧ください
GUNG -復活モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.