タグ付けされた質問 「software」

質問が統計、機械学習、またはデータ分析に関連し、プログラミング、サポート、またはバグだけに関するものではないことを確認してください。関連する統計的な問題を参照する追加のタグを含めます。

8
「研究ノート」ソフトウェアのアイデアは?
だから、これは奇妙なフィットですが、本当に私はどのサイトにも奇妙なフィットだと思うので、データを処理する仲間の中でここで試してみると思いました。 私は生物学から疫学と生物統計学を学びましたが、その分野にはまだ間違いなくいくつかの習慣があります。それらの1つは、実験ノートを保持しています。これは、思考、決定、分析に関する考察などを文書化するのに役立ちます。すべてを1か所でコミットし、すべてをコミットするので、後で分析を振り返り、自分が何をしたかを知ることができます。 しかし、それを21世紀に移行することは素晴らしいことです。特に、ラボノートブックシステムは1人で決定を文書化するには十分であるにもかかわらず、EDAからのプロット、特定のデータセットについて話し合うデータマネージャーからの電子メールなどを添付できると便利です。 私はこれには多くの異なるビットの不浄な連合から自分のシステムをリギングすることが含まれると推測していますが、現在システムを使用している人はいますか?

14
まだ簡単にデータを調査できるソフトウェア
スプレッドシートの騒乱と戦う私の試みでは、真の統計ソフトウェア(R、Stataなど)などのより堅牢なツールを推し進めることで、しばしば福音主義的です。最近、私はこの見方で、彼らは単にプログラムを学ぶことはないだろうと率直に言った人に挑戦されました。プログラミングを必要としないデータ分析ツールを提供したいと思います(ただし、理想的には、後でつま先を水に浸すことにした場合はプログラミングに拡張されます)。真っ直ぐな顔で推奨できるデータ探索用のパッケージは何ですか?

3
分類のための半教師あり学習、能動学習、および深層学習
すべてのリソースが更新された最終編集: プロジェクトでは、機械学習アルゴリズムを分類に適用しています。 課題: 非常に限られたラベル付きデータと、より多くのラベルなしデータ。 目標: 半教師付き分類を適用する 何らかの方法で半教師付きのラベル付けプロセスを適用します(アクティブラーニングとして知られています) EM、Transductive SVM、S3VM(Semi Supervised SVM)の適用、またはLDAの使用など、研究論文から多くの情報を見つけました。このトピックに関する本はほとんどありません。 質問: 実装と実際のソースはどこにありますか? 最終更新(mpiktas、bayer、およびDikran Marsupialが提供するヘルプに基づく) 半教師付き学習: TSVM:SVMligthおよびSVMlinで。 PythonのEM Naive Bayes LinePipeプロジェクトのEM 能動的学習: Dualist:テキスト分類に関するソースコードを使用した能動学習の実装 このWebページは、アクティブラーニングの素晴らしい概要を提供しています。 実験的なデザインワークショップ:ここ。 深層学習: ここで紹介ビデオ。 一般サイト。 スタンフォード教師なし機能学習および深層学習チュートリアル。

3
Googleドキュメントのスプレッドシートを使用して、統計作業を実施し、他の人と共有していますか?
おそらくほとんどの人が、Googleドキュメントはまだ原始的なツールだと感じていることを知っています。MatlabやRではなく、Excelでもありません。それでも、私はブラウザの操作機能を使用するだけの(そして非常に異なる動作をする多くのブラウザと互換性がある)このWebベースのソフトウェアのパワーに困惑しています。 このフォーラムでアクティブに活動しているマイク・ローレンスは、Google Docsを使用してスプレッドシートを共有しました。私は個人的に、GoogleドキュメントのExcelで最初に行われたかなり徹底した仮説テストフレームワーク(多数のパラメトリックテストとノンパラメトリックテストを含む)を複製しました。 Googleドキュメントを試してみて、興味深いアプリケーションで限界に達した人がいるかどうかに興味があります。また、Googleドキュメントで発生したバグや欠陥についても興味があります。 私はこの質問を「コミュニティwiki用」に指定しています。これには最良の答えがないことを示しています。何よりも調査です。

3
PowerPointで使用するのに最適なオープンソースデータ視覚化ソフトウェア
最高のオープンソースデータ視覚化ソフトウェアは何ですか?次のものが必要です。 Microsoft Excelからデータをインポートできます(Oracleデータベースからデータをインポートすることもできますが、これは必須ではありません)。 ソフトウェアによって生成されたグラフは、Microsoft PowerPointにエクスポートできます(コピーと貼り付けは問題ありません)。 オープンソースで使いやすい。

1
等式および不等式制約のための制約付き最適化ライブラリ
最適化機能に適した制約付き最適化ライブラリの選択に関する推奨事項はありますか?私はai)線形等式および不等式制約のある非線形関数を最小化し、ii)関数の勾配とヘシアンを利用可能にしました。 それが役立つ場合、私が最小化している関数はKullback-Liebler divergenceです。 constrOptimは不等式制約のみを扱います。Quadprogは二次関数を処理します。信頼は制約をサポートしていません。したがって、KLの発散はこれらのソリューションに適合しません。 最適化のためのR Cranタスクページには、かなりの数のソリューションがあります。Iam は、interior-pointまたはtrust-region-reflectiveを使用していると思われるfmincon()関数を使用して、MATLABで最適化を実行できます。理想的には、定義された問題に適したライブラリがあります。

5
子供の統計や確率を教えるためのソフトウェア(またはwebapps)?
(遠い将来)子供に統計を教えたいです。さらに言えば、統計(確率論的)アイデアを子供(または大人)に説明するのに役立つソフトウェア(明らかにFOSSの傾向がある)またはwebappsを知ってうれしいです。 これは、インストラクター、子供、またはその両方で使用できます。 回答の推奨形式:ソフトウェア名、それが教えるのに役立つもの、誰がそれを使うべきか、リンク。


9
クラスタリング用の視覚化ソフトウェア
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 〜22000ポイントをクラスター化します。多くのクラスタリングアルゴリズムは、高品質の初期推測でより適切に機能します。データの大まかな形状を把握できるツールは何ですか? 自分の距離メトリックを選択できるようにしたいので、ペアワイズ距離のリストをフィードできるプログラムは問題ありません。ディスプレイ上の領域またはクラスターをハイライトし、その領域にあるデータポイントのリストを取得するようなことをしたいと思います。 フリーソフトウェアが望ましいですが、SASとMATLABを既に持っています。

3
統計ワークベンチとしてのRuby
また、これは非常に多くの関係する質問ですワークベンチの統計情報としてPythonと統計作業台として優れ。RubyとPythonについて大きな議論があることは知っていますが、これはこの質問のポイントではありません。RubyはPythonよりも速く、非常に自然な構文を持っていると統計を理解するのに役立ち、Rの良い代替品になる可能性があると思いました(これも私の興味であり、Rに関する他の質問で引用されました)。たとえば、私が見たGoogle Techの講義の1つで(ここでリンクされている質問で引用されているように、講師はforループの作成中にRが遅いと文句を言います)。RubyにはRailsもあります。そのため、両方を統合する可能性があるかもしれません(PythonにはDjangoがありますが、私はここには入りません)。 したがって、質問は同じですが、私の興味のために、Rubyに: R、SPSS、Python、Excelなどを置き換える「統計ワークベンチ」としてRubyを使用したい場合、何をお勧めできますか? あなたの経験に基づいて、私は何を獲得し、失いますか? 以前のPythonとExcelの質問に基づいてこの質問を検討していることに注意してください。RubyとPython(またはExcel)を使用しても同じ影響があると思われる場合は、そう言って、前の質問の引数を指してください。この質問の目的は、同じ答えに対して前の質問を複製することではありません。ただし、違いはあると思います(言語の速度や構文など)が、Rubyの推奨事項や、たとえば、 PythonまたはExcel。そのため、これらの非常に類似した質問に対する他の言語/プログラムに対する以前の回答を検討してください。 編集:答えが逆になっているように見えるので、強調するために、私が探していた答えは、私がリンクしているPythonの質問で選ばれた答えのようなものです。Rubyとともに統計を学習することではありません。私はRで統計を学ぶという質問を指摘しました。可能であれば素晴らしいのですが、同時にRubyで統計を学ぶことを期待していません。この質問の統計情報の背景を推測できます。
13 r  python  software  ruby 

4
データ匿名化ソフトウェア
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 優れたデータ匿名化ソフトウェアを知っている人はいますか?または、データの匿名化を行うRのパッケージでしょうか?明らかに、解読不可能な匿名化は期待していません-難しくしたいだけです。
13 software 

3
統計ソフトウェアの使用から数式の理解への移行?
環境: 私は心理学博士課程の学生です。多くの心理学博士課程の学生と同様に、PCA、分類木、クラスター分析などの手法まで、統計ソフトウェアを使用してさまざまな統計分析を実行する方法を知っています。しかし、分析を行った理由と指標の意味を説明することはできますが、この手法がどのように機能するかを説明することはできないため、それは本当に満足のいくものではありません。 本当の問題は、統計ソフトウェアの習得は簡単ですが、制限されていることです。記事で新しいテクニックを学ぶには、数式の読み方を理解する必要があります。現在、固有値またはK平均を計算できませんでした。方程式は私にとって外国語のようなものです。 質問: 雑誌記事の方程式を理解するのに役立つ包括的なガイドはありますか? 編集: この質問はもっと自明なものだと思った。特定の複雑さを超えると、統計表記は意味が分からなくなる。テクニックを理解するためにRまたはC ++で独自の関数をコーディングしたいが、障壁があるとしましょう。方程式をプログラムに変換できません。そして本当に:私は米国の博士課程の状況を知りませんが、私の(フランス)で、私が従うことができる唯一のコースは16世紀のごく少数の運動です...

5
機械学習の問題のプロトタイプを作成するには、どのプログラミング言語をお勧めしますか?
現在Octaveで作業していますが、ドキュメントが不十分なため、進捗は非常に遅くなっています。 どの言語が学習および使用が簡単で、機械学習の問題を解決するために十分に文書化されていますか?私は小さなデータセット(数千の例)のプロトタイプを探しているので、速度は重要ではありません。 編集:私は推奨エンジンを開発しています。したがって、私は正則化線形回帰、ニューラルネット、SVN、または協調フィルタリングの使用に興味があります。

8
社会科学の統計学の学部入門コースを教えるのに適した統計ソフトウェアはどれですか?
社会科学研究プログラムの統計入門コースで使用できる統計ソフトウェアパッケージを探しています。学生は統計学の事前知識もプログラミング言語の経験もありません。目標は、基本的な統計概念(平均、分散、二乗和、p値など)を紹介し、サンプルデータセットを使用して独自に基本的な分析を実行できるようにすることです。コースは、公式を記憶するのではなく、統計を行うことによって概念を学ぶことに関するものでなければなりません(ただし、公式は重要だと思います)。 したがって、通常の構文(通常のRとして)またはポイントアンドクリック(SPSSまたはRcmdrとして)で駆動されるソフトウェアの代替手段を探しています。ソフトウェアは簡単に学習でき、データセットを視覚化して標準のグラフと表を提供する明確なグラフィカルユーザーインターフェイスを備えている必要があります。分析のさまざまなステップ(たとえば、データの読み取りと操作、説明的測定の計算、説明的テーブルとグラフの作成、推論的測定の計算、推論的グラフのプロット、レポートへのエクスポートなど)を視覚化するのが最適です。 統計の学習と最初の練習に適した(オープンソースまたは無料の)統計ソフトウェアの提案はありますか? 編集 あなたの提案をありがとう。私はに見てきたgretl、および他の二つのとプログラムは、私は自分自身のオンラインお問い合わせの際に発見した:RapidMinerおよび統計ラボ。[1] 私がいることを発見したgretlのインターフェースと出力がより明確であり、例えばRcmdr、SPSSやStataのより焦点を当てました。したがって、これは私の観点から統計を教えるための優れたツールです。 しかし、フローチャートGUIののRapidMinerとStatistical Lab統計分析の単一のステップ(データの読み込みから開始)を視覚化しているときに感動しました。これは、数学的な説明にいつも焦点を合わせることに苦労している多くの学生に役立つと思います。もちろん、RapidMinerは、初心者には機能、メニュー、ボタンが多すぎますが、Statistical Labはより集中しています。Statistical Labの大きなプラスは、Statistical Labが計算に依存しているRため、実際のR構文の生成を支援する「Rコードウィザード」を備えたコンソールのような「R-Calculator」です。 最後に、私は最初の学期に統計ラボから始めて、基本的な概念を紹介し、2番目の学期にRStudio(およびRcmdr)に切り替えることにしました。 [1]:Gnumeric、SciPy、Scilab、GNU Octaveなどは、社会科学にあまり関心がないようです。

1
AR(1)の推定におけるRおよびEViewsの違い
主な問題は次のとおりです。EViewsとRで同様のパラメーター推定を取得できません。 自分がわからない理由で、EViewsを使用して特定のデータのパラメーターを推定する必要があります。これを行うには、NLS(非線形最小二乗)オプションを選択し、次の式を使用します。indep_var c dep_var ar(1) EViewsのクレーム:彼らはAR線形推定は、(1)のような処理 ここエラーのように定義される: 等価物を使用して方程式(代数的置換あり): さらに、このスレッドはEViewsフォーラムのフォーラムでは、NLS推定はMarquardtアルゴリズムによって生成されることが示唆されています。U 、T 、U 、T = ρ ⋅ U T - 1 + ε YのT = (1 - ρ )α + ρ YのT - 1 + β X T - ρ β X T - 1 + ε トンYt=α+βXt+utYt=α+βXt+ut Y_t = \alpha + …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.