タグ付けされた質問 「machine-learning」

一部のデータセットによって「トレーニング」されるアルゴリズムに関連しています。

14
テキスト内のコードを確実に検出する簡単な方法は?
GMailにはこの機能があり、添付ファイルがあると思われるメールを送信しようとすると警告が表示されます。 GMail see the attachedは電子メールで文字列を検出したが、実際の添付ファイルは検出しなかったため、[送信]ボタンをクリックすると、[OK /キャンセル]ダイアログが表示されます。 スタックオーバーフローに関連する問題があります。つまり、ユーザーがこのような投稿を入力すると: 私の問題は、データベースを変更する必要があるが、作成しないことです 新しい接続。例: DataSet dsMasterInfo = new DataSet(); データベースdb = DatabaseFactory.CreateDatabase( "ConnectionString"); DbCommand dbCommand = db.GetStoredProcCommand( "uspGetMasterName"); このユーザーはコードをコードとしてフォーマットしませんでした! つまり、Markdownごとに4つのスペースでインデントしたり、コードボタン(またはキーボードショートカットctrl+ k)を使用してインデントしたりしませんでした。 したがって、私たちのシステムは多くの編集を受け入れており、人々は何らかの方法でこれを理解できない人のためにコードを手動でフォーマットする必要があります。これは多くの反抗につながります。エディターのヘルプを何度か改善しましたが、ユーザーの家に行き、キーボードの正しいボタンを押すだけで、次に何をすべきかわからなくなります。 そのため、Google GMailスタイルの警告を検討しています: コードを投稿するつもりでしたか? 私たちはコードのように見えるものを書きましたが、ツールバーのコードボタンまたはctrl+ kコードフォーマットコマンドを使用して、4つのスペースをインデントすることでコードとしてフォーマットしませんでした。 ただし、この警告を表示するには、質問内のフォーマットされていないコードと思われるものの存在を検出する必要があります。これを行う簡単で半信頼性の高い方法は何ですか? Markdownごとに、コードは常に4つのスペースまたはバックティック内でインデントされるため、正しくフォーマットされたものはすぐにチェックから破棄されます。 これは単なる警告であり、評判の低いユーザーが最初の質問をする(または最初の回答を提供する)場合にのみ適用されるため、約5%以下であれば、いくつかの誤検知は問題ありません。 スタックオーバーフローに関する質問はどの言語でも構いませんが、実際にはチェックを「ビッグ10」言語に制限することができます。タグページごとに、C#、Java、PHP、JavaScript、Objective-C、C、C ++、Python、Rubyになります。 Stack Overflowクリエイティブコモンズデータダンプを使用して、潜在的なソリューションを監査し(またはStack Overflowの上位10個のタグからいくつかの質問を選んで)、それがどのように機能するかを確認します。 擬似コードは問題ありませんが、使いやすくしたい場合はc#を使用します。 シンプルであればあるほど(動作する限り)。キッス!ソリューションで、10種類のコンパイラで投稿をコンパイルする必要がある場合、またはベイジアン推論エンジンを手動でトレーニングするために大勢の人がいる場合、それは...正確には思いませんでした。

5
データ分析のためのR vs Python [非公開]
私は約1年間プログラミングをしており、データ分析と機械学習に本当に興味があります。私はいくつかのオンラインコースに参加しており、いくつかの本を読んでいます。 私がしていることはすべてRまたはPythonのいずれかを使用しており、1つの言語に集中すべきか(そうであればどの言語に集中すべきか)、または両方を続けるべきかについての提案を探しています。彼らはお互いを補完しますか? -私は学校でC#を使用しているが、自習を通じてPythonに精通していることに言及する必要があります。

1
デシジョンツリーとニューラルネットワーク
この質問はして移行され、それがソフトウェア工学スタック所に答えることができるので、スタックオーバーフローから。 7年前に移行され ました。 銀行などの金融システムで不正行為を予測および予測するための機械学習構造を実装しています。カード番号、カード名義人名、金額、国など... どの構造がこの問題に最適かを判断するのに苦労しています。私は決定木の経験がありますが、現在、この種の問題に対してニューラルネットワークの方が良いかどうか疑問に思っています。また、他の方法が最適な場合は、気軽に私に教えてください。 各構造の長所と短所はどれで、どの構造がこの問題に最適でしょうか? また、この事実についてはわかりませんが、決定木は実行速度の点でニューラルネットワークよりも優れていると思います。このプロジェクトでは速度も重要な要素であるため、これは重要です。

7
コード開発に適用される機械学習
私のバックグラウンドは機械工学ですので、この分野に対する私の無知をお許しください。 プログラミングとソフトウェア開発を本当に楽しんでいます。また、最近、スタンフォード大学のAndrew Ng教授が教える無料のオンラインMachine Learning(ML)クラスを受講しました。ここにリンクします。 この教授が、MLが決して影響を与えない分野を見つけるのは難しいと言うのを聞いたことがあります。 質問 私の質問は、機械学習をコード開発に適用するためにこれまでにどのような研究が行われてきたかということです。デバッグはどうですか? 可能であれば、リソース/ソース/科学論文を含めてください。 多くの場合、ML およびソフトウェア開発(またはプログラミング)を検索すると、MLアプリケーションのソフトウェア開発(またはプログラミング)の結果につながるため、これを検索する運はありませんでした。

1
機械学習は検索エンジンの設計にどのように組み込まれていますか?
現在、Apache Luceneに基づいた小さな社内検索エンジンを構築しています。その目的は簡単です-いくつかのキーワードに基づいて、社内で書かれた記事を提案します。基本メトリックとしてかなり標準的なTF-IDFスコアリングを使用しており、その上に独自のスコアリングメカニズムを構築しています。これらのすべては、ランキングがめちゃくちゃになっているように見えるいくつかのコーナーケースを除いて、うまく機能しているようです。 したがって、私がやろうとしているのは、検索結果ページに小さな関連/非関連リンクを追加して、その結果が最初に含まれるべきかどうかの認識に応じてユーザーがそれらのいずれかをクリックできるようにすることです。 私のアイデア これらの関連/非関連をラベルとして扱い、トレーニングデータを作成します。 このデータを使用して分類器(SVMなど)をトレーニングします このモデルを検索エンジンに組み込みます。つまり、新しい結果はすべて分類子を通過し、関連性があるかどうかのラベルが割り当てられます。 このアプローチは直感的に思えますが、実際に機能するかどうかはわかりません。私には2つの具体的な質問があります。 すべての機能を抽出する必要がありますか? 機械学習コンポーネントを検索エンジンに統合するより良い方法はありますか?私の最終目標は、ビジネスロジックとユーザーフィードバックの両方に基づいてランキング関数を「学習」することです。

3
機械学習のキャリアへの切り替え[終了]
現在のところ、この質問はQ&A形式には適していません。回答は事実、参考文献、または専門知識によってサポートされると予想されますが、この質問は議論、議論、世論調査、または広範な議論を求める可能性があります。この質問を改善し、場合によっては再開できると思われる場合は、ヘルプセンターをご覧ください。 7年前に閉鎖されました。 私の仕事は、昔ながらのソフトウェア開発です。また、CSで修士号を取得しています(パートタイム、コースベース)。AIのコースを受講したところ、機械学習は非常に魅力的でしたが、ほとんどのコースと同様に基本的なイントロだけを提供しました。 私は機械学習についてさらに学び、可能であればその分野で仕事をするつもりです。この分野の求人を見ると、機械学習の博士号(またはかなりの専門知識を持つ分野での以前の経験)がそれらのほとんどに必要であることは明らかです。 業界で役立つ経験を積むために、自己学習に関するアドバイスを探しています。少なくとも、自分の足を踏み入れるのに十分な経験。教科書や論文などを読むなどの明白なことをします。おそらく、私が参加できるオープンソースの取り組みや、自分でできることはありますか? ここで私があいまいになっている場合はおologiesびしますが、同様の切り替えを行ってアドバイスできる人が少なくとも数人いることを願っています。 ありがとう!

5
定義された仕様に合わせてプログラムする方法をマシンに教えることは想像できますか?[閉まっている]
閉じた。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善したいですか?この投稿を編集して事実と引用で答えられるように質問を更新してください。 5年前に閉鎖されました。 プログラミングの知識のない友人がこの質問をしてくれたので、面白いと思いました。 問題のテキストを分析し、解決策を考え、それをプログラムできる本当に高度な人工知能が必要になるため、それは不可能だと思います。単純な計算機をプログラムできるマシンについて考えるだけでも、私にとってはかなり進んでいるように思えます。 しかし、私は間違っているかもしれませんが、それについてどう思いますか、主題に関する記事/研究を知っているのか、それがすでに存在するのか、仕様を選択し、この「仕様」に自己プログラムするマシン

2
アルゴリズムが収束することはどういう意味ですか?
強化学習について読むとき、この文に出くわします。たとえば、次の文です。 問題を慎重にモデル化すると、一部の強化学習アルゴリズムがグローバル最適に収束する可能性があります http://reinforcementlearning.ai-depot.com/ またはここ: 固定ポリシーPiの場合、上記のTDアルゴリズムはVPiに収束することが証明されています http://webdocs.cs.ualberta.ca/~sutton/book/ebook/node62.html 収束という言葉の私の理解は、同じポイントにいくつかの事が一緒に来ることを意味するということですが、単一の事(アルゴリズム)がそれをどのようにできるのでしょうか?

3
ニューラルネットワークは、「はい」または「いいえ」以上の答えを提供できますか?
私が読んだ画像認識用のニューラルネットワークの例はすべて、単純な「はい」または「いいえ」の答えを生成します。1つの出口ノードは「はい、これは人間の顔です」に対応し、もう1つの出口ノードは「いいえ、これは人間の顔ではありません」に対応します。 これは説明を簡単にするための可能性が高いことを理解していますが、より具体的な出力を提供するために、このようなニューラルネットワークをどのようにプログラムできるか疑問に思っています。たとえば、動物を分類していたとしましょう。「動物」または「動物ではない」と言う代わりに、「犬」、「魚」、「鳥」、「蛇」などの応答が必要です。これを認識しないでください」。 これは可能であるに違いないと思いますが、その方法を理解するのに苦労しています。エラーの逆伝播のトレーニングアルゴリズムが原因であるように思われます。1つの出口ノード(つまり、「これは犬です」)をトレーニングし、ニューロンの重みが変更されると、以前に別の出口ノードの理想的な状態訓練された(つまり、「これは鳥です」)が逸脱し始め、逆もまた同様です。したがって、あるカテゴリを認識するようにネットワークをトレーニングすると、別のカテゴリに対して行われたトレーニングが妨害され、単純な「はい」または「いいえ」の設計に制限されます。 これにより、そのようなレコグナイザーは不可能になりますか?または、アルゴリズムを誤解していますか?私が考えることができるのは、次の2つだけです。 分類したいものごとに1つのニューラルネットワークをトレーニングし、それらを使用して、より大きなスーパーネットワーク(たとえば、「犬」のネットワーク、「鳥」のネットワークなど)を構築します。 「動物」のスーパーネットワークを作成するために一緒に追加)。または、 信じられないほど高度な数学を必要とし、すべての可能な出力(つまりinsert math magic here)に対して理想的なニューロン重量状態を何らかの形で生成する、ある種の途方もなく複雑なトレーニング方法論を作成します。 (サイドノート1:多層パーセプトロンを一種のニューラルネットワークとして具体的に見ています。) (サイドノート2:最初の箇条書きの「可能性のある解決策」では、特定の各ニューラルネットワークを持ち、「はい」の応答を受け取るまでそれらを繰り返し処理するだけでは十分ではありません。機械学習ではなくプログラミング。情報を供給して適切な応答を受け取るために1つのニューラルネットワークを使用できるかどうかを知りたい)。

2
機械学習を学習するには、どのような数学スキルが必要ですか?[閉まっている]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新して、 Software Engineering Stack Exchangeのトピックになるようにします。 4年前に閉鎖されました。 機械学習に関するこのオンラインコースに興味があります。現状では私の数学は非常に初歩的であり、基本的にカーンアカデミーで数学をゼロから学んでいます。プログラミングに関しては、かなりの量の経験があり、全体的な理解は良好です。私の質問は、機械学習を効果的に理解して活用するには、どの数学スキルが必要ですか?

9
チェスのルールを学ぶ
同様の問題は、コンピュータがゲームの数千人を分析することによって、チェスで最適にプレイすることを学ぶことができるかどうか尋ねます。 マシンが最初と各移動後にチェスのいくつかのゲーム(またはチェッカーのいくつかのゲーム)のボードの状態を見ることができる場合、ゲームのルールを学習するようにプログラムできますか? それが可能な場合、どの程度まで(たとえば、キャスティングやプロモーションを説明できるでしょうか)、これは機能しますか?どの機械学習アルゴリズムがこれを可能にしますか?

3
適切な次の単語の予測を実現するために使用できるアルゴリズムは何ですか?
「次の単語の予測」を実装する良い方法は何ですか?たとえば、ユーザーが「私は」と入力すると、システムは次の単語として「a」と「not」(またはおそらく他の人)を提案します。私はマルコフ連鎖といくつかのトレーニングテキストを使用して(明らかに)これを達成する方法を知っています。しかし、私はこの方法が非常に制限的であり、非常に単純なケースに適用されることをどこかで読みました。 ニューラルネットワークと遺伝的アルゴリズムの基本を理解しています(深刻なプロジェクトで使用したことはありませんが)。適切なトレーニングテキスト(たとえば、新聞記事やユーザー自身の入力)が与えられると、次の単語に対して合理的に適切な提案を行うことができるアルゴリズムがあるのでしょうか。アルゴリズムではない(リンクしている)場合は、この問題を攻撃するための一般的な高レベルの方法を歓迎します。

4
機械学習を使用してソーラーアレイのミラーを目指していますか?
私は、次のEnergy Innovationsの設計と同様に、いくつかの独立したミラーが太陽光を集光する太陽光コレクタについて考えています。 この太陽電池アレイの組み立てには欠陥があるため、次の仮定(またはその欠如)を進めています。 ソフトウェアは各ミラーの「位置」を知っていますが、この位置が実際の世界や他のミラーとどのように関連しているかはわかりません。これは、ミラーのキャリブレーションが不十分であるか、1つのミラーに影響を与えるが他のミラーには影響を与えない可能性のあるその他の環境要因を説明します。 ミラーが一方向に10ユニット移動し、次に反対方向に10ユニット移動すると、最初に開始した位置に戻ります。 機械学習を使用してミラーを正しく配置し、コレクターに光の焦点を合わせたいと思います。私はこれを最適化問題としてアプローチし、ミラーの位置を最適化してコレクター内の熱と出力を最大化することを期待しています。 問題は、ノイズの多い高次元空間で小さなターゲットを見つけることです(各ミラーが2つの回転軸を持っていると考えます)。私が予想する問題のいくつかは次のとおりです。 曇りの日、完璧なミラーの配置に遭遇しても、その時期は曇っている可能性があります ノイズの多いセンサーデータ 太陽は移動するターゲットであり、パスに沿って移動し、毎日別のパスをたどります-いつでも太陽の正確な位置を計算できますが、その位置がミラーとどのように関連しているかはわかりません 私の質問は太陽電池アレイではなく、この「ノイズの多い高次元空間の小さなターゲット」の問題に役立つ可能性のある機械学習手法です。ソーラーアレイについては、この質問の触媒であり、良い例であると述べました。 ノイズの多い高次元空間でこのような小さなターゲットを見つけることができる機械学習技術はどれですか。 編集: いくつかの追加の考え: はい、現実の世界で太陽の位置を計算できますが、ミラーの位置が現実の世界とどのように関係しているかはわかりません(何らかの方法で学習した場合を除きます)。太陽の方位角が220度、太陽の仰角が60度で、鏡が(-20、42)の位置にあることがわかります。教えてください、その鏡は太陽に正しく位置合わせされていますか?分からない 非常に高度な熱測定があり、「この熱レベルでは、2つのミラーが正しく位置合わせされている必要がある」ことがわかっているとしましょう。問題は、2つ以上のミラー(25個以上)が正しく位置合わせされていることです。 私が検討した1つの解決策は、太陽の方位角と仰角を入力として受け取り、各ミラーの2つの軸に対応する各ミラーの2つの値を持つ大きな配列を出力するニューラルネットワークを使用して、正しい「アライメント関数」を近似することでした。しかし、どのトレーニング方法が最適かわかりません。 より多くの考え: ミラーにはソフトウェアがアクセスできる座標系がありますが、ソフトウェアはこの座標系が現実の世界とどのように関連しているかを知りません。ミラーが(4、42)の位置にあるとします。どういう意味ですか?私にはわかりませんし、ソフトウェアもわかりません。しかし、ミラーを移動してから(4、42)に戻すと、ミラーが以前と同じ位置になることは知っています。さらに、2つのミラーが(4、42)の位置にあっても、現実の世界では反対方向を向いている場合があります。 はい、多くの高品質センサーがあれば、問題は簡単に解決できます。Energy Innovationsは、私が知る限り、廃業しています。おそらく、彼らがたくさんの本当に素晴らしいセンサーを使用していて、人々が「私はソーラーパネルを買うだけで、安くなっている」と言ったためでしょう。 システム内の唯一のセンサーは、コレクターヘッドにあります。

2
カテゴリーデータと連続データを使用した機械学習
この質問は、ここか、そうかもしれません... トレーニングデータセットに、次のようなカテゴリデータと連続データの両方が含まれているとします。 Animal, breed, sex, age, weight, blood_pressure, annual_cost cat, calico, M, 10, 15 , 100 , 100 cat, tabby, F, 5, 10 , 80 , 200 dog, beagle, M, 3, 30 , 90 , 200 dog, lab, F, 8, 75 , 80 , 100 そして、予測される従属変数は、年間の獣医費用です。そのようなデータセットを処理するために利用できる特定の手法について、私は少し混乱しています。連続データとカテゴリデータの両方が混在するデータセットを処理するために一般的に使用される方法は何ですか?

5
画像処理を学ぶための最良の方法は何ですか?[閉まっている]
この投稿を改善してみませんか?この質問に対する詳細な回答を提供します。これには、引用と、回答が正しい理由の説明が含まれます。詳細が不十分な回答は編集または削除される場合があります。 閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新して、ソフトウェアエンジニアリングスタック交換のトピックになるようにします。 5年前休業。 私は以前に画像処理をあまり行ったことがない大学の先輩です(スマートフォンでの基本的な画像圧縮を除く)。私は次の学期の機械学習に関する研究プロジェクトを始めています。これには、生物医学的な画像処理が必要になります。約2か月で画像処理の基本に慣れるための最良の方法は何ですか?それともこれは非現実的ですか? 基本が上手くいけば、他のリソースから学ぶほうが簡単になると思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.