タグ付けされた質問 「classification」

5
単純ベイズ分類の簡単な説明
私はナイーブベイズのプロセスを理解するのが難しいと感じており、誰かが英語で簡単な段階的なプロセスでそれを説明できるかどうか疑問に思っていました。時間による比較を確率として比較することは理解していますが、トレーニングデータが実際のデータセットとどのように関連しているかはわかりません。 トレーニングセットの役割を教えてください。ここでは、果物の非常に簡単な例を示します。 training set--- round-red round-orange oblong-yellow round-red dataset---- round-red round-orange round-red round-orange oblong-yellow round-red round-orange oblong-yellow oblong-yellow round-red

6
サポートベクターマシンに対する人工ニューラルネットワークの利点は何ですか?[閉まっている]
現在のところ、この質問はQ&A形式には適していません。事実、参考文献、専門知識によって回答が裏付けられることを期待していますが、この質問は、討論、議論、投票、または拡張ディスカッションを求める可能性があります。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 7年前休業。 ANN(人工ニューラルネットワーク)とSVM(サポートベクターマシン)は、教師あり機械学習と分類の2つの一般的な戦略です。特定のプロジェクトにどちらの方法が適しているかはよくわからないことが多く、答えは常に「依存している」と確信しています。多くの場合、両方の組み合わせとベイジアン分類が使用されます。 Stackoverflowに関するこれらの質問は、ANNとSVMに関してすでに尋ねられています。 ANNおよびSVM分類 分類の質問におけるANN、SVM、KNNの違い テキスト処理用のサポートベクターマシンまたは人工ニューラルネットワーク? この質問では、ANN(具体的には、マルチレイヤーパーセプトロン)のどの側面がSVMを介して使用することが望ましいと思われるかを具体的に知りたいのですが?私が尋ねる理由は、反対の質問に答えるのが簡単だからです。サポートベクターマシンは、ANNの2つの主要な弱点を回避するため、ANNより優れていることがよくあります。 (1)ANN は、グローバルな最小値ではなくローカルな最小値に収束することがよくあります。つまり、ANN は、本質的に「全体像を見落としている」(または森の森を見逃している)ことを意味します (2)トレーニングが長すぎると、ANNはしばしばオーバーフィットします。つまり、特定のパターンについて、ANNはノイズをパターンの一部と見なし始める可能性があります。 SVMはこれらの2つの問題のどちらにも悩まされません。ただし、SVMがANNの完全な代替になることを意図していることはすぐにはわかりません。それでは、ANNはSVMに対して特定の利点を持っているため、特定の状況に適用できる可能性があります。ANNに対するSVMの特定の利点を挙げましたが、ANNの利点(ある場合)のリストを確認したいと思います。

21
データマイニングにおける分類とクラスタリングの違いは?[閉まっている]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 昨年休業。 この質問を改善する 誰かがデータマイニングにおける分類とクラスタリングの違いを説明できますか? 可能であれば、両方の例を挙げて主要なアイデアを理解してください。

6
scikit-learnで分類子をディスクに保存する
トレーニング済みの単純ベイズ分類器をディスクに保存し、それを使用してデータを予測するにはどうすればよいですか? scikit-learnのWebサイトにある次のサンプルプログラムがあります。 from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" % (iris.target != y_pred).sum()


13
Apple(Inc。)に関するツイートとApple(fruit)に関するツイートを区別するモデルを作成するにはどうすればよいですか?
「アップル」に関する50のツイートについては、以下を参照してください。私はAppleIncについてのポジティブマッチに手作業でラベルを付けました。それらは以下の1としてマークされています。 ここにいくつかの行があります: 1|“@chrisgilmer: Apple targets big business with new iOS 7 features http://bit.ly/15F9JeF ”. Finally.. A corp iTunes account! 0|“@Zach_Paull: When did green skittles change from lime to green apple? #notafan” @Skittles 1|@dtfcdvEric: @MaroneyFan11 apple inc is searching for people to help and tryout all their upcoming tablet within our …

5
scikit-learnを使用して複数のカテゴリに分類します
scikit-learnの教師あり学習方法の1つを使用して、テキストを1つ以上のカテゴリに分類しようとしています。私が試したすべてのアルゴリズムの予測関数は、1つの一致を返すだけです。 たとえば、次のようなテキストがあります。 "Theaters in New York compared to those in London" そして、フィードするすべてのテキストスニペットの場所を選択するようにアルゴリズムをトレーニングしました。 上記の例では、私はそれを返すようにしたいと思うNew YorkとLondon、それだけを返しますNew York。 scikit-learnを使用して複数の結果を返すことは可能ですか?または、次に高い確率でラベルを返しますか? ご協力いただきありがとうございます。 - -更新 使用してみましたOneVsRestClassifierが、テキストごとに1つのオプションしか返されません。以下は私が使用しているサンプルコードです y_train = ('New York','London') train_set = ("new york nyc big apple", "london uk great britain") vocab = {'new york' :0,'nyc':1,'big apple':2,'london' : 3, 'uk': 4, 'great britain' : 5} count …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.