タグ付けされた質問 「search-engine」

1
機械学習は検索エンジンの設計にどのように組み込まれていますか?
現在、Apache Luceneに基づいた小さな社内検索エンジンを構築しています。その目的は簡単です-いくつかのキーワードに基づいて、社内で書かれた記事を提案します。基本メトリックとしてかなり標準的なTF-IDFスコアリングを使用しており、その上に独自のスコアリングメカニズムを構築しています。これらのすべては、ランキングがめちゃくちゃになっているように見えるいくつかのコーナーケースを除いて、うまく機能しているようです。 したがって、私がやろうとしているのは、検索結果ページに小さな関連/非関連リンクを追加して、その結果が最初に含まれるべきかどうかの認識に応じてユーザーがそれらのいずれかをクリックできるようにすることです。 私のアイデア これらの関連/非関連をラベルとして扱い、トレーニングデータを作成します。 このデータを使用して分類器(SVMなど)をトレーニングします このモデルを検索エンジンに組み込みます。つまり、新しい結果はすべて分類子を通過し、関連性があるかどうかのラベルが割り当てられます。 このアプローチは直感的に思えますが、実際に機能するかどうかはわかりません。私には2つの具体的な質問があります。 すべての機能を抽出する必要がありますか? 機械学習コンポーネントを検索エンジンに統合するより良い方法はありますか?私の最終目標は、ビジネスロジックとユーザーフィードバックの両方に基づいてランキング関数を「学習」することです。

6
Goプログラミング言語に関連する情報を検索する方法は?
Go言語を殺すようなものがあれば、それは名前です。 クエリで "Go"を使用するだけでは、Webに関連するものを見つけるのは非常に困難です。単語は、英語で最も頻繁にあります。したがって、Go関連のものを除くすべての結果が表示されます。この言語のスポンサーであり、私が検索したものを追跡することで有名なGoogleでさえ、私は英語の文法ではなくプログラミング言語にとても興味があるプログラマーを追跡できません。 英語の文法に関連する結果を除く、プログラミング言語自体に関連する情報を検索する方法は? 例えば、誰かがGoについて彼の観察に言及しているブログ投稿を想像してください。彼は、おそらく「goプログラミング言語」のような検索しやすい文章を使用しないでしょう。おそらく「Goには好きなものが1つあります」。
15 search-engine  go 

4
検索エンジンを構築したい場合、どうすれば開始できますか?[閉まっている]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 5年前休業。 誰かが私を正しい方向に向けることができますか?私はコードを書く経験は本当にありませんが、私は速い学習者です。簡単だと言っているわけではありませんが、誰かが私を助けてくれることを願っています...

1
検索テキストのトークン化に適した手法
検索エンジンが行うのと同じまたは同様の方法で一部のテキストをトークン化する方法を探しています。 これを行う理由は、トークンに対して統計分析を実行できるようにするためです。私たちが使用している言語はpythonであるため、その言語で機能するテクニックを好みますが、必要に応じて別の言語を使用するように設定することもできます。 例 元のトークン: 私たちはいくつかの素晴らしいブリトーを持っています! より簡略化:(複数形と句読点を削除) 私たちはいくつかの素晴らしいブリトーを持っています さらに簡略化:(余分な単語を削除) 素晴らしいブリトー 最良:(肯定的および否定的な意味を認識する): ブリトー-ポジティブ-
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.