タグ付けされた質問 「full-text-search」

全文検索では、構造化データベースのテキストフィールドを検索するのではなく、通常は非構造化テキストを含むドキュメントを検索します。

8
全文検索エンジンの比較-Lucene、Sphinx、Postgresql、MySQL?
私はDjangoサイトを構築していて、検索エンジンを探しています。 いくつかの候補者: Lucene / Lucene with Compass / Solr スフィンクス Postgresql組み込みの全文検索 MySQl組み込みの全文検索 選択基準: 結果の関連性とランキング 検索とインデックス作成の速度 使いやすさとDjangoとの統合のしやすさ リソース要件-サイトはVPSでホストされるため、理想的には検索エンジンが大量のRAMとCPUを必要としない スケーラビリティ 「もしかして?」、関連検索などの追加機能 上記の検索エンジン、またはリストにない他のエンジンでの経験がある人は誰でも-私はあなたの意見を聞きたいです。 編集:インデックス作成のニーズについては、ユーザーがサイトにデータを入力し続けると、それらのデータに継続的にインデックスを作成する必要があります。リアルタイムである必要はありませんが、理想的には新しいデータが15〜30分の遅延でインデックスに表示されます。

10
Elasticsearchのシャードとレプリカ
Elasticsearchにシャードとレプリカがあるかを理解しようとしていますが、どうにか理解できませんでした。Elasticsearchをダウンロードしてスクリプトを実行すると、知っていることから、単一ノードでクラスターを開始しました。このノード(私のPC)には5つのシャード(?)といくつかのレプリカ(?)があります。 それらは何ですか、インデックスの5つの重複がありますか?もしそうなら、なぜですか?説明が必要かもしれません。


4
ElasticSearch初心者向けガイド[終了]
現在のところ、この質問はQ&A形式には適していません。私たちは回答が事実、参考文献、または専門知識によってサポートされることを期待しますが、この質問はおそらく議論、議論、投票、または拡張された議論を誘います。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 7年前休業。 そこ(私の知っていること)ElasticSearchについての本となって、としていないhttp://www.elasticsearch.org/guide/を参照だけが含まれているようです。 特に異なるマッピングおよびインデックス作成戦略の観点から、おそらく例による、良い初心者向けガイドまたはチュートリアルはありますか?

5
スタンドアロンの全文検索サーバーの選択:SphinxまたはSOLR?[閉まっている]
現在のところ、この質問はQ&A形式には適していません。回答は事実、参考文献、専門知識によって裏付けられると期待していますが、この質問は、議論、議論、投票、または拡張ディスカッションを求める可能性があります。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 8年前に閉鎖。 次のプロパティを備えたスタンドアロンのフルテキスト検索サーバーを探しています。 複数のクライアントからの検索要求を処理できるスタンドアロンサーバーとして動作する必要がある SQLクエリの結果にインデックスを付けることで「一括インデックス作成」を実行できる必要があります。たとえば、「SELECT id、text_to_index FROM documents;」と言います。 フリーソフトウェアでなければならず、データベースとしてMySQLを使用するLinuxで実行する必要があります 高速でなければならない(MySQLの内部全文検索を除外) これらのプロパティを持つ代替案は次のとおりです。 Solr(Luceneベース) ElasticSearch(これもLuceneに基づいています) スフィンクス 私の質問: 彼らはどのように比較しますか? 代替案を見逃しましたか? ユースケースはそれぞれ異なりますが、特定のパッケージを使用したくない場合がありますか?

6
インデックスを作成せずにファイル内の文字列を検索するツール[終了]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 4年前休業。 この質問を改善する 信じられないほど古いレガシーアプリケーションの一部の接続文字列を変更する必要があり、それを作成したプログラマーは、アプリ全体に接続文字列を配置するのは素晴らしいアイデアだと考えました。 Visual Studioの「現在のプロジェクト」の検索は信じられないほど遅く、私はWindows Searchを信頼していません。 それで、そこにある最高の無料の非インデックス付きテキスト検索ツールは何ですか?フォルダとそのサブフォルダ内に必要な文字列を含むファイルのリストを返すだけです。 Windows 2003 Serverを実行しています。

16
Subversion履歴の検索(全文)
すべての履歴を含む、Subversionリポジトリの全文検索を実行する方法はありますか? たとえば、どこかで使用した機能を作成しましたが、それは必要なかったので、ファイルをsvn rm'dしましたが、別の目的で使用するために、もう一度見つける必要があります。svnのログはおそらく「削除された未使用のもの」のようなものを言っており、そのようなチェックインがたくさんあります。 2016-04-15を編集:「全文検索」という用語でここで尋ねられるのは、ファイル名やコミットメッセージではなく、コミット履歴の実際の差分を検索することです。私がこれを指摘しているのは、上記の著者の言い回しがそれをあまり反映していないためです。彼の例では、ファイル名やコミットメッセージのみを探している可能性もあるからです。したがって、svn log回答とコメントの多く。

6
全文検索とLIKEとは
SQLの「全文検索」についての投稿を読んだところです。 FTSとLIKEの違いは何だろうと思っていました。私はいくつかの記事を読みましたが、それをうまく説明するものは何も見つかりませんでした。

7
フルテキストインデックスが作成されていないため、テーブルまたはインデックス付きビューでCONTAINSまたはFREETEXT述語を使用できません
SQL Server 2008 R2データベースで次のエラーが発生します。 フルテキストインデックスが作成されていないため、テーブルまたはインデックス付きビュー 'tblArmy'でCONTAINSor FREETEXT述語を使用できません。

9
InnoDBによる全文検索
私は、大量のWebアプリケーションを開発しています。その一部は、ディスカッション投稿のMySQLデータベースであり、スムーズに20M +行に成長する必要があります。 もともとはテーブルに(組み込みの全文検索機能用に)MyISAMを使用することを計画していましたが、1回の書き込み操作でテーブル全体がロックされていると思ってシャッターを切っていました。行レベルのロックは非常に理にかなっています(巨大なテーブルを処理するときのInnoDBの他の速度の利点は言うまでもありません)。したがって、このため、私はInnoDBを使用することをかなり決心しています。 問題は... InnoDBにはフルテキスト検索機能が組み込まれていません。 サードパーティの検索システムを使用する必要がありますか?同様のLucene(C ++) / スフィンクス?データベース忍者に提案やガイダンスはありますか?LinkedInのzoie(Luceneをベースとする)は現時点で最良のオプションのようです...リアルタイム機能を中心に構築されている(これは私のアプリケーションにとって非常に重要です。)私はまだ洞察を得ずにコミットすることを少しためらっています... (参考:フロントエンドにサービスを提供するためにPHPを使用して、ハイメモリリグを備えたEC2に参加します)

3
ファセット検索とは何ですか?
全文検索のコンテキストでのファセット検索とは正確には何ですか? ウィキペディアからも読みましたが、使い方やメリットがよくわかりませんでした。コミュニティがいくつかの良い例で答え/拡張し、説明できることを願っています。 注:現在、さまざまなオープン検索フルテキスト検索エンジンを評価/調査しています。ほとんどの場合、ファセット検索が機能の1つとしてリストされています。したがって、これが私たちのアプリケーション要件に役立つかどうかを評価しようとしています。

2
Androidでの全文検索の例
Androidで全文検索(FTS)を使用する方法を理解するのに苦労しています。FTS3およびFTS4拡張機能に関するSQLiteのドキュメントを読みました。そして私はAndroidでそれが可能であることを知っています。しかし、理解できる例を見つけるのに苦労しています。 基本的なデータベースモデル SQLiteデータベーステーブル(名前付きexample_table)には4つの列があります。ただし、text_column全文検索でインデックスを作成する必要がある列(名前付き)は1つだけです。のすべての行にtext_columnは、0〜1000語の長さのテキストが含まれています。行の総数が10,000を超えています。 テーブルやFTS仮想テーブルをどのように設定しますか? どのようにFTSクエリを実行しtext_columnますか? その他の注意事項: インデックスを作成する必要があるのは1つの列のみであるため、FTSテーブルを使用する(および削除するexample_table)だけでは、FTS以外のクエリでは非効率になります。 このような大きなテーブルの場合text_column、FTSテーブルにの重複エントリを格納することは望ましくありません。この投稿では、外部コンテンツテーブルの使用を提案しています。 外部コンテンツテーブルはFTS4を使用しますが、FTS4はAndroid API11より前ではサポートされていません。答えはAPI> = 11と想定できますが、より低いバージョンをサポートするためのオプションについてコメントすることは役に立ちます。 元のテーブルのデータを変更しても、FTSテーブルは自動的に更新されません(その逆も同様です)。この基本的な例では、回答にトリガーを含める必要はありませんが、それでも役立ちます。

4
VisualStudioで実際にすべてのファイルを検索する方法
VisualStudioを使用しています。たとえば、UtilsクラスにFooBar()という名前の静的パブリックメソッドがあるとします。また、多くの.aspxファイルでこの方法を使用しているとしましょう。FooBar()のメソッドシグネチャをFooBar(string)に変更し、その後、Utils.FooBarのすべてのインスタンスを見つけて、それらを更新できるようにしたいとします。 ここで、ソリューションエクスプローラーの検索ボックスに移動し、[ファイルの内容内を検索]を選択して、「Utils」と入力するとします。私はどこでもUtils。*メソッド呼び出しを行っているという事実にもかかわらず、表示されるのはUtils.csファイルだけです。「Utils.FooBar」と入力し続けると、何も表示されません。 現在、通常のウィンドウ検索もかなり役に立たないので、cygwinウィンドウを起動してgrepを使用しています。しかし、VisualStudioのすべてのファイル内を検索する実際の方法が必要なようです。私は何かが足りないのですか?

4
MySQL match()against()-関連性と列による順序?
さて、私は複数の列で全文検索をしようとしています。これは次のような単純なものです。 SELECT * FROM pages WHERE MATCH(head, body) AGAINST('some words' IN BOOLEAN MODE) 今、私は関連性によって注文したいと思います(単語がいくつ見つかりましたか?)これは私がこのようなことで行うことができました: SELECT * , MATCH (head, body) AGAINST ('some words' IN BOOLEAN MODE) AS relevance FROM pages WHERE MATCH (head, body) AGAINST ('some words' IN BOOLEAN MODE) ORDER BY relevance 迷子になった部分が来ましたhead。コラムの関連性を優先したいと思います。 1つはfor head、もう1つはforの2つの関連性列を作成できると思いますbodyが、その時点で、テーブルで同じ検索を3回実行します。この関数を作成するためには、パフォーマンスが重要です。クエリは結合され、他のテーブルと照合されます。 だから、私の主な質問は、関連性を検索し、特定の列に優先順位を付けるためのより速い方法はありますか?(そしてボーナスとして、おそらく関連性を列に単語が出現する回数を数えることさえできますか?) どんな提案やアドバイスも素晴らしいでしょう。 注:これはLAMPサーバーで実行します。(ローカルテストでのWAMP)

2
PostgreSQL(全文検索)とElasticSearch
こんにちは私は私のサービスに検索機能を実装する前にいくつかの研究をしています。現在、PostgreSQLをメインストレージとして使用しています。私は間違いなくPostgreSQLの組み込みの全文検索を使用できますが、問題はデータが複数のテーブルに分散していることです。 私のサービスはeコマースWebサイトです。したがって、顧客が「良いappleラップトップ」を検索した場合、すべての投稿を完全に検索するには、Brandテーブル、postテーブル、およびreviewテーブル(1つの投稿は複数のレビューと短い要約の組み合わせ)を結合する必要があります。elasticsearchを使用する場合、前処理により完全な投稿を挿入できます。 私の調査によると、PostgreSQLのFTSとelasticsearchは同じようなパフォーマンスを発揮するという人もいれば、elasticsearchの方が速いと言う人もいます。私の場合、どちらがより良い解決策でしょうか? 前もって感謝します

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.