タグ付けされた質問 「lucene」

Luceneという用語は、オープンソースのJava全文検索エンジンライブラリを指しますが、lucene.net、solr、elasticsearch、zend-search-luceneなど、その周りで成長したエコシステム全体も指します。

12
Solr対ElasticSearch [終了]
休業。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善してみませんか?この投稿を編集して、事実と引用で回答できるように質問を更新してください。 昨年休業。 これらのテクノロジー間のアーキテクチャの主な違いは何ですか? また、一般的にどのユースケースがそれぞれに適していますか?

9
ElasticSearch、Sphinx、Lucene、Solr、Xapian。どちらがどの用途に適していますか?[閉まっている]
現在のところ、この質問はQ&A形式には適していません。事実、参考文献、専門知識によって回答が裏付けられることを期待していますが、この質問は、討論、議論、投票、または拡張ディスカッションを求める可能性があります。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 7年前休業。 私は現在、巨大なSQLクエリではなく、他の検索方法を検討しています。私が見たelasticsearch最近とで演奏ヒューという音(検索エンジンのPython実装)。 選択の理由を教えてください。

8
全文検索エンジンの比較-Lucene、Sphinx、Postgresql、MySQL?
私はDjangoサイトを構築していて、検索エンジンを探しています。 いくつかの候補者: Lucene / Lucene with Compass / Solr スフィンクス Postgresql組み込みの全文検索 MySQl組み込みの全文検索 選択基準: 結果の関連性とランキング 検索とインデックス作成の速度 使いやすさとDjangoとの統合のしやすさ リソース要件-サイトはVPSでホストされるため、理想的には検索エンジンが大量のRAMとCPUを必要としない スケーラビリティ 「もしかして?」、関連検索などの追加機能 上記の検索エンジン、またはリストにない他のエンジンでの経験がある人は誰でも-私はあなたの意見を聞きたいです。 編集:インデックス作成のニーズについては、ユーザーがサイトにデータを入力し続けると、それらのデータに継続的にインデックスを作成する必要があります。リアルタイムである必要はありませんが、理想的には新しいデータが15〜30分の遅延でインデックスに表示されます。

10
データベースとしてのNoSQL(MongoDB)とLucene(またはSolr)
ドキュメントベースのデータベースに基づいて成長するNoSQLの動きに伴い、最近、MongoDBを検討しました。Lucene(およびSolrのユーザー)と同様に、アイテムを「ドキュメント」として扱う方法との驚くべき類似性に気づきました。 それで、質問:Lucene(またはSolr)よりもNoSQL(MongoDB、Cassandra、CouchDBなど)を「データベース」として使用する理由は何ですか? 私が(そして他の人も確実に)答えを探しているのは、それらのいくつかの詳細な比較です。リレーショナルデータベースのディスカッションは、目的が異なるため、まとめてスキップしてみましょう。 Luceneには、強力な検索や重み付けシステムなど、いくつかの深刻な利点があります。Solrのファセットは言うまでもありません(SolrはすぐにLuceneに統合されます、そうです!)。Luceneドキュメントを使用してIDを保存し、MongoDBと同じようにドキュメントにアクセスできます。それをSolrと組み合わせると、WebServiceベースの負荷分散ソリューションが得られます。 MongoDBの同様のデータ保存とスケーラビリティについて話すとき、VelocityやMemCachedなどのアウトオブプロセスキャッシュプロバイダーの比較を投入することもできます。 MongoDBに関する制限はMemCachedの使用を思い出させますが、MicrosoftのVelocityを使用して、MongoDBよりもグループ化とリスト収集の機能を強化できます(私はそう思います)。メモリにデータをキャッシュするよりも高速またはスケーラブルなものを取得できません。Luceneにもメモリプロバイダーがあります。 MongoDB(およびその他)には、APIの使いやすさなど、いくつかの利点があります。ドキュメントを新規作成し、IDを作成して保存します。できました。簡単です。

5
スタンドアロンの全文検索サーバーの選択:SphinxまたはSOLR?[閉まっている]
現在のところ、この質問はQ&A形式には適していません。回答は事実、参考文献、専門知識によって裏付けられると期待していますが、この質問は、議論、議論、投票、または拡張ディスカッションを求める可能性があります。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 8年前に閉鎖。 次のプロパティを備えたスタンドアロンのフルテキスト検索サーバーを探しています。 複数のクライアントからの検索要求を処理できるスタンドアロンサーバーとして動作する必要がある SQLクエリの結果にインデックスを付けることで「一括インデックス作成」を実行できる必要があります。たとえば、「SELECT id、text_to_index FROM documents;」と言います。 フリーソフトウェアでなければならず、データベースとしてMySQLを使用するLinuxで実行する必要があります 高速でなければならない(MySQLの内部全文検索を除外) これらのプロパティを持つ代替案は次のとおりです。 Solr(Luceneベース) ElasticSearch(これもLuceneに基づいています) スフィンクス 私の質問: 彼らはどのように比較しますか? 代替案を見逃しましたか? ユースケースはそれぞれ異なりますが、特定のパッケージを使用したくない場合がありますか?

7
SolrとLuceneの違い
LuceneとSolrは2つの異なるApacheプロジェクトであり、一緒に動作するように作られていることは知っていますが、各プロジェクトの目的がわかりません。 これまで私が理解していたことは、Luceneは検索インデックスの作成に使用され、Solrはこのインデックスを使用して検索を実行するということです。私は正しいのですか、これはまったく異なるアプローチですか?
163 java  solr  lucene 


7
空のフィールドのSOLRをクエリする方法は?
Solrインデックスが大きく、一部のフィールドが正しく更新されていないことに気付きました(インデックスは動的です)。 これにより、一部のフィールドに「id」フィールドが空になります。 私はこれらのクエリを試しましたが、うまくいきませんでした: id:'' id:NULL id:null id:"" id: id:['' TO *] 空のフィールドをクエリする方法はありますか? ありがとう
112 solr  lucene 

8
ElasticsearchとCassandraの比較vs Cassandraを使用したElasticsearch
私はNoSQLを学び、クライアントの要件の1つに対するさまざまなオプションを検討しています。私はこの質問をする前にさまざまなリソースを調べました(NoSQLの知識がほとんどない人) より高速にデータを保存し、データを読み取る必要があります。 完全なフェイルセーフで簡単に拡張可能。 アナリティクスのデータを検索できる。 私は最終的には短いリストになりました: Cassandra and Elasticsearch 私が理解しているのは、Cassandraが私にとって完璧なNoSQLストレージソリューションであることです。これは、インデックスを使用してデータの書き込みと読み取りができるためです。失敗するか、失敗する可能性があるのは、アナリティクスです。将来、からデータを取得したい場合from_date to to_dateや、分析用のデータを取得する方法が増えた場合、データモデルを適切に設計しなかったり、長期的な視野を維持しなかったりすると、変化する世界では非常に困難になる可能性があります。 一方Elastic Search、(Luceneに裏打ちされた)インデックス作成は最適であり、ランダムなテキストをスローすることでランダムにデータを検索できます。しかし、データを取得したい場合でも同じように機能しますか(そうなると思いfrom_date to to_dateます)。しかし、本当の問題は、それが検索エンジンなのか、それともCassandraのような完璧なNoSQLデータストレージなのか、です。はいの場合、なぜまだCassandraが必要なのですか? これらの両方が異なる世界にある場合は、それについて説明してください!それらを組み合わせてより効果的なソリューションを得るにはどうすればよいですか?

2
Luceneアナライザーの比較
誰かがLucene内の異なるアナライザーの違いを説明できますか?maxClauseCount例外が発生し、KeywordAnalyzerを使用することでこれを回避できることを理解していますが、アナライザーを取り巻く問題を理解せずにStandardAnalyzerから変更したくありません。どうもありがとう。
104 lucene  analyzer 

4
どのようにドキュメントをルセンインデックス化しますか?
Luceneに関するドキュメントを読んだ。また、私はこのリンク(http://lucene.sourceforge.net/talks/pisa)のドキュメントを読みました。 Luceneがドキュメントにインデックスを付ける方法と、Luceneがインデックス付けに使用するアルゴリズムがわかりません。 上記のリンクでは、Luceneがこのアルゴリズムをインデックス作成に使用していると述べています。 増分アルゴリズム: セグメントインデックスのスタックを維持する 着信ドキュメントごとにインデックスを作成する スタックに新しいインデックスをプッシュする b = 10をマージファクターとします。M = 8 for (size = 1; size < M; size *= b) { if (there are b indexes with size docs on top of the stack) { pop them off the stack; merge them into a single index; push the …

4
Luceneの仕組み
lucene検索がどのように高速に機能するかを知りたいのですが。ウェブ上で役立つドキュメントが見つかりません。(luceneのソースコード以外の)読むものがあれば、私に知らせてください。 インデックス付きのmysql5テキスト検索を使用したテキスト検索クエリは、私の場合約18分かかります。同じクエリのLucene検索には1秒もかかりません。
90 lucene 

7
solrクエリでORとNOTを使用する
私は次のようなSolrクエリに取り組んでいます: ((myField:superneat AND myOtherField:somethingElse) OR NOT myField:superneat) これを実行すると、結果は返されません。OR NOTのいずれかの側で基準を使用すると、期待どおりの結果が返されます。これらは、一緒にうまく機能していないだけです。場合にはmyFieldでは一致したsuperneatを、私はまたことを保証することを意図していmyOtherFieldがに設定されているsomethingElseが、場合myFieldではないsuperneat、結果に含めます。 solrがこの種のクエリの結果を返さない理由を誰かが説明できますか?クエリを何らかの方法で再構築する必要がありますか?それとも、solrを使用して目的の結果を達成するための別の方法がありますか?
83 search  lucene  solr 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.