Luceneに関するドキュメントを読んだ。また、私はこのリンク(http://lucene.sourceforge.net/talks/pisa)のドキュメントを読みました。
Luceneがドキュメントにインデックスを付ける方法と、Luceneがインデックス付けに使用するアルゴリズムがわかりません。
上記のリンクでは、Luceneがこのアルゴリズムをインデックス作成に使用していると述べています。
- 増分アルゴリズム:
- セグメントインデックスのスタックを維持する
- 着信ドキュメントごとにインデックスを作成する
- スタックに新しいインデックスをプッシュする
- b = 10をマージファクターとします。M = 8
for (size = 1; size < M; size *= b) {
if (there are b indexes with size docs on top of the stack) {
pop them off the stack;
merge them into a single index;
push the merged index onto the stack;
} else {
break;
}
}
このアルゴリズムはどのようにして最適化されたインデックスを提供しますか?
Luceneは、Bツリーアルゴリズムまたはそのような他のアルゴリズムをインデックス作成に使用しますか、または特定のアルゴリズムを持っていますか?