ウェブサイトでGoogle検索を使用することは悪い考えですか?


11

多数のレコードを含むWebアプリケーションがある場合、WebサイトでGoogle検索を使用することは悪い考えですか?検索機能を作成してパフォーマンスの問題に対処する代わりに、検索機能をGoogleに「外部委託」します。


1
これは私の好奇心に私をもたらします、質問に詳細を提供できますか?これは悪い考えかもしれないと思いますか?あなたはそれが悪い考えだと思うようになるより多くのドキュメントがありますか?あなたはこれを理解したと思った何かを読みましたか?
RTOSkit 2013年

こんにちは@RTOSkit、私はいくつかの小さなWebアプリケーションを開発しましたが、検索機能は依然として最大の課題の1つのままです。検索結果の正確さだけでなく、サーバーのパフォーマンスも考慮する必要があります。個人的には、それはそんなに悪い考えではないと思いますが、あなたが開発したものではないアプリケーションの唯一の部分であるため、いくぶん「厄介」です。
John Doe

わかりました、@ JCL1178 が最適な答えを提供してくれました。
RTOSkit 2013年

回答:


3

JCL1178が回答で述べたように、Googleはインデックスに登録されたものの結果のみを返します。これは、結果の一部が表示されない可能性があるだけでなく、何らかの理由でサイトのインデックスが解除された場合、Webサイトからの検索が失われることを意味します。サポートされていないサードパーティのサービスを検索に依存するほど重要なことは危険です。

データに直接アクセスできるため、 Googleや他の検索エンジンよりもはるかに優れたきめ細かな検索を提供できます。ユーザーが特定のフィールドを検索できるようにして、関連のないフィールドからの他のヒットを除外できます。Googleは検索している値との関連性がないため、「Smith」ファミリーを検索すると、「Smith St.」に住んでいる人に結果が表示される可能性があります。または「鍛冶屋」の職業を持つ人。

人気のあるリレーショナルデータベースのほとんどは、全文検索を実行する機能を備えているため、基本的な検索機能の追加は、いくつかのSQLステートメントを書くのと同じくらい簡単です。

私はウェブサイトでの一般的な検索にGoogleカスタム検索エンジンを使用していますが、フルテキスト検索を実行する機能が制限されていない限り(ソフトウェアの制限、ハードウェアによるパフォーマンスの問題/)、データベースに保存されている情報の検索には使用しません。データセットのサイズ)。データの複雑さ、およびデータのナビゲートにおける検索の重要性によって異なりますが、独自の検索機能を提供することは、私にとって最も安全な方法のようです。


すべての非常に良い点と私は完全に私の応答でインデックスを解除する可能性をスキップしました。
JCL1178 2013年

@Jacob Humeさん、こんにちは。サードパーティのサービスに依存することについての素晴らしい点があります。それも頭に浮かんできました。全文検索やさまざまな検索エンジンを試してみましたが、私のコメントの1つで述べたように、結果の正確さやサーバーのパフォーマンスのいずれかに常に問題があります。繰り返しますが、ご入力いただきありがとうございます。
John Doe 2013年

3
したがって、検索が0.00001%の確率で停止するのではなく(実際に愚かなことをしない限り、Googleがサイトのインデックスを解除することはありません)、サイトに単純な全文検索の実装があることを提案しています。時間の100%?良いトレードオフのIMOではありません。全文検索は、基本的な検索機能にすばやくアクセスするための非常に便利な機能ですが、便利な検索機能を構築することは、Googleほどユーザーフレンドリーではありませんが、単に「いくつかのSQLステートメントを書く」よりも少し複雑です。
Lèseはmajesté

2
Google、Solr、Lucene、Sphinxなどの実際の検索エンジンは、キーワードの近接性、部分文字列検索、レーベンシュタイン距離/メタフォン/単語ステミング/あいまいテキスト検索など、使いやすさを大幅に向上させることできます。全文検索は良い出発点ですが、関連する結果を一貫して返すことができる適切な検索機能を構築するには、実際にはより多くの作業が必要です。検索エンジン開発の専門家ではないほとんどの開発者は、サードパーティのサービスを使用するか、少なくともLuceneやSolrなどの実績のある既成のソリューションを使用することをお勧めします。
Lèseはmajesté

2
Oracleのような大企業でさえ、社内で有用なサイト全体の検索を作成するのに苦労しています(Oracleの買収前後のMySQL.comのドキュメント検索を比較してください)。また、Googleの検索エンジンの特性は、おそらく業界で最も高度なヒューリスティックスとユーザー意図の予測アルゴリズムを実際に使用するGoogleの検索エンジンよりも、自社開発の全文検索に適しています。
Lèseはmajesté

7

この回答の目的のために私はあなたが話していると仮定しているGoogleカスタム検索/サイト内検索ではなく、Google検索アプライアンス 高価なものとはいえ、非常に良いアイデアでしょう。

検索をGoogleカスタム検索に外部委託することは悪い考えではありませんが、Googleの制限とルールにより、サイト/ビジネスモデル/その他に最適ではない場合があります。

カスタム検索はsearch terms site: yoursite.comsite: yoursite.comパーツを指定する必要がなく、検索フォームをサイトに埋め込むことができることを除いて、基本的にGoogleへの入力と同じです。Site Searchは、より多くのカスタマイズオプションとAPIへの一部のアクセス権を持つカスタム検索の非フリーバージョンです。カスタム/サイト検索とGoogle本体の使用には、リンクされたドキュメントで説明されている他の違いがありますが、重要なことは、Googleが認識できるものでのみ機能することです。

したがって、カスタム検索が正確な結果を実際に返すためには、Webアプリケーションの「多数のレコード」がGoogleによって完全にスパイダーされる必要があります。何らかの理由でレコードを一般公開から制限または保護する場合、ログアウトしたユーザーに表示されるのと同じ結果をGoogleに表示するか、Googleにコンテンツ全体をインデックス登録させることができますが、First Click Freeルールを遵守する必要があります。または怒っているパンダに食べられる危険があります。Googleに1つ、訪問者に別のものを提示すると、クローキングが発生し、サイトにペナルティが発生します。検索結果に含めたいすべてのレコードが何らかの理由でスパイダー化できない場合、特定のモデルではGoogleカスタム検索またはサイト検索を使用することはお勧めできません。

ただし、すべてのインデックス作成を許可できる場合は、Googleがカスタム検索の検索結果を返す方法(またはSite Searchに料金を支払って修正しない)を気にせず、重要なページがインデックスに登録されない危険を冒すことになります。何らかの理由で、それを真剣に検討することができます。


1

サイトのすべてのデータを他のユーザーにも見られるようにしたい場合は、Google検索を使用することをお勧めします。それはコーディングの余分なビットを節約します。

それがクローズドシステムであり、他の人にデータを見られたくない場合は、独自の検索システムを入手してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.