情報の取得とは、特定のクエリまたは関心のあるフィールドに関連する情報を返すことです。この情報は一般的なドキュメントの形式である場合もあります。十分な検索エンジンがそのようなタスクの注目すべき例であることを確認してください。情報検索で認識できる最も重要なエンティティは、ドキュメント/情報の最初のセットと、「何を検索するか」を指定するクエリです。
一方、情報抽出とは、一連のドキュメントまたは情報から一般的な知識(または関係)を抽出(または推測)することです。ここで、ドキュメントのすべてのコンテンツは、知識を抽出するデータのコーパス全体と見なすことができます。もちろん、この場合でも、何を抽出するかをどうにか指定できますが、それは特定の主題/トピックよりもプロパティ/関係についてです。プロパティはドメイン固有ですが、一般的にリレーションはより一般的なシナリオをカバーしています。
繰り返しますが、検索エンジンでは、特定の主題に関する情報を含む可能性が最も高いサイトを取得するように求めています。情報検索の例です。
以下のための情報抽出あなたの代わりに、例えば、文書のコーパスに表示されるすべての都市の名前、または電子メールアドレスを抽出するために求めることができます。単純に知識を抽出するように依頼して、はるかに一般的なものにすることもできます。ご覧のとおり、これは非常に一般的ですが、たとえば、テキストの有効な文ごとにsubject-action-objectという形式のトリプレットを取得することで実現できます(これは自然言語テキストに最適です)。
これらの(およびその他の)トピックに興味がある場合は、 『Arti ficial Intelligence:A Modern Approach』の自然言語処理の章で詳しく説明しています。