回答:
確かに、何らかの形式のテキストマイニング/情報検索/などを含む研究プロジェクトがあったようです。およびStackExchangeサイト。
google / google scholarで見つけることができたいくつかの例(完全なリストの近くにはない可能性が高い):
より一般的には、自動化された質問応答システムは、ささいな/「解決された」問題ではなく、依然としてかなり活発な研究分野のようです。StackExchangeは、このようなシステムのデータソースの1つですが、他のデータソースも多数あります(Wikipedia、Quoraなど)。
DuckDuckGoは、StackExchangeから技術的な質問への回答を学習します。「進行中のプロジェクトはstackexchangeを使用しています」などの技術的な質問をDuckDuckGoに入力すると、右側に回答の概要が強調表示されます。また、アヒルには、質問応答データソースの多く(100代)のためのオープンAPIがあります。または、stackexchange apiに直接アクセスできます。
プロジェクトは、TOUに準拠している限り、SEオープンAPIからのデータを使用できます。基本的には、ユーザーがStack Exchangeからのデータであることを確認できるようにしてください。また、著作権ライセンスは、テキストの内容を変更する能力を制限する場合があります(学習した抽象的要約機能など)。おそらくそれが、Duck.comが単にキーワードを強調する理由です。
特に、サイトに送信したデータと、そのデータから派生した機械学習モデルに関しては、データ権利法は流動的です。ヨーロッパの新しいデータおよびプライバシー規則により、スタック交換などのサイトに送信したすべてのデータをダウンロードまたは削除できます。