論文名のリストが非常に長い場合、インターネットまたはデータベースからこれらの論文の要約を取得するにはどうすればよいですか?
紙の名前は「公衆衛生の領域のためのWebマイニングにおけるユーティリティの評価」のようなものです。
誰かが私に解決策を与えることができるAPIを知っていますか?Google学者をクロールしようとしましたが、Googleがクローラーをブロックしました。
2
これには一般的なAPIがあるとは思いません。Academia.edu、出版社のサイトなどのさまざまなサービスをクロールしてみてください。それでも、最初にドキュメントのローカルデータベースを構築し、次に要約の抽出を試す方が簡単です。
—
Wojciech Walczak
ご回答有難うございます!このためにローカルデータベースを既に構築しています。さまざまなサービスからのクロールの問題は、各Webサイトの解析ルールを作成する必要があることです。
—
アレックスガオ
では、PDFをTXTに変換してから、正規表現で要約を抽出するのはどうでしょうか。
—
ヴォイチェフヴァルザック
THX!ただし、契約では、論文の大量ダウンロードは許可されていません。これは頭痛の種です。
—
アレックスガオ