回答:
LogicalDOCコミュニティ は、この目的に使用できます。多くのファイルタイプをカタログ化してタグ付けすることができ、無料のOCRが組み込まれています。
このパッケージで私が本当に気に入っている機能の1つは、言語固有の検索をネイティブに実行できる全文検索エンジンです。
Ubuntuにインストールするための優れたドキュメントがあります。これには特別な問題はありません。
アーカイブニーズに役立つ複数のオープンソースドキュメント管理システムとスキャンソリューションがあります。ドキュメント管理には次のものがあります。
pip install mayan-edsm
)スキャンソフトウェアに関しては、いくつかのオープンソースオプションがありますが、パフォーマンスがあまり良くありません。アーカイブの対象(および今後のアクセス方法)に応じて、管理ソフトウェア内でドキュメントにタグを付けることができます。また、...フリーウェアスキャンアプリケーションでOCRが見つかることはほとんどありません。
オプションがある場合は、ドキュメント変換プロジェクトのアウトソーシングを強くお勧めします。あなたはそれをより速く終わらせるだけでなく-あなたはあなたのファイルをOCRするオプションがあり、あなたのプロジェクトの完成した品質が専門的で読みやすいことを知っているでしょう。
Archivistaと呼ばれる、まさにまさに必要なことを行うドキュメント管理システムがあります。私たちの博物館のアーカイブでそれを評価しました。
インストール可能なISOとしてダウンロードするか、スモールビジネスコンピューターにプリインストールして購入できます。しかし、Ubuntuの下にインストールする可能性については知りません。ここでは、仮想マシンとして実行し、XフォワーディングとそのHTMLインターフェイスを介して対話します。
Archivistaは、このソフトウェアは長い(約20年)データ保持期間用に設計されていると主張しています。スキャナーを利用し、スキャンしたドキュメントの画像、PDFおよびOCRバージョンを保存できます。ドキュメントにはメタタグを割り当てることができ、OCRされたテキストは検索可能です。
情報階層は、オンラインまたはMicrosoft Officeツールでドキュメントを生成するために協力するのに役立ちます。dataentry.ieを使用して、ドキュメントをすばやく整理、保存、検索できます。