Androidスマートフォンと「Googleレンズ」機能を使用してください。最近、写真アプリとカメラの写真レビュースクリプトに追加されました。
Googleレンズを介したOCRは、これまでに使用したどのOCRソフトウェアをも超えて、驚くほど正確です。
以下は、安価な(100 USD)Nokia 3を使用した手順の概要を示すいくつかのスクリーンショットです。愛するNexus 4がゴーストを放棄して以来、私が使用したことのある最高の電話です。
1976年に印刷されたギリシャ語の民族学の本のOCRスキャンのサンプルを詳しく説明します。スキャンのために分解することはあえてせず、文字密度と書体は似ているようです。
私はこの元の写真を理想的な照明条件ではなく、まあまあの電話カメラのすべての自動設定を使用して撮影しました。結果を向上させる特別な写真テクニックやフィクスチャーは使用していませんでした。本のページ。(テキストがフォーカスされていることを確認してください。OCRはぼやけたオフフォーカステキストを解読しません)
写真を撮った後のプレビューから、またはGoogleフォトアプリを使用して写真自体をクリックして、Googleレンズアイコンをクリックします。
これが-Skynet-です。つまり^M^M^M^M^M^M
、 Googleレンズが魔法のスキャンを行っています(ドットは少し気味が悪いですが、GoogleのAIがそのことを実行していることを通知するために何かをしなければなりませんでした)
画像がスキャンされると、Googleレンズが画像上で見つけたテキスト領域の輪郭がはっきりし、テキストが画面の下半分にすでに抽出されています。一部の領域だけを必要とし、他の領域を必要としない場合は、選択をタッチして、それらをアクティブ化/非アクティブ化します。
抽出されたテキストをタッチすると、クリップボードに配置され、電話のどこにでもコピー/貼り付けできるようになります。
その後、テキストをGoogleドキュメントドキュメントに貼り付けます。そこで、次のことを実行できます。-すぐに、またはPCで間違いを修正します。-ドキュメントを心ゆくまで共有します。-編集内容をライブで更新するWebページとして公開します。--プレーンテキスト、-ワードドキュメントにエクスポートします。 、-オープンオフィスドキュメント、- リフローテキスト付きの互換性のあるepub電子ブック、または-古き良き非DRMd PDF
これはおそらく、可能な限り幅広い出力の選択肢を備えた、公開への最短ルートであると主張できます。
すべてを単一のデバイス(適切なアプリがインストールされたAndroidフォン)から実行でき、基本的に無料で高精度のレートですぐに使用できます。
これはフラグメントを貼り付けたGoogleドキュメントです
これがGoogleドキュメントのURL共有です。お気軽にコメントしてください。また、誰かがリモートで同時にドキュメントを編集するのを手伝ってもらうこともできます。
https://docs.google.com/document/d/1aizUDOHerSraU3fIw6lHLabmLSNsQ7PMXOl1IHHE0RU/edit?usp=drivesdk
最後に、リンクされたソースとして前述のドキュメントを使用して公開されたGoogleサイトのWebサイトです。
https://sites.google.com/h-lo.me/ocrsample
これは、https、デスクトップ、モバイル対応で、好みに応じて異なりますが、通常は痛みはありません。総作業時間15分でコーディングもまったく問題ありません。
そこ一点の改良が残っており、それが作成することです適切な段落を Googleのレンズは、それが自分の段落のすべての行を作成し、使用する場合は、これが問題になり、抽出されたテキストのすべての行の後にハードリターンを挿入するので、Googleの文書に目次などのGoogleドキュメントの機能、またはドキュメントを Kindle 互換のe-pub電子ブックにエクスポートするとき(リフローテキストをめちゃくちゃにする)
すべての行の先頭でバックスペースキーを押すことで、必要に応じてすべての行に参加できます。または、これをスクリプトで自動化することもできます。
そこで、このプロセスを自動化するためにまもなく公開するアプリスクリプトアドオンを作成しています。完了したらここでお知らせします。