回答:
最初にLinuxマシンに「tesseract-ocr」をインストールする必要があります。
sudo apt-get install tesseract-ocr
CLIから手動で実行することもできますし、同じようにPHPコードを作成したので、必要に応じて使用することもできます。
注:このコードを実行するには、php.ini でexecコマンドを有効にする必要があります
<?php
//IMAGE TO TXT Conversion
$input_file = $_REQUEST['input_file'];
$out = explode(".",$input_file);
$output_file = $out[0]."_".$out[1];
$output_file_name = $output_file.".txt";
echo "<br />----IMAGE To TXT conversion Started-----</br />";
echo exec('tesseract '.$input_file.' '.$output_file);
echo "<br />----TXT conversion Done-----</br />";
echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />";
?>
このコードをルートフォルダーに配置し、ブラウザーからアクセスします。
例:
http://yourserver.com?input_file=1.png
注:1.pngファイルが現在のディレクトリに存在する必要があります。
画像をアップロードする権限がありません。参照用にこの画像を使用しました 。http://plone.org/documentation/kb-old/copy_of_ocr-in-plone-using-tesseract-ocr/phototest.gif/image_preview