無料OCR化サイトi2OCRを使ってみる。

使ってみたサイトはi2OCR
画像ファイルを無料でOCR化してくれるというサイトで、登録なしで簡単に利用できる。
日本語を含め60以上の言語に対応しているというのも嬉しい。

以下、使い方と感想。
・例として自分でPDF化したフランス語論文(OCR化していない)を使ってみた。

■使い方
i2OCRは、JPG - PNG - BMP - TIF - PBM - PGM - PPMには対応しているが、PDFには対応していない。
①そこで、まずPDFをJPGに変換する。
macの場合、プレビューで開き、[ファイル]→[書き出し]→JPGを選び、保存するだけでOK。
(winの場合は無料のファイル変換ソフトがいくらでもあるのでそれを利用)
f:id:ms141:20130811142224p:plain

②あとはサイトの指示にしたがって、ファイルを選び、言語を設定、実行で終わり。
ただ大きめのファイルだとやや時間がかかる。

OCR化が完了すると、以下のような画面になる。
f:id:ms141:20130811142442p:plain

左下がコピペ用。その他にDownloadボタンからtext, doc, pdf, htmlなどのファイルでダウンロードできる。


■感想
・フランス語だと、まあまあ正確に認識してくれたようだ。しかしpdfでダウンロードしたところ、アクサンなどに多く文字化けが見られた。左下のコピペ用のほうがまだマシ。

・日本語で試したところ、残念ながら使える代物ではなかった。

・正直無料だし、まあこんなものかという感じ。試みは素晴らしいとは思う。