【お知らせ】プログラミング記事の投稿はQiitaに移行しました。

Google 翻訳を簡易 OCR として使う

Google 翻訳の画像翻訳を簡易的な OCR として使う方法です。

目次

はじめに

Google ドキュメントに画像を入力すれば OCR として利用できます。

wk-partners.co.jp

この方法だとちょっとした確認に使いたい時にはやや手間なので、Google 翻訳を利用した簡易的な方法を紹介します。

習いたての文字を読むのに重宝します。例えばデーヴァナーガリー文字の結合文字や異字体もかなりの精度で読み取ってくれます。

※ 上例は左と右の字形が異なりますが、正常に認識できています。👉参考

方法

Google 翻訳は画像を入力として翻訳できます。

例としてヒンディー語版 Wikipedia の左上の文字(画像になっている)を読み取ってみます。「元の言語で表示」をオンにして元画像と並べます。

翻訳結果には「テキストをコピー」がありますが、元画像の認識結果を取り出す方法はありません。

意図的に間違った言語を指定すれば、翻訳されずに左欄の文字がそのまま右欄に出力されるためコピーできます。

テキスト翻訳に貼り付ければ確認できます。対応言語なら読み上げも可能です。

関連記事

読み上げの対応言語をまとめました。

Bard で OCR を試しました。(推奨しません)