2015年1月23日金曜日

GoogleドキュメントのOCR機能

GoogleドキュメントにはOCR機能がある。当然これはフリーで使えるOCR。
どんな感じが使ってみようと思い使い方をネットで調べたが、どうやらやり方がかなり変わっていてネットで調べた内容は古い情報ばかりで使い方がよく分からない。

いろいろと調べて試行錯誤をして何とか使い方が分かった。
おおよそ次の通り(2015年1月20日現在)。

まず重要なのはグーグルドキュメントのOCR機能はグーグルドキュメント単体では設定できないということ。古い情報ではグーグルドキュメント単体で使用できるように書いてあるが現在では出来ない。グーグルドライブとグーグルドキュメントの二つが必要のようようだ。。
まあ通常グーグルドライブは入っていることが多いが、入ってなければこの二つを入れておく必要がある。

今回はGoogleクロームを使った場合の説明となる。
他のブラウザはそれぞれ調べてみて下さい。

グーグルクロームでは立ち上げると「アプリ」というボタンが左上にあるのでそれをクリックすると入っているアプリが確認できる。ここで「Googleドライブ」と「Googleドキュメント」があることを確認しておく。

OCRの設定はグーグルドライブで行う。
クロームの「アプリ」をクリックしてグーグルドライブを立ち上げる。それから右上の歯車の形をした「設定」アイコンを選ぶ。
このアイコンにマウスを置くと「設定」という説明が出てくるので確認できると思う。

クリックすると「設定」「ドライブをダウンロード」「以前のドライブに戻す」「ヘルプ」のメニューがあるので、もちろん「設定」をクリック。

すると「全般」と「アプリの管理」があり、その「全般」を選択。

「全般」の中の「アップロードしたファイルを変換する」の「アップロードしたファイルを Google ドキュメント エディタ形式に変換します」にチェックを入れる。
以前はもっと多くの設定内容があったようだが現在はこれだけのようだ。

また、「言語」の「言語設定を変更」をクリックすると日本語とその他の理解できる言語の設定ができる。その他の言語は英語を選ぶ人が多いと思う。
設定が終わったら、「言語」の横の「←」をクリックして前の画面に戻る。このとき「設定」の画面でなくグーグルドライブのメイン画面の戻るので、再度「設定」→「設定」で「完了」をクリックする。

これで設定は終了。

次にファイルのアップロード。同じくこれもグーグルドライブから。
今度は左上の「新規」ボタンをクリック。
すると「フォルダ」「ファイルをアップロード」「フォルダをアップロード」など出てくるので、目的とするメニューをクリック。
ファイルをアップロードする場合は当然「ファイルをアップロード」をクリック。
クリックするとファイルを選択する画面が出てくるので目的とするファイルを選ぶとアップロードが始まる。

完了すると、アップロードしたファイル名が表示される。
これを選んで右クリックすると「アプリで開く」というメニューがあるので、その中のGoogleドキュメントを選ぶ。
するとGoogleドキュメントが立ち上がり、選んだファイルが表示されその下にOCRの結果が表示される。

以前のバージョンでは、アップロードするたびにOCRを使うかどうか設定することが出来たようだが現在では出来ないようだ。
前と比べて簡素化されている感じ。

で、実際に使ってみた感想だが、pdfファイルでは上手く読み取れることもあったが、jpgでは上手く読み取れないことが多かった。
結論的なことは言えないが、条件を変えたらjpgでもひょっとしたら使えるようになるかもしれない。
今度時間があるときにやろうかな。たぶんやらないだろうなぁ。