4月10日

ナカバヤシ×CamScanner③　手書き文字・印刷文字でOCR検索って使えるの？！

ナカバヤシとコラボのCamScannerアプリ、前回の記事では意外なことにあまり使えなかったOCR検索。でも、せっかく機能がついているのだから、使えるのなら使いたい！
前回試したときは手書き文字だったからOCR機能の文字認識や検索がうまくいかなかっただけなのか。それとも、印刷された文字でも同じ結果なのか。それを調べるため、手書き文字と印刷文字とで比較してみました。

まずはサンプルにする文章を用意。
青空文庫の羅生門より、冒頭部分をお借りしました。
検索の邪魔になりそうなので、読み仮名なんかは最初に全部外しています。

　ある日の暮方の事である。一人の下人が、羅生門の下で雨やみを待っていた。
　広い門の下には、この男のほかに誰もいない。ただ、所々丹塗の剥げた、大きな円柱に、蟋蟀が一匹とまっている。羅生門が、朱雀大路にある以上は、この男のほかにも、雨やみをする市女笠や揉烏帽子が、もう二三人はありそうなものである。それが、この男のほかには誰もいない。

使ったフォントはWindowsでおなじみのMS明朝とMSゴシックです。最初は標準の10.5ptで撮影したのですが、iPhoneの画面で確認すると、ちょっと文字が小さかったのでどちらもフォントサイズを12ptにして撮り直しました。
それから手書きも用意。

CamScanner撮影データ（左からMS明朝、MSゴシック、手書き文字）

iPhoneに取り込んだ時点では、MSゴシックが一番読みやすいかな？MS明朝だとちょっと文字が潰れているようですが、拡大してみると意外と大丈夫そう。
手書きの文字も罫線がなくなると結構見やすいです。いつもより綺麗めに書いたつもりだし、これならOCR検索も期待できそう！

CamScanner撮影データ拡大（左からMS明朝、MSゴシック、手書き文字）

ということで、早速CamScanner で取り込んだ画像をOCRで文字認識します。
うーん……この文字認識の時に、手書きだけちょっと挙動不審というか、MSゴシックやMS明朝に比べて認識が遅い…？気がしました。
まあでも、一応OCRでの認識はできたということなので、大丈夫だと信じていよいよ検索をかけてみます！！

まずは、冒頭部分の「ある日の暮方の事である」を検索。
前回の「スマートフォン」でもそうだったけどあまり長い文字は無理なのかなーと思っていたら、ちゃんと検索できています！
が、検索されたのは印刷されたMS明朝とMSゴシックのみ。
きっと検索されるはず！と信じていた手書き文字はどうやら検索されていないよう……。やっぱり検索にかける言葉が長すぎたのかな？

検索結果

仕方がないので検索文字列をちょっとずつ短くして試してみても、一向に検索にひっかかる様子がありません。
というか、一文字も検索にヒットしませんでした……(ノ∀｀)

これでは、私の字がCamScannerに認識してもらえないくらい汚いとかそういう残念な結論になってしまうので、もう一度心持ち丁寧に同じ文章を書きなおしてみました。
何か繰り返し同じ文を書くって小学校の文字の練習みたいですね。

手書き文字を丁寧に書き直し

初めて手書き文字で検索結果が出ました

新たに書き直したものをOCRで文字認識させると、最初の時と同じようにちょっと挙動不審なのが気になるのですが、普段以上に綺麗になるように心がけて書いたのだから結果を残してほしい、と思いつつ再挑戦。

とりあえず、この状態で一応「あ」は認識してもらえたので最低限のラインはクリア……文字を丁寧に書けば、手書きでも認識はしてもらえるようです。

ちょっとほっとしたので、今度は短めの言葉として「ある日」を検索！
……結果は惨敗。せっかく綺麗に書いたつもりなのに、手書き文字は検索結果には全く出てきません。
これは、やっぱり単語は難しいのかな？人の目では普通に読める文字だと思うのですが、CamScannerに認識させるのは難しいよう。
それなら、もっと単純な形の文字ならどうだと「一人」に検索対象を変えてみたものの、結果は同じく無反応です。
これはさすがに認識してもらえているだろうと自信があったのですが、こうも無反応だとちょっとショックですね！

その後も、「ありそう」「それが」「広い」を検索してみたところ、やっぱり手書きは拾ってもらえませんでしたが、一文字の「雨」を検索したところ、最初に書いた手書き文字、二回目に書いた手書き文字の両方とも認識してもらえました！

雨の文字が検索にヒットしました

一文字くらいならいけるのかと「門」、また、簡単な漢字ならどうかと「円柱」を検索してみたら、これらの文字は認識されていました。
「門」はもう少しがんばれそうだったので検索にかける文字を増やして「門の下で」と入力してみたところ、無事検索に拾ってもらいました。

検索に成功した文字「門」「円柱」「門の下」

一方、MS明朝、MSゴシックはどの言葉も当たり前のように検索結果に出てきます。基本的に印刷したものは大体検索に拾われるようです。
ちなみに、検索結果にMS明朝・MSゴシックの書体による差はなかったです。

手書き文字でも検索にヒットするときがあることは分かりましたが、やっぱり手書き文字のOCR検索はちょっと使いづらそう。印刷の方は、手書きの検索で引っかからなかったものも全て検索できたので、OCR検索は使えそうです。

色々試してみた結論としては、人の手書きでは、文字を認識して検索にヒットすることもあるけど、印刷された文字に比べると著しくその確率が下がります。
会議や打ち合わせの時にとったメモをOCR検索で簡単に探せたらいいなー、と思っていたのだけど、丁寧に書いてこのヒット率の低さなので、実用性は大分低いと思います。
OCR検索を使うとしたら、対象は雑誌なんかの印刷された文字だけになるかも。

← Prev post

3月22日

ナカバヤシ×CamScanner②　OCR検索って使えるの？？？

by i文房具.com

No comments yet

ナカバヤシとコラボしているCamScannerのアプリ。
前回の記事でFree版よりもグレードアップしている部分について紹介しましたが、実際のところはどうなのか使ってみることに。

まずはOCR検索機能です。
CamScannerでも、この機能を使用することはできますが、使用できるのは有料版のみ。無料のアプリで有料版の機能が使えるとは、随分と思い切ったことをしています。便利そうなのでありがたいんですが、いいんでしょうかね。

ところで、OCR検索の「OCR」って何？って思う人もいると思うので、簡単に説明します。

OCRとは？
optical character recognitionの略。日本語では光学文字認識。
画像データに書いてある文字などの、本来コンピューターが読み取れない文字をコンピューターが読み取り・編集できる文字データ（文字コード）に変換する機能・ソフトのこと。（参照：Wikipedia）

OCRの準備：画像データ

つまり、CamScannerで写真として撮影した画像データは、もちろんコンピューターの上ではただの画像なのでその中に何が書かれているのか分からない（＝文字が認識されていない）。
それを、OCR機能を使うことによって、画像の中にある文字の部分がテキストデータに変換されてコンピューターにも認識されるということ。

OCR検索は、このテキストデータを使って検索をしたりすることができるようになります。

OCR機能検索は上に書いた通り、画像データから文字を読み取って初めて機能するもの。CamScannerで作成した画像データをいきなり検索するということはできないので下準備が必要です。

CamScannerで画像を取り込むと、左のような画面が出てきます。
画面右下のアイコンを押すとOCR機能で文字データへの変換が開始！

言語選択画面

初回には認識する言語の選択をする必要があるので忘れないように。
大体日本語と英語があれば十分だと思うけど、その他の言語も読み取りたい人は気をつけて。

ちなみに、アイコンには一応OCRと書いてあるようなんですが、文字が小さすぎてぜんぜん読めません (-“-;)

文字データの読み込みが終わると「完成」という画面が出てきます。
ちょっと見えにくいけど、黄色のマーカーを塗られたようになっているのが、文字データとして認識された部分。

「もっと見る」を押すと詳しい使い方が書かれているので、最初だけは読んでおくといいかも。
「はい」を押すとそのまま元の画面に戻るので、説明はもういらないって人は二回目からは「はい」を押すといいです。

テキストデータの認識完成（完了）の画面

設定画面　全ての注意情報をリセット

この画面もいらないよ！って人は「プロプントを表示しません」を押すと次回から出てこなくなるけど、テキスト変換が終わったよっていうのを確認するためにも残しておいた方がいいんじゃないかな。

うっかり「プロンプトを表示しません」を押しちゃったっていう人は、設定画面の「全ての注意情報をリセット」を押すと復活します。でもまた一から言語の設定とかするのでちょっと面倒くさい！

OCR検索可能なデータには虫眼鏡のマーク

OCR検索ができるデータはデータリストの左上に虫眼鏡のマークがあるのでそれが目印。

「スマートフォン」の検索結果

さて、じゃあここからやっとOCR検索を試してみます！
撮ってみた画像の見出しにもなってる「スマートフォン」で検索。

……。
……。

ええっ？！検索結果なし……どういうことなの？？

「スマート」の検索結果画面

最初からつまずいてしまったものの、一文字ずつ削ってどこから結果が出るか見てみようと思います。
「スマートフォ」→結果なし
「スマートフ」→結果なし
「スマート」→結果あり！！　スマートでやっとです！

検索結果は該当するデータそのものではなく、データの入っているファイルがまずは表示されるよう。

そのファイルをタップすると、ファイルにあるデータが全部表示。検索した文字列が含まれるファイルは、左上の虫眼鏡マークがオレンジに光っています。
最後に、そのデータを開くとおお！「スマート」の文字に黄色く色が塗られていますね！どこを検索したのか一目瞭然。

検索した文字列が含まれデータのは虫眼鏡がオレンジになる

検索された文字列は黄色になる

うーん……でもこれ、まだ使って間もないからデータ量も少なくていいけど、データの数が多かったりよく使う言葉を検索したら結構探すの難しそう。

それにしても、「スマートフォン」という文字列で検索できなかったのはちょっと残念。該当箇所が手書きだったから？それともアプリの精度の問題？
次回は印刷文字で試してみて、どれだけ検索精度が上がるのか検証してみようと思います！印刷文字でOCR検索がきちんとできれば使い勝手はあがりそうだけど、どうなるかな…。

← Prev post Next post →