ライフハック心理学

心理ハック

Evernoteの日本語画像認識が正式にスタート

home_notes_montage_global.png

というわけで、日本語の画像認識機能、すなわち、手書き文字を検索でヒットさせることができるようになりました。

もっとも、OCRをお使いになったことのある人には分かるとおり、手書き文字を100%認識できる、というわけにはいきません。そもそも、あなたはご自分で書いた文字なら、100%正しく認識できますか?

話がいつも通り心理学方面に脱線しますが、人がなぜ、殴り書きのような「汚い字」でも、「正しく認識」できるのか、本当の理由はよく分かっていません。

トップダウンプロセス」すなわち「文脈から理解するのだ」という説がもっとも優勢ですし、それは正しいのでしょうが、「文章全体が余人に判別できないほど汚くても、たとえば奥さんには読めてしまうのはどうして?」というような問いには、簡単には答えられないのです。

ここで、慣れ(学習)や、生活を共にするという「文脈」を持ち出してくる学者さんもいますし、これまた正しいと思うのですが、だんだん「字の判別」から話がずれていってしまいます。結局それは「コミュニケーション能力」ということになるわけです。

となると、そもそも「人と心理的にはコミュニケーションしていないコンピュータに、そういうやり方で「文字認識」させるのは無理がある」ということになってきますから、「100%を求める」ということ自体、現状では無理がある。

そこで、コンピュータにはコンピュータの得意なことをさせるべきなのです。人間側としては、もとの目的が「検索」をしてもらうことなのですから、「検索範囲」を絞り込んであげれば、ヒットさせられる確率をどんどん上げることができます。

長くなりますが、おなじみ、Lifehacking.jpさんからの引用です。

日本語の画像認識、本当に使える?
まず名刺などをスキャンして Evernote にいれてみると気づかれると思いますが、横書きで印刷された名刺の住所などはほぼ完璧に読み込むところまで精度が向上しています。

しかし一方で、名前や、縦書きのフォントについては時々失敗しているものも気づかれるかと思います。これは、Evernote のシステムが隣合った文字を同時に処理することでわかち書きなどを認識しているためで、文字数が少ない名前や、縦書きの文章は文字感覚を読みそこねてしまうことがあるせいです。

じゃあ使えないのかというそうではなく、文字認識は Evernote がもっているたくさんの検索軸のうちの一つと考える必要があります。文字認識で絞り込み、タグで絞り込み、ノートブックで絞り込んでいるうちに、一瞬でノートを探せるようになること、これが Evernote の検索の考え方です。

Evernote 文字認識機能が正式にスタート
http://lifehacking.jp/2010/06/evernote-japan/