凄い技術

Googleがスキャン文書も検索可能になるらしい。
http://headlines.yahoo.co.jp/hl?a=20081031-00000006-sh_mar-sci
しばらくは英語だけなんでしょうけど、これかなり使えそうな気がするなぁ。
まずはアルファベットと数字だけと考えると、36通りのテンプレートでパターンマッチングすれば活字については簡単に取れそうですが、それでも「1」「I」「l」とか、「0」「o」は難しそうです。
でもGoogleはその判別もクリアしたとか。
凄い!!
ちょっと興味ある技術です。
特許とか調べて出てこんかな・・・侵害性発見困難で出さないか。