読書的な何か。

読書と読書にまつわるテクノロジー、雑記など。

本を読み取る技術

はじめに

本を開かずに中を読み取る技術が発表されました。

この技術は、MIT Media LabRamesh Raskar氏のCamera Culture Groupらの成果です。フェムト秒カメラという、高速撮影ができるカメラが肝になっています。

仕組み

いろんな記事で解説されていますが、テラヘルツ波が光より透過性が高く、かつ電波よりも分解能が高いという特徴を活かし、本に当てたテラヘルツ波の反射波(インクありなしでずれる)をフェムト秒カメラで撮っちゃうことで文字を再現する(読み取る)という試みです。

ムービーを見るとわかりますが、基本原理はたった3ステップ!

www.youtube.com

  1. ページを見つける / Probabilistic Pulse Extraction(PPEX)
  2. 印字部分を検出する / Time-gated Spectral Imaging(TGSI)
  3. 文字抽出 / Cardinal Convex Sharp Composition(CCSC)

各パートではそれぞれPPEX、TGSI、CCSCという技術を適用しています。開くことができない古い貴重本に対して、テラヘルツ波を当てることが、どの程度許容されるのかわかりませんが、触れずに分析できるスグレモノです。

応用用途

この技術、文化財のような書籍に対しても有効そうですが、いわゆる自炊処理に応用できたら素晴らしいですよね。回転寿司屋さんで重ねたお皿のICタグを読み取るように、本を重ねておけば、その本のデジタルデータが抽出できちゃったりしたら、感動しそうです。

まだ9ページしか透視?できないし、もちろんOCRも精度完璧じゃないし、レイアウト解析も必要そうなので、置くだけ充電ならぬ、置くだけ電子書籍はまだ少し先かもしれません。でも、こういう技術の発想って、ワクワクしていいですね。

参考

doksyo-tek.hatenablog.com

doksyo-tek.hatenablog.com

▼フランク モス,Frank Moss,千葉 敏生著「MITメディアラボ―魔法のイノベーション・パワー」(早川書房)
4152093161

Rameshの著作。読んでませんが、面白そう!

▼Ramesh Raskar,Jack Tumblin著「Computational Photography: Mastering New Techniques for Lenses, Lighting, and Sensors」(A K Peters/CRC Press)
1568813139