江戸時代以前のくずし字を自動テキスト化、凸版が新しいOCR技術開発
ブロードバンド
テクノロジー
注目記事
-
【デスクツアー】真似したい自宅デスク環境一挙公開!
-
ぺんてるの暗記アプリ「アンキスナップ」、PFUのスキャナ照明「SnapLite」と連携
-
オールアバウト、“協会ビジネス”に特化したCMS「Mania-Biz」無料提供

総数100万点以上ともいわれる古典籍は、専門家による判読が必要とされ、テキストデータ化が遅れていた。一方、凸版印刷は、2013年から「高精度全文テキスト化サービス」を提供開始。このサービスで確立したシステム基盤に、はこだて未来大学の寺沢憲吾准教授が開発した「文書画像検索システム」を組み合わせ、くずし字のOCRを実現した。
2014年度に実施した原理検証実験では、くずし字で記されている書物を80%以上の精度でOCR処理することに成功したという。これにより、専門家による判読に頼っていたテキストデータ化と比べ、大幅なコスト削減と大量処理が可能となる見込みだ。今後は、幅広い年代やジャンルの資料に対するOCR処理の精度向上を目指す。
《冨岡晶》
特集
この記事の写真
/
関連ニュース
-
ぺんてるの暗記アプリ「アンキスナップ」、PFUのスキャナ照明「SnapLite」と連携
ブロードバンド -
オールアバウト、“協会ビジネス”に特化したCMS「Mania-Biz」無料提供
エンタープライズ -
マイクロソフトのコンテンツ作成サービス「Sway」、日本でもプレビュー開始
ブロードバンド -
ソニー、透過式メガネ型端末「SmartEyeglass」を開発者向けに3月10日発売
IT・デジタル -
聞きたい音声をテキスト検索できるボイスレコーダーアプリ、カシオが公開
ブロードバンド -
会議・授業をその場でテキスト化、聴覚障がい者参加型ツール「LiveTalk」
エンタープライズ -
受験生応援も……顔写真とテキストから「しゃべ顔」動画
エンタメ -
二輪車通行規制区間の写真がGoogleストリートビューで閲覧可能に
ブロードバンド