【テクニカルレポート】情報社会を支える画像認識・文書解析技術の最新動向……日立評論 2ページ目 | RBB TODAY

【テクニカルレポート】情報社会を支える画像認識・文書解析技術の最新動向……日立評論

エンタープライズ ソフトウェア・サービス
図1:日立グループの画像処理技術
図1:日立グループの画像処理技術 全 9 枚
拡大写真

3.文書解析技術

3.1 文書解析技術の取り組み
 情報をやり取りする手段として,文書は数多く使われている。しかし,その媒体は,従来からある紙文書に加え,PC(Personal Computer)で作成された電子文書や電子メールなど多様化している。この動向を踏まえて,日立のOCR技術もまた,紙文書や帳票類の読み取りから電子文書の構造化までをカバーする総合的な文書解析技術へと発展してきた。画像中の文字を読み取るだけでなく,文字列の表記やレイアウト配置を解析して文字列の意味を解釈する包括的な文書解析が可能である。この解析機能を支える要素技術として,文字認識/学習技術,カラー文書画像処理,意味解釈の三つがある。

3.2 文書解析技術の特長
(1)文字認識/学習技術
 金融向けデータエントリ業務では,さまざまな品質の文字・文書を安定して認識できることと,読み取った結果に誤読が少ないことの2点が要求される。従来は誤読を抑制するために,文字パターンの形状の可否を人間が定めた
ルールに従って判定する手法が使われてきた。しかし,ルールベースの手法はさまざまな変形パターンへの対応が難しいという課題があった。

 そこで,文字の屈曲や積率などの局所的・大局的特徴を抽出する約50種のパターン特徴抽出器を,大量データを使った統計学習によって効果的に組み合わせることで誤読を低減する技術を開発した。大量サンプルで評価したところ,安定した認識率を維持しつつ従来よりも誤読を80%低減した。さらに,高次元空間上での認識のふるまいを解析し,曲率の高い判別面が精度に影響を与えるという現象に着目して判別面曲率軸を使った次元圧縮方式を開発し,これによる高速かつ安定した認識性能を実現した(3)(4)。

(2)カラー文書画像処理
 手元の文書を手軽に撮像できる機器としてスタンド型スキャナがある。このスキャナは撮像部が外部に開放されているため,外光や照明変動の影響を受けやすい。こういった課題に対処するのがカラー文書画像処理である。その一機能である陰影補正技術は,色クラスタリングを用いて帳票の背景色を推定することで,キャリブレーション作業なしに,照明変動や物体の写し込みで生じた影を検知・除去できる。営業店端末システムなど,外光の影響を受けやすい窓口での文書受付業務を支援するシステムには欠かせない技術となっている(図3参照)。

(3)意味解釈
OCRや文書解析システムの導入ネックの一つに,帳票定義作業の煩雑さがある。さまざまな会社が発行した帳票や仕様書から必要な情報を手軽に抽出するための技術が意味解釈である。その一例として金融機関向け定義レス帳票
認識がある。読み取りたいデータを,項目名(「金額」や「納期限」といったキャプション)と項目属性(数値列,年月日などデータ表記の形式)のペアで定義すれば,当該データの記述箇所を自動的に見つけて読み取る。読み取り項目の位置は定義する必要がないのでシステム導入時の手間を大きく軽減することが可能となる(5),(6)(図4参照)。

  1. «
  2. 1
  3. 2
  4. 3
  5. 続きを読む

《RBB TODAY》

特集

【注目記事】
【注目の記事】[PR]

この記事の写真

/

関連ニュース