富士通研、英文特許を自然な日本語に置き換える読解支援技術を開発 ~ 従来の3倍の効率
エンタープライズ
ソフトウェア・サービス
注目記事
-
【デスクツアー】真似したい自宅デスク環境一挙公開!
-
NICT、東大、NTTなど、「仮想化ノード」開発の産学官共同研究を開始
-
「運用によって知恵が蓄積され、進化するシステム」——富士通研のクラウド向け障害対処技術

英文特許に関しては、ジー・サーチなど数社から、英文特許を機械翻訳してユーザーに配信するサービスが提供されているが、機械翻訳の品質とユーザーの要求する品質との間には依然ギャップが存在するため、特許分野での機械翻訳の利用はなかなか広がっていない。今回開発された技術は、英文特許を対象に、特許文で特徴的な表現を手がかりに文章の構造を解析し、解析した結果によって原文を項目ごとのブロックに分割してわかりやすく表示するという。さらに、項目ごとのブロック単位で機械翻訳した結果を、日本語として自然な流れに並び替えて表示することを可能とした。
今回開発された技術では、まず、英文特許の特徴的表現に着目した定型文の雛形を適用する。たとえば、英文特許でよく表現される「comprising」という単語が出てきたらその前までを1つのブロックにする、などのルールに沿って文章を分割する。その後、雛形の適用で分割された英文の論理構造を解析。英文特許の文書を主題、構成要素、説明などの意味のあるブロック単位に分割し、英文のまま、ブロックの種類で色分けして表示する。さらに分割された英文からブロックごとにそのブロックの分類に適した日本語文章を生成する技術を開発。たとえば、主題、構成要素なら名詞句として、説明なら文としてスタイルを変えて翻訳し、全体で自然な日本語になるように、語順への並べ変えを自動で行うという。
これにより、原文と翻訳された日本語を項目ごとのブロック単位で速やかに対比できるため、英語のスキルに関係なく幅広いユーザーの英文特許読解を支援できる。従来と比較すると、平均3倍の効率で英文特許の内容を理解することが可能だった(ある和文特許について、構成要素が類似する英文特許の選別に要する時間を、従来の機械翻訳を使った時と本技術を使った時で比較)。同研究所では今後、特許調査の対象として注目を集めている中国語や韓国語への対応を進め、対象言語を広げていく予定だ。
《冨岡晶》
特集
この記事の写真
/