NICT、世界初のWeb情報解析システム“WISDOM”を公開 ~5億を超える日本語ページから多様な意見を抽出
エンタープライズ
ソフトウェア・サービス
注目記事
-
【デスクツアー】真似したい自宅デスク環境一挙公開!
-
香りや手触りまで再現 ~ NICT、正倉院宝物や高松塚壁画をバーチャル体験できる「デジタルミュージアム」公開
-
NICT、「平城遷都1300年祭」で4K超高精細映像を伝送 ~ ネット衛星「きずな」を活用

情報分析システム“WISDOM”は、NICTが独自に収集した5億を超える日本語Webページを対象に、任意の話題に対して「外観」「発信者」「内容」という3つの観点からの分析を行うことが可能となっている。利用規約に同意すれば誰でも利用可能だ。
“WISDOM”には、「Webページを発信しているサイトの運営者や、ページ内のコンテンツの著者を、自動的に抽出する技術」「情報発信者の特定のトピックについての専門性を分析し、専門性の高い順に順位付けする技術」「意見や評価を自動的に抽出し、それが肯定的か否定的かの評価極性を判定する技術」などが新たに開発されたとのこと(情報発信者分析技術、評価情報抽出技術、主要・対立・対比情報抽出技術)。これらの技術により、従来の検索エンジンでは難しかった、特定の話題に関するさまざまな立場の発信者の意見や対立する情報を俯瞰的に提示することで、多様な観点による偏りの少ない情報を元にした判断が可能となるという。
従来、Webから評判情報を検索するシステムは存在したが、Webコンテンツを対象に、評価情報に加えて発信者や対立する情報など多様な観点から分析できるシステムは、“WISDOM”が世界初とのこと。今後は、精度向上を図るとともに、常に最新の話題に対応できるよう継続的に分析対象を更新する。また、英語版および中国語版の開発を進めていく予定。
国立国会図書館の長尾真館長は「グーグル検索に何が欠けているかを、私がNICTの理事長をしていたときにいろいろと考えた。そこで浮かび上がってきたのは、検索上位の情報がどこまで信頼できるものであるか、それらに対立するような情報がロングテールのどこかにないかどうか、といったことを自然言語処理技術であきらかにすることであった。そこでさっそくプロジェクトをスタートさせたが、それが今回のWISDOMという世界に類例のないすばらしい成果となったことはまことに喜ばしい。多くの人に使ってもらいたいものである」とのコメントを寄せている。
《冨岡晶》
特集
この記事の写真
/