富士通、次世代データ群「Linked Open Data」の格納・検索技術を開発
エンタープライズ
ソフトウェア・サービス
![LOD活用基盤の概要](/imgs/p/hDN4m_UJPEFczM0wl2KIHdtO9kFAQ0P9REdG/283572.jpg?vmode=default)
「Linked Open Data」(LOD)は、W3Cが推奨するWeb上での新しいデータ公開形式「Linked Data」形式で公開されているデータセット群。RDFを用いることで、特定アプリに依存しないのが特徴だ。2013年現在、約340の主要なデータ公開サイトがあり、全体では400億項目のデータ量がある。代表的なものには、オンライン百科事典であるWikipediaをLinked Data形式に変換した「DBpedia」などがある。英政府のデータ公開サイト「Data.gov.uk」でもLinked Data形式が採用されている。
現在「Linked Open Data」として、学術・政府系を中心に多種多様なデータがインターネット上に公開されているが、個々のデータが別のWebサイトで公開されており、どこにどのようなデータがあるかを把握することが難しいという課題があった。
今回、数百億項目にもおよぶLODを格納し、従来比5~10倍となる高速な検索アルゴリズムにより、格納データを標準的なAPI(Application Programming Interface)で一括検索できるLOD活用基盤を開発した。この活用基盤は、富士通および、アイルランド国立大学ゴールウェイ校の研究機関「Digital Enterprise Research Institute」「Fujitsu Laboratories of Europe Limited」により新たに開発された。
同時に、リンク情報を含めてデータを可視化する検索インターフェイスにより、アプリケーションに必要なデータを視覚的に探索できる機能も開発された。これにより、アプリケーション開発者が個々のWebサイトを探しまわることなく、欲しいデータを即時に入手し、利用できるという。
富士通研究所では、今回開発した技術をクラウド上に実装したLOD活用基盤を、今年中に無償公開する計画だ。
《冨岡晶》
特集
この記事の写真
/