富士通、次世代データ群「Linked Open Data」の格納・検索技術を開発
エンタープライズ
ソフトウェア・サービス
注目記事
-
【デスクツアー】真似したい自宅デスク環境一挙公開!
-
富士通、ビッグデータの高速処理技術を開発……数分前の出来事を分析に反映
-
富士通、スマホ/PCのカメラで脈拍を計測する技術を開発……顔を撮影し最短5秒

「Linked Open Data」(LOD)は、W3Cが推奨するWeb上での新しいデータ公開形式「Linked Data」形式で公開されているデータセット群。RDFを用いることで、特定アプリに依存しないのが特徴だ。2013年現在、約340の主要なデータ公開サイトがあり、全体では400億項目のデータ量がある。代表的なものには、オンライン百科事典であるWikipediaをLinked Data形式に変換した「DBpedia」などがある。英政府のデータ公開サイト「Data.gov.uk」でもLinked Data形式が採用されている。
現在「Linked Open Data」として、学術・政府系を中心に多種多様なデータがインターネット上に公開されているが、個々のデータが別のWebサイトで公開されており、どこにどのようなデータがあるかを把握することが難しいという課題があった。
今回、数百億項目にもおよぶLODを格納し、従来比5~10倍となる高速な検索アルゴリズムにより、格納データを標準的なAPI(Application Programming Interface)で一括検索できるLOD活用基盤を開発した。この活用基盤は、富士通および、アイルランド国立大学ゴールウェイ校の研究機関「Digital Enterprise Research Institute」「Fujitsu Laboratories of Europe Limited」により新たに開発された。
同時に、リンク情報を含めてデータを可視化する検索インターフェイスにより、アプリケーションに必要なデータを視覚的に探索できる機能も開発された。これにより、アプリケーション開発者が個々のWebサイトを探しまわることなく、欲しいデータを即時に入手し、利用できるという。
富士通研究所では、今回開発した技術をクラウド上に実装したLOD活用基盤を、今年中に無償公開する計画だ。
《冨岡晶》
特集
この記事の写真
/