IIJ-II、Wikipedia人気記事ランキングシステムを構築……ビッグデータ処理技術を応用
エンタープライズ
ソフトウェア・サービス
注目記事

日本語版Wikipediaのデータ(2013年5月末時点で約171万ページ)について、1時間ごとの各ページビュー情報を取得し、アクセス数が多いページを順に表示可能となっている。前日のデータ集計をもとにしたカテゴリ毎のランキングを、「急上昇TOP 10」「アクセス数TOP 10」「平均アクセス数TOP 10」などの分類で見たり、トラフィックの推移をグラフで見ることも可能。
IIJ-IIでは、Wikipediaの辞書データをテキストマイニング系ビッグデータ解析における基礎データとして活用している。今回、クラウドアプリケーション向けプラットフォームとして開発を進めている「Project Gryfon」の技術を応用した事例として、ランキングシステムを構築した。Wikipediaでは、Page view Statisticsも提供しており、任意に選んだ1時間内のWikipedia(およびその他のWikimediaプロジェクト)の各ページビュー情報を取得できる。Project Gryfonでは、このページビューを集計するものとなっている。
「Wikipedia人気記事ランキングシステム」http://www.gryfon.iij-ii.co.jp/ranking/
《冨岡晶》
特集
この記事の写真
/