この実験は「gooラボ」で公開されており、質問を入力すると「回答候補」として答えの候補がいくつか挙げられる。さらに、答えの候補ごとに「自信度」が示されていると同時に、回答候補に対して評価ができるようになっている。ほか、答えを導き出すために参照されたWebサイトも表示される。
ここでは、大きく分けて「質問文のタイプ分類技術」「高速固有表現抽出技術」「Webページ再ランキング技術」の3つの技術が採用されている。
Web Ansersにたとえば「鉄腕アトムの誕生日はいつ?」との質問が入力されると、“誕生日”が“日付”の形式でユーザから答えが求められていることが解析される。これが質問文のタイプ分類技術だ。また、“誕生日”と“生年月日”を同一の言葉として判断する機能も備わっている。
次に「鉄腕アトム」と「誕生日」のキーワードでWebを検索し、この中から“日付”に関する情報を抽出する。これが「高速固有表現抽出技術」になる。これらの検索にはgooのエンジンが用いられており、同時に検索順位も参照されている。この順位を質問に応じて上位に表示するのがWebページ再ランキング技術だ。
この3つの技術の詳細情報をもとに試したところ、「春分の日は?」よりも「春分の日はいつ?」のように求める答えの種別(人名、日付、場所など)を明確にした方が確実に回答が得られるようだ。
なお、両社では実験の結果をもとにサービス化を検討するとしている。
![]() |
「鉄腕アトムの誕生日はいつ?」を検索した結果 |