KDDI研、人数・性別・年代にあわせて人間と対話するシステムを開発
ブロードバンド
テクノロジー
注目記事
-
【デスクツアー】真似したい自宅デスク環境一挙公開!
-
ドコモ、「通訳電話サービス」の試験提供を開始……日本語・英語をリアルタイム音声翻訳
-
NICT、スマホ向け翻訳アプリ「ChaTra」発表……多言語・複数人で同時に会話可能

キヨスク端末や銀行のATMなど従来の双方向性のシステムは、1人のユーザーを想定したもので、ユーザーの人数や人間関係を推定し、複数のユーザーと対話することは困難だった。今回開発されたシステムは、耐雑音性に優れた音声認識エンジン、Androidマーケットで無償配布を開始した音声合成エンジン「N2 TTS」、タッチパネル入力や顔画像認識に基づく人数・性別・年代推定技術などを統合制御したものとなる。
ユーザーの人数、性別、年代に合わせて対話シナリオを切り替えることが可能で、たとえば、子供には「1人で来たの?」と問いかけたり、男女2人の場合は「2人はラブラブだね」と話しかけたり、推定した年齢によって問いかけの内容や言葉遣いを変えるといったこともできる。女性から優先的に問いかけるといったことも可能。対話シナリオは、あらかじめ決められた挨拶などの定型文と、ユーザーとの対話の流れから内容を把握し適切な応答を選択する動的な対話制御を組み合わせることができる。
今後は、双方向性のデジタルサイネージなど、早期のサービス化を目指す。同時に対話型コンテンツを自由に編集できるオーサリングツールを公開する予定。なお同システムを用いた子供向け対話型アプリケーション「あてるあてる坊主」は、KDDIデザイニングスタジオ(渋谷区神宮前)に展示中。
《冨岡晶》
特集
この記事の写真
/