KDDI研、人数・性別・年代にあわせて人間と対話するシステムを開発

　KDDI研究所は6日、音声入力やタッチパネル操作および顔画像認識などを制御し、ユーザーとディスプレイ上のキャラクターを対話させることのできるシステムを開発したことを発表した。ユーザーが複数でも、性別、年代に合わせた対話が可能だという。

　キヨスク端末や銀行のATMなど従来の双方向性のシステムは、1人のユーザーを想定したもので、ユーザーの人数や人間関係を推定し、複数のユーザーと対話することは困難だった。今回開発されたシステムは、耐雑音性に優れた音声認識エンジン、Androidマーケットで無償配布を開始した音声合成エンジン「N2 TTS」、タッチパネル入力や顔画像認識に基づく人数・性別・年代推定技術などを統合制御したものとなる。

　ユーザーの人数、性別、年代に合わせて対話シナリオを切り替えることが可能で、たとえば、子供には「1人で来たの？」と問いかけたり、男女2人の場合は「2人はラブラブだね」と話しかけたり、推定した年齢によって問いかけの内容や言葉遣いを変えるといったこともできる。女性から優先的に問いかけるといったことも可能。対話シナリオは、あらかじめ決められた挨拶などの定型文と、ユーザーとの対話の流れから内容を把握し適切な応答を選択する動的な対話制御を組み合わせることができる。

　今後は、双方向性のデジタルサイネージなど、早期のサービス化を目指す。同時に対話型コンテンツを自由に編集できるオーサリングツールを公開する予定。なお同システムを用いた子供向け対話型アプリケーション「あてるあてる坊主」は、KDDIデザイニングスタジオ（渋谷区神宮前）に展示中。

KDDI研、人数・性別・年代にあわせて人間と対話するシステムを開発

特集

この記事の写真

関連リンク

関連ニュース

ドコモ、「通訳電話サービス」の試験提供を開始……日本語・英語をリアルタイム音声翻訳

NICT、スマホ向け翻訳アプリ「ChaTra」発表……多言語・複数人で同時に会話可能

KDDI研、Android向け超軽量日本語音声合成ソフト「N2」を無償提供…応用アプリも公開

【CEATEC 2011】KDDI、新聴覚スマートフォンを展示！新開発の音声振動素子で試作