携帯電話とサーバで処理を分散する音声認識技術をauが搭載
ブロードバンド
その他
注目記事
拡大写真
KDDIと沖縄セルラーは、au携帯電話に分散型音声認識技術「声de入力」を搭載。ナビゲーションサービス「EZナビウォーク」に、目的地を音声で入力できる機能を追加する。2月上旬から発売されるEZナビウォーク対応端末から順次対応される。
これまで、携帯電話単体で音声認識の処理を行う場合は、処理能力の制約から数十の単語しか認識できなかった。一方のサーバ処理の場合は、携帯電話で録音した音声ファイルをサーバに送ったり、通話サービスを利用するため、通信や通話料金がかかるという欠点があった。
今回開発された声de入力では、携帯電話側で音声の特徴を抽出し、そのデータをサーバに送信することで、サーバ側で音声認識の処理を行っている。そのため、高性能なサーバで処理ができ膨大な単語が認識できる一方で、声の特徴のみを送信するため通信量も最小限で済むというメリットがある。
今のところ、EZナビウォークでの利用にとどまっているが、今後はほかのサービスでの活用も検討していくとしている。
これまで、携帯電話単体で音声認識の処理を行う場合は、処理能力の制約から数十の単語しか認識できなかった。一方のサーバ処理の場合は、携帯電話で録音した音声ファイルをサーバに送ったり、通話サービスを利用するため、通信や通話料金がかかるという欠点があった。
今回開発された声de入力では、携帯電話側で音声の特徴を抽出し、そのデータをサーバに送信することで、サーバ側で音声認識の処理を行っている。そのため、高性能なサーバで処理ができ膨大な単語が認識できる一方で、声の特徴のみを送信するため通信量も最小限で済むというメリットがある。
今のところ、EZナビウォークでの利用にとどまっているが、今後はほかのサービスでの活用も検討していくとしている。
《安達崇徳》