今度の合成音声はナレーション! 〜 富士通研、人間の声に迫る自然な音声合成の技術を開発
エンタープライズ
その他
注目記事
-
【デスクツアー】真似したい自宅デスク環境一挙公開!
-
富士通研、携帯電話用OSで利用可能なIP電話基盤技術を世界で初めて開発 〜 Symbian OS、Androidなどに対応
-
「シャングリ・ラ」の北条國子を思い通りにしゃべらせてみよう!

従来の合成音声は、プロのナレータの音声に対して不自然さが感じられ、放送やアナウンスなどプロのナレーターの代替として十分に利用されていなかった。人が文章を読み上げる際、いくつかの音が自然にまとまり、無意識のうちに日本語独特のリズム(発話リズム)で発声されている。音声合成で人間らしい流暢な語り口を実現するためには、このような発話リズムを適切に制御することが必要だった。また、どんな文章の入力に対しても最適な音声波形を用意できる音声波形データベースを開発することが課題とされていた。
今回富士通研では、独自の発話リズム制御モデルと音声波形データベースを開発し、きわめて自然で人間の声に迫る高品質な音声合成技術を実現した。人間らしい流暢な音声を実現させるために、人間の発話リズムを解析するためのあらたな統計手法を開発し、独自の発話リズム制御モデルを構築したという。これにより、各音の長さについて、肉声との差を従来の3分の2(富士通研究所比)に抑え、1つ1つの音の長さのバランスがとれた、流暢な読み上げ音声を実現した。さらに、さまざまなイントネーションを網羅し、かつ使用頻度の高い単語や文例を中心とした、従来の約10倍(富士通研究所比)となる数万個ものフレーズからなる大規模音声波形データベースを構築。本データベースを用いることで、合成文章に適した音声波形を選択でき、各単語間のつながりなど、機械的な歪みのない合成音声が生成できるようになったとのこと。
この音声合成技術により、放送コンテンツや各種アナウンス、e-Learning教材用音声など、従来ナレーターが担ってきた分野において、低コストな合成音声での代替が可能になる見込みだ。富士通研究所は、各種利用シーンに対して迅速な適用を可能にするための機能強化を図り、2009年度上期中の実用化を目指すとのこと。
《池本淳》
特集
この記事の写真
/
関連リンク
関連ニュース
-
富士通研、携帯電話用OSで利用可能なIP電話基盤技術を世界で初めて開発 〜 Symbian OS、Androidなどに対応
エンタープライズ -
「シャングリ・ラ」の北条國子を思い通りにしゃべらせてみよう!
エンタメ -
【富士通フォーラム(Vol.1)ビデオニュース】タッチ感覚で認証!手のひら静脈認証の高速撮影技術!
ブロードバンド -
富士通とウィルコム、電源オフでも遠隔操作できるノートPCの紛失・盗難対策ソリューションを開発
エンタープライズ -
富士通ME、HD映像の伝送が可能な「1394 Automotive」規格準拠LSIを新発売
エンタープライズ -
口コミや声優情報も〜アニメポータル「アニメワン」オープン
エンタメ -
NEC、音声だけでテキスト装飾されたブログが投稿可能な技術を開発
エンタープライズ -
テキストを書くだけで映像ができる「T2Vプレイヤー」、IRIが無償提供
ブロードバンド -
富士通、札幌市ユビキタス特区でのLTEフィールド実証実験を実施 〜 光回線の2.5倍速を計測
エンタープライズ -
富士通研、宛先ミスから機密情報流出まで対策が可能な、メール情報漏洩対策技術を開発
エンタープライズ -
東芝、富士通からのHDD事業譲渡に基本合意
エンタープライズ -
富士通研、ブレードサーバの高速化を実現する多チャネル高速送受信回路を開発
エンタープライズ -
富士通、国際標準化団体TCGの新仕様に対応したHDDセキュリティ技術を開発
エンタープライズ -
人気ホラーアニメ「地獄少女」でユーザー参加型ネットラジオ
エンタメ -
【MS Car Navigation Day Vol.7】Embedded CEによるPND開発——富士通ソフトウェアテクノロジーズ
エンタープライズ