Windowsの音声合成 IVONA Voices 2

Windows用にももちろん流暢なTTSが販売されている。

今回は多国語向けに多くの音声をリリースしているIVONA Voices 2。これはちょっと古くて、IVONAは現在販売がどうなっているかわからない

動画はアメリカ英語のJennifer(女性)とEric(男性)の読み上げ例。文章は例によって赤毛のアンの第一章の最初の2段落。
IVONA 2は英語の文章を非常に上手く扱う。例えば、動画の最初。CHAPTER Iは文章の扱いが下手だと「チャプター・アイ」と読んでしまうが、IVONA 2では「チャプター・ワン」と読む。流石だぁね。

ところどころ発声が崩れたり合成音声らしい部分が出てしまうが、上手に読んでいるところだけを聞いたら人間なのか合成音声なのか区別つかないくらい。そして声質がとても良い。EricとJenniferはちょっと低めの声なので萌え声が好きな人には合わないだろうけど、アナウンサー声が好きな人にはしっくりくるのでは。もっと柔らかい声もあるのでその辺りは好みのものを選べばいいこと。

ところで、動画にしたJenniferとEricは個人的にはとても好みだったのに何故か今年の春でラインナップから外されてしまったみたい。良い声なのに何で?

IVONAは現在Amazon Pollyで利用できるようになっているようだが、安価に利用を始められるけど後で高くつく方式なので注意。
IVONAの現在の声のラインナップとサンプル。日本語音声としてはMizuki(女性声)がある。

関連記事:

Windowsの音声合成 標準搭載のHaruka, Zira

Windowsに標準で搭載されていてすぐに使用できるSAPI5対応のMicrosoft Haruka Desktop(日本語・女性音声)とMicrosoft Zira Desktop(英語・女性音声)。
結構優秀なのでもっと利用されて良いと思うけど、使ってるという人を殆ど見ない。
日本語担当のHarukaは読み間違いがちらほら。前にも書いたけどTTSの読み間違いは実際には数が少なくてもかなり目立つので間違いだらけという印象になってしまう。
だから読み間違いを補正するための辞書登録が必要なんだけど、Windowsは標準で辞書登録できるようになってない。搭載アプリは使い物レベルにはしたくないというMicrosoftの強い意志?
そこで、今回の動画は辞書登録無しで読ませている。(外部アプリで辞書登録を行うことは可能)
おもしろいのはHarukaに英文を読ませた場合。なぜか上手に日本人的な英語を喋る。日本人英語は単語一つ一つがはっきり聞き取れるのに内容が全然頭に入ってこない不思議。そして、動画の例文では、"who"はもっとも基本的な単語の1つなのに何故かスペル(ダブリュー・エイチ・オー)で読み上げる。この意味解らん挙動も素敵。
英語のZiraは普通に上手。

Harukaの日本語もZiraの英語も流暢なんだけど、何かあまり聞き続けたくない声質なのが残念なところ。
だから使われないの?

他に、Microsoft Haruka Mobile, Microsoft Ayumi Mobile, Microsoft Ichoro MobileがあるけどSAPI5対応ではないので普通には使えない状態。(頑張れば使える)

関連記事:

Up