Windowsの音声合成 標準搭載のHaruka, Zira

Windowsに標準で搭載されていてすぐに使用できるSAPI5対応のMicrosoft Haruka Desktop(日本語・女性音声)とMicrosoft Zira Desktop(英語・女性音声)。
結構優秀なのでもっと利用されて良いと思うけど、使ってるという人を殆ど見ない。
日本語担当のHarukaは読み間違いがちらほら。前にも書いたけどTTSの読み間違いは実際には数が少なくてもかなり目立つので間違いだらけという印象になってしまう。
だから読み間違いを補正するための辞書登録が必要なんだけど、Windowsは標準で辞書登録できるようになってない。搭載アプリは使い物レベルにはしたくないというMicrosoftの強い意志?
そこで、今回の動画は辞書登録無しで読ませている。(外部アプリで辞書登録を行うことは可能)
おもしろいのはHarukaに英文を読ませた場合。なぜか上手に日本人的な英語を喋る。日本人英語は単語一つ一つがはっきり聞き取れるのに内容が全然頭に入ってこない不思議。そして、動画の例文では、"who"はもっとも基本的な単語の1つなのに何故かスペル(ダブリュー・エイチ・オー)で読み上げる。この意味解らん挙動も素敵。
英語のZiraは普通に上手。

Harukaの日本語もZiraの英語も流暢なんだけど、何かあまり聞き続けたくない声質なのが残念なところ。
だから使われないの?

他に、Microsoft Haruka Mobile, Microsoft Ayumi Mobile, Microsoft Ichoro MobileがあるけどSAPI5対応ではないので普通には使えない状態。(頑張れば使える)

関連記事:

Androidの英語音声合成 SVOX

前回は日本語の音声合成としてSVOXのMisaki(女性声)とVocalizerのKyoko(女性声), Otoya(男性声)を動画にしたけど、今回は、SVOXのGrace(女性声)とMichael(男性声)に読んで貰った。GraceとMichaelはどちらもアメリカ英語の音声となっている。「がとらぼ」の中の人は英語力が低くてイギリス英語とオーストラリア英語とアメリカ英語の区別がつかないのでTTSの喋りで本当に国別の訛?の違いが解るほど発声の差が生まれるのか不明だけど、一応SVOXではそれぞれ別の声として販売されている。

読み上げる文章は「赤毛のアン」。多くの人が子供のころに観たことがあるだろうアニメ(世界名作劇場)だと第1話は「マシュウ・カスバート驚く」だけど、原作では最初に驚かされるのはグリーン・ゲイブルズの近所の口うるさいレイチェル・リンド夫人。(CHAPTER I. Mrs. Rachel Lynde is Surprised)
と、いうことでそのチャプター1から最初の2段落。

昔の英語の小説は1文がとても長い。原文で読めと言われたら最初の1文でギブアップしたくなる感じ。だから文学は嫌いよ。
そういえば、ドイツ語だと格調が高い文章ほど1文が長くて、下手すると1ページに1文が収まらないくらい長かったりする。あれって文の中の繋がりが全然わからんし、あれもこれも修飾だらけで書かれても内容が頭に1㍉も入ってこないんだけど、ドイツ人は本当に理解してるのかしら。

さて、SVOXの英語の喋りについて。
抑揚は少ないものの「がとらぼ」の中の人に比べれば100倍は流暢に読んでる。
ただし、そのために動画の文章では"Mrs. Rachel"とか"St. Lawrence"などのピリオドを除去している。そうしないとSVOXはそのピリオドを文の終わりとしてそこで一息ついてしまうので非常に聞き難くなる。

英語のTTSは流暢なのが多いのでSVOXが突出して凄いとは思わないけど、まあまあ良い感じに聞こえるのは確か。ときどき二重声とか震え声になるのが残念。あと、ひたすらダーと読んじゃうところ。もっと抑揚やタメがあればかなり人間っぽくなる筈。

前回も書いたけどSVOXはGoogle Playでは購入可能だけど、現在は肝心の音声データをダウンロードすることができないので使えない状態。なので今から買っちゃダメ、ゼッタイ。

関連記事:

Up