日本音響学会

音のなんでもコーナー

Q and A (086)

Q:

最近,PCソフトやカーナビなどで,規則合成音声を聞くことが多くなってきていますが,この規則合成音声の評価実験で注意すべき点はどんなことでしょうか?

A:

合成音声は大きく録音再生によるものと規則音声合成によるものとに分けられます。また,アプリケーションによっては,これらを組み合わせたものも存在します。従って,はじめに,評価対象の合成音声が規則音声合成方式によるものであることの確認が必要となります。録音再生による音声合成では,物理的な歪尺度で評価できますが,規則合成音声の場合,このような歪で評価することはできず,人間が聞いて評価する主観評価が用いられます。そのため,目的にあった評価方法を選択する必要がありましたが,今まで日本では規則音声合成のための標準的な評価方法が確立されておらず,評価する人が,評価方法から考える必要がありました。2000年3月に(社)日本電子工業振興協会(JEIDA)で「JEIDA-G-24-2000音声合成システム性能評価方法のガイドライン」が制定されましたので,評価方法についてはこのガイドラインを参考にすることができ,評価実験での注意点も述べられています。主観評価を用いるため,合成音声を聴取する評定者については,なるべく人数を多くし,年齢・性別の偏りがないことが望ましいです。また,合成音声の聴取に対する学習効果が大きいため,受聴経験には注意が必要です。了解性の評価では無意味な音節などの単位の試験音声を対象とした明瞭度,有意味な単語や文を単位とした場合の了解度に区別されます。試験する単位によって,音節明瞭度,単語了解度,文章了解度などに分けられます。また,自然性,個々の了解性ではなく音質を総合的に評価すること,利用目的に適合しているかどうかの評価が考えられます。いろいろな方法があるため,何を評価したいのかの目的に応じて,評価方法を選択する必要があり,注意を要する点です。

赤羽 誠(ソニー)