日本音響学会

音のなんでもコーナー

Q and A (014)

Q:

最近,音声対話の研究で「自然な発話(spontaneous speech)」という言葉が 目につきますが,その定義,また,「自然さの度合/レベル」のようなものを分類した研究はあるのでしょうか?

A:

「自然な発話」の定義は難しいですが,私個人としては (1)その場でとっさに思いつきでしゃべれる程度の内容と質を持った発話であって(2)一息でしゃべれる長さを持つもの,という感じではないかと思います。つまり,ある状況,(その場)で,限られた時間(とっさ)に,限られた推論と限られた知識(思いつき)を用いて得られた意味内容を限られた時間(一息でしゃべれる)で発話しようとしたときに典型的に現れる現象が,「自然な発話」の特徴であると思います。この対極には read speech (何と訳すんでしょう?)があります。これは,推敲された内容をどうしゃべるかまで考えた上で発話したものと特徴づけられます。人間はできる限り楽をしたいと考える動物ですから,少ない資源を使って発話されたものが,「自然な発話」のような気がします。ですから,もし「自然さの度合」のようなものを考えるのなら,発話するのに費やす資源の量とか,発話の際の制約状況から考え始めると良いのではないでしょうか?

永田 昌明(NTT)