日本音響学会

音のなんでもコーナー

Q and A (050)

Q:

男性の声,女性の声,子供の声は,聞けば区別がつくのですが,具体的にはどこが異なっているのでしょうか?

A:

年齢,性別によって発声器官の形状が異なります。例えば一般に,声道の長さは成人男性,女性を比べると女性の方が約20%ほど短く,成人と子供(10歳)を比べると子供の方が約24%ほど短いとされています。硬口蓋の長さは成人と子供(10歳)を比べると子供の方が約10%ほど短いとされています。また,声を発するための声道の形の調整のしかた(調音)も,成人と子供では多少異なるとされています。例えば,“あ””という母音に関しては,一般に成人は咽頭部のほぼ中央を狭めて発声しますが,子供は少し口腔よりを狭めます。 このような発声器官,調音の違いによって,音声波形のスペクトルの形状,声の高さや大きさが異なってきます。スペクトルの形状は声帯から口唇までの形状と調音によって,声の高さは声帯の形状によって決まってきます。スペクトルの形状,声の高さ,大きさをそれぞれ特徴づける物理的特徴量としては,ホルマント(音声波形のスペクトルの中で,特にエネルギーが集中している周波数成分。ホルマントは声道の共振によるもので,普通,有声音,特に母音には4個程度見られ,低い方から順に第1ホルマント,第2ホルマント,?と呼ぶ。),基本周波数(声帯の振動周期の逆数),音声波の音圧レベルがあります。 男性,女性,子供の声の物理的特徴量の違いについては,特に1960〜70年代に盛んに検討されました([粕谷 他,“年齢,性別による日本語5母音のピッチ周波数とホルマント周波数の変化,””音響学会誌24,6(1968)],[佐藤,“男女声の性質情報を決める要素,””通研実報24,5(1975)],[古井,ディジタル音声処理(第2章)(東海大学出版会)]など)。それらの検討では上記の基本周波数,ホルマント,音圧レベルの物理的特徴量に注目し,分析的に調べています。以下,年齢,性別による,この三つの物理的特徴量の違いについて紹介します。 まず基本周波数に関しては,成人の男女性については,基本周波数の分布は対数周波数軸上で正規分布となり,男性の基本周波数の平均値と標準偏差はそれぞれ125Hz及び20.5Hz,女性ではそれぞれ男性の約2倍に等しいことが分かっています。また,12歳以下(変声期前)の子供については,男女性の差はほとんどないことが分かっています。基本周波数は声帯長と関係があり,成人男性と子供の識別には有効ですが,成人女性と子供の識別は難しく,それだけで年齢を知ることはできないとされています。 話は少し横道に逸れますが,音声認識の分野では一般に,女性や子供の声の認識は難しいとされています。その原因の1つは,基本周波数が高いことにあります。最近の音声認識では,スペクトルの概形を表す音響パラメータ(ケプストラムなど)がよく用いられます。基本周波数が高いと,その音響パラメータによるスペクトルには調波構造が現れてしまい,スペクトルの概形をうまく表すことができないために認識率が低下します。 次にホルマントに関しては,全体的な傾向としてはホルマント周波数は声道の長さに比例して低くなるとされています。しかし,成人の男女性が発声した5母音を詳しく分析したところ,男性のホルマント周波数に対する女性のホルマント周波数の増加率が,母音の種類ごとに,かつホルマント周波数ごとに異なることが分かっています。また,日本語に関しては,高次のホルマント(特に第3ホルマント)は,母音の種類によって変動することが少なく,声道の長さに対応して,男女性別の識別に有効な特徴であるとされています。 最後に音声波の音圧レベルに関しては,成人の男女性が十数分間に渡って発声した音声波について,その音圧レベルの累積分布を調べたところ,男性,女性ともにほぼ正規分布となり,標準偏差はともに約3.8dBですが,男性の方が女性よりも平均で約4.5dB高いことが分かっています。

執筆者:松井 知子(NTT)