日本音響学会

音のなんでもコーナー

Q and A (020)

Q:

最近 Auditory Scene Analysisということばをよく聞きますが,これはどんな意味ですか?

A:

聴覚の情景分析 (auditory scene analysis) とは,我々の聴覚系が行っている,耳に届いた音と音源の間に適切な対応を与える働きを表す言葉です。情景分析という言葉は,情景という言葉から分かるように,聴覚ではなく視覚に関する言葉です。視覚において,3次元的な外界の映像は,いったん2次元的な広がりを持つ網膜に投影され,神経信号に変換されます。脳においてそこから再び3次元表象が構成されます。視覚系は2次元的な情報を解釈し,どの知覚的要素がどの対象に属しているかを組み立てることができ,外界の対象との対応をつけています。この働きを情景分析と呼び,視覚の心理学においては体制化の過程として長い研究の歴史を持っています。聴覚におけるこの種の研究は,視覚に比べるとかなり遅れていて,この20〜30年の間にようやく行われるようになってきました。それまで聴覚の研究は,主に音の分析,すなわち音の個々の物理的特性(周波数,強さなど)と知覚(音の高さ,大きさなど)との対応を明らかにすることが主流でした。 そのような研究によって,聴覚系の分析特性については相当の研究の蓄積があり,かなりの部分が明らかにされてきました。しかし,このような音の分析は聴覚系が行っていることの一部であって,それを集めても我々が何を聞いているかを理解することにはなりません。我々の日常生活において,耳には様々な音が混じり合って届いています。聴覚系は,その中から適切な要素を取り出してまとめ,音源に対応させているのです。この働きを聴覚の情景分析と呼びます。具体的には,例えばカクテルパーティ効果が生じるような状況において,耳には何十人もの人の声が入ってきます。その中から特定の人の声を聞き取ることができるのはどうしてでしょうか。オーケストラの音の中から特定の楽器の音を聞き分けることができるのはどうしてでしょうか。このような問いに答えようとするのが聴覚の情景分析であるということができます。耳に届いた様々な聴覚信号は,いったん,個々の知覚的属性に対応した神経信号に変換されます。聴覚系はそれらをそれぞれの音源に割り振って音の表象として再構成しています。 それぞれの知覚的属性(音高,大きさ,開始,終了など)を音源に対応させるために,我々の聴覚系はいろいろな原則や文法のようなものを用います。聴覚の情景分析の研究はそれらを明らかにしようとするものなのです。Albert Bregman はこのような考えに立ち,大著‘Auditory Scene Analysis;the Perceptual Organization of Sound’(1990)を発表しました。彼は,音脈分凝(auditory stream segregation)あるいは音脈化(streaming)と呼ばれる現象に関する一連の研究に基づいて,聴覚の情景分析の概念について体系的にまとめました。この本については,音響学会誌1992年第48巻第10号に中島祥好氏による書評が掲載されていますので参照して下さい。

佐々木 隆(宮城学院女子大)