日本音響学会

音のなんでもコーナー

Q and A (115)

Q:

音声認識を利用した字幕放送はどのような番組で実施され,どのような反響があるのでしょうか?

A:

テレビ番組の音声を文字で伝える字幕放送は,日本では1985年に開始されましたが,字幕が付与される番組は長い間,事前に制作された番組に限られていました。海外では高速入力キーボードによって生放送にも字幕が付与されていますが,日本語にはリアルタイムの文字入力方法が確立されていなかったためです。しかし,聴覚障害者の方々の強い要望と技術の進歩により,リアルタイムの字幕放送が近年拡充されてきました。音声認識を利用した生放送の字幕化は,2000年にNHKのニュース番組の一部で始まりました。また,高速入力キーボードを利用したニュースの字幕放送も,2001年に日本テレビとNHK(音声認識と併用)で始まりました。他の民間放送局でも,高速入力キーボードによってニュースや討論番組の字幕化が行われています。ニュース以外の生放送は,NHKが音声認識を利用して2001年に紅白歌合戦,2002年に冬季五輪,W杯サッカー,大相撲の字幕化を行いました。日本テレビも音声認識を利用して,2002年にプロ野球日本シリーズの字幕放送を実施しました。ニュース番組ではアナウンサの音声をそのまま認識しますが,スポーツ番組や歌謡番組では,別のアナウンサが番組音声を聞いて要約しつつ言い直し,その音声を認識するリスピーク方式がとられています。これにより,解説を簡潔にまとめたり,拍手や歓声などの場内の様子を補足したりできます。生番組の字幕放送には,聴覚障害者の方々から多くの反響を得ています。「今まで歌謡番組は楽しめなかったが,出演者がどんな話をしているのかが字幕で分かり,家族といっしょに番組を楽しめるようになった」「試合の流れしか分からなかったスポーツ番組も,選手の心理状態や対戦の意味合いなどが字幕で分かるようになり,楽しみが広がった」といった声が寄せられています。字幕の遅れや表示方法など,まだ多くの課題がありますが,さらなる字幕放送の拡充が期待されています。

(今井 亨:NHK放送技研)