日本語音声合成システムの概要図
NHK放送技術研究所は、AI(人工知能)を活用して、より流暢で自然な発声を実現する新たな音声合成技術を開発した。
これまで日本語の音声合成方式では、「漢字仮名交じり文」をそのまま入力データとしても、漢字に複数の読み方が存在するためAIがうまく学習できないという課題があった。今回の開発では、「漢字仮名交じり文」から「仮名文字と韻律記号」を自動的に生成し、それを「系列変換モデル」の入力データとすることで大量のデータを効率的に学習させ、合成音声の品質を向上させることに成功したという。
また、仮名文字と韻律記号を簡単に編集できるユーザーインターフェースや、口調をニュース調や会話調などに切り替えられる技術も開発し、さまざまな番組の演出要件への対応も可能にした。今回の研究成果は、10月17日にBS1で放送した「ワールドニュース特集」で使用した。