超福祉展2020 NT&DNPが「感情表現字幕システム」出展

 「2020年、渋谷。超福祉の日常を体験しよう展(超福祉展)」(主催:特定非営利活動法人ピープルデザイン研究所)が9月2日(水) 〜 9月8日(火)に渋谷ヒカリエで開催された。 超福祉展は、障害者をはじめとするマイノリティや福祉そのものに対する「心のバリア」を取り除こうと、2014年より毎年11月の一週間、渋谷ヒカリエを中心に開催を続けている展示会。東京オリンピック・パラリンピックの延期や、新型コロナウイルス感染拡大の影響が続く中、2020年で最終回を迎える超福祉展は、展示・シンポジウム・体験イベント等をすべてオンラインでも開催した。 東京・渋谷を基点に、日本のみならず世界の各都市をオンラインでリアルタイムでつなぎ、世界各地の超福祉な人たちの活動や、ダイバーシティやSDGsに関する知見やアイデアをシェア。プロダクトやサービスの展示紹介、疑似体験などもオンラインで展開した。展示された製品を一部を紹介する。 NHK テクノロジーズ(NT)と大日本印刷(DNP)は、映像と音声をAI(人工知能)で解析し、内容や感情に合わせた最適なイメージのフォントで字幕を表示する「感情表現字幕システム」のプロトタイプを展示した。同システムは、2018 年に DNP が開発した文章の内容に合うフォントを自動で判別して表示する「DNP 感情表現フォントシステム」 を活用し、耳の不自由な方や音が出せない環境でも、番組の臨場感を伝えることができる。 NTでは 2018 年度に「多様な視聴者が番組やコンテンツを楽しめる」をテーマに聴覚に障がいのある方とディスカッションを行い「これまでの字幕放送はフォントに抑揚が無い」、「タイミングがずれることがある」、「発話者がわかりにくい」といった課題があがる一方で、映像効果としてテロップに使われるユニークなフォントは印象深くなるという意見があったという。また、制作側では番組に字幕を入れる作業が大きな負荷になっており、自動的に精度の高い字幕を付与できる技術が求められていた。こうしたニーズを受けて、両社は「感情表現字幕システム」の共同開発に至ったという。 感情表現字幕システム」の特長としては、録画やライブ(生放送)の音声を解析して、リアルタイムで字幕を自動的に付与する。その際、字幕の内容や発話者の表情を解析して感情を把握し、その感情の表現に最適なフォントを 12 種類の中から自動で選んで字幕に使用する。例えば、楽しい内容は丸みのあるフォントで、怒っている内容は角ばったフォントで表示することで、より直感的に内容を伝える。 また、映像内の発話者を特定して、自動的にその口元の近くに字幕を表示することができる。これにより、複数の人物が登場する映像でも、誰が何を話しているかを直感的に伝えることができる。 これらの処理はすべてクラウドで行っており、処理時間は約7秒程度。感情表現は日本人は欧米人に比べ表情の変化が小さく、難しい部分があったという。 NTとDNPは、「感情表現字幕システム」の開発を継続し、字幕放送(オープンキャプション)での実用化を目指すとしている。多様なフォントは現行のTVでは対応していないため、インターネット配信などへの展開を考えている模様。また、音声認識や感情認識のAIの精度を向上させるほか、リアルタイム性の向上も進め、生放送やインターネット同時配信サービスの字幕(クローズドキャプション)への展開も目指す。さらにDNPは、デジタルサイネージ等の動画の字幕に応用するほか、誰でも利用できる映像編集用ソフトウェアとして提供していく計画。 オカムラは、座ったままの姿勢で安心・安全にスムーズに移動できるチェア「ウェルツ」を展示した。大型車輪は着座時の身体の重心付近に配置することで、旋回半径が小さく、その場での旋回性に優れている。オフィスや工場などの「はたらく場」だけでなく、美術館や図書館などの公共施設でも、多様な人々の活躍をサポートする。バッテリーはニッケル水素電池を使用。前進・後進、左右に自由自在に動ける。後進時のスピードは前進の半分にするなど安全面にも配慮されている。 この他、ピクシーダストテクノロジーズ抱きかかえることで、音楽を視覚(光)と触覚(振動)で楽しむことができる音楽装置「SOUND HUG(サウンドハグ)」を展示していた。