音声によって操作されるデジタル機器の利用可能性は急速に拡大しています。しかし、音声インタフェースは、公共の場での利用が困難、騒音化で精度が下がるなどの課題があります。SottoVoce (ソット・ヴォーチェ、音楽用語で 「ささやくように」)は,超音波エコー映像を用いて,利用者の無発声音声(サイレント・ヴォイス)を検出するシステムです。顎の下側に取り付けられた超音波イメージングプローブによって観察される口腔内の情報から,利用者の発話内容を深層学習によって認識します。

技術内容

音声によって操作されるデジタル機器の利用可能性は急速に拡大しています。しかし、音声インタフェースは、公共の場での利用が困難、騒音化で精度が下がるなどの課題があります。SottoVoce (ソット・ヴォーチェ、音楽用語で 「ささやくように」)は,超音波エコー映像を用いて,利用者の無発声音声(サイレント・ヴォイス)を検出するシステムです。顎の下側に取り付けられた超音波イメージングプローブによって観察される口腔内の情報から,利用者の発話内容を深層学習によって認識します。将来のウェアラブルコンピュータでの入力手段として、また、有声発声が困難な方への支援技術としての発展を目指し研究を行っています。

審査委員講評

口腔内の超音波画像を深層学習を用いて分析することで、無発声発話を実現した本技術は、患者やご家族の前でのチーム医療などのサービス現場のニーズにも合致しており、社会的価値も高い。