同技術は、NTTグループのAI「corevo®」※2を構成するドコモ独自の音声感情認識技術とEmpathの音声感情解析AI「Empath」の技術をもとに開発した。同技術を用いて自動車とドライバーを感情によって結びつけることで、ドライバーが自動車に愛着をもって楽しく運転したり、運転に集中して居眠り運転の解消などに貢献できる。
2017年11月から2018年3月までの間、ドコモとEmpathは、走行雑音がある環境で音声による感情推定の認識率向上の取り組みを行っている。その結果、停車中のような雑音が小さい条件から高速道走行中のように大きな走行雑音がある条件において、自然に発声された対話音声※3の「怒り」「喜び」「悲しみ」の感情の認識を従来60%程度※4のところ、業界で最高水準の高い平均正答率※5となる75%で実現した。
また、AIが感情を理解して感情にあわせた声かけを行うことで、ドライバーの眠気やだるさなどの倦怠感を表す指標値が50%減少し、被験者の93%はAIが自分の気持ちに寄り添ってくれていると感じて、気分良く運転できることを実証実験にて確認している。
これにより、安心・安全な運転に貢献し、自動車に愛着が生まれるような新たなサービスの創出に取り組んでいく考え。
|
開発技術の概要
1. 技術概要
認識対象の音声に対して声の高さや音色などの音響的な特徴を分析し、あらかじめ機械学習で生成しておいた感情認識モデルを用いて、音響的な特徴からどの感情の音声であるかを推定する。走行時の自動車のエンジン音等の特徴を取り入れた認識モデルの生成技術により、停車中を想定した雑音が小さいSNR(Signal to Noise Ratio:信号対雑音比)が15dB以上の条件から、高速道路走行中を想定した雑音が大きいSNRが0dBの条件において、「怒り」「喜び」「悲しみ」の3感情の平均正答率75%を実現した。