相手の声を聞いただけで、「あれ、今日は元気がないな」とか、「どうも虫の居所が悪いようだ」などと感じた経験は誰にでもあるだろう。声にはその時々の感情が反映されやすいが、最新の音声分析技術を用いると心の健康度や病気までがわかるという。PST(神奈川県横浜市)が開発した「MIMOSYS(Mind Monitoring System=ミモシス)」は、声から心の元気度を測るソフトウエア。2017年の上市以降、ヘルスケア領域で活用され、スマホの無料アプリにもなっている。

さらに、この進化形として現在、研究開発中なのが、声で病気がわかる新技術「VOISFIA(ボイスフィア)」だ。声を分析するだけで、うつ病や認知症、パーキンソン病などの病気が判別可能だという。PSTでは、これを診断補助ツールとして完成させ、数年後には医療機器の認証も取りたいと意気込む。

診療の際は体温や血圧などと同じように、声も測る──。そんな光景が将来、普通に見られるようになるかもしれない。コロナ禍でオンライン会議や遠隔診療などが広がる中、非接触でも採取可能な声は新たな生体情報(バイオマーカー)として注目されている。

 スマホに向かって言葉を発すると、声を自動的に分析して心の元気度を示してくれる──。そんなアプリが無料で利用できるというので、筆者も早速ダウンロードしてみた。

ミモシスの画面。言葉を発した時点での心の状態が「元気圧」として表示される(左)。直近2週間の心の元気さの傾向を示す「心の活量値」もグラフで示される(右)。心の健康のセルフチェックに役立つ(出所:PST)
[画像のクリックで拡大表示]
ミモシスの画面。言葉を発した時点での心の状態が「元気圧」として表示される(左)。直近2週間の心の元気さの傾向を示す「心の活量値」もグラフで示される(右)。心の健康のセルフチェックに役立つ(出所:PST)
[画像のクリックで拡大表示]
ミモシスの画面。言葉を発した時点での心の状態が「元気圧」として表示される(左)。直近2週間の心の元気さの傾向を示す「心の活量値」もグラフで示される(右)。心の健康のセルフチェックに役立つ(出所:PST)

 アプリの名前は「MIMOSYS(ミモシス)」。やり方は簡単で、「いろはにほへと」「ガラパゴス諸島」「がんばるぞー」など、画面に提示される言葉を6つ以上発すると音声を分析して、その時点での心の元気さを表す「元気圧」や直近2週間の心の元気さの傾向を示す「心の活量値」を表示してくれる。継続的に利用すれば、週ごと月ごとのデータもグラフ化されるので、心の状態がどう推移するか把握できる。

 PSTと共同研究をしている医師で東京大学大学院工学系研究科音声病態分析工学講座の徳野慎一特任教授は、次のように話す。

 「元気圧は計測時点での心の状態を表すので、その時々の状況やストレスに応じて変動する。元気いっぱいのときに測定すれば高くなるし、いやなことがあったときなら低くなる。体調がよくないときも下がりやすい。実際、急に低値になったと思ったら、その後インフルエンザを発症したという例もあった。一方、心の活量値では、心の状態の時系列的な傾向がつかめる。じわじわと右肩下がりになっていたら要注意。放っておくと、うつ病を発症するリスクがある」

東京大学大学院工学系研究科音声病態分析工学講座の徳野慎一特任教授(写真:的野 弘路)
東京大学大学院工学系研究科音声病態分析工学講座の徳野慎一特任教授(写真:的野 弘路)
[画像のクリックで拡大表示]

 感情は常に変化しているし、当の本人がストレスに気づいていないことも多い。そんな心の状態を声の分析を通して「見える化」することで、不調のサインにいち早く気づくことができる。心の健康が損なわれているとわかれば、早めに休養を取ったりストレスを発散したりして、病気になる前に手を打つことも可能だ。体温計や血圧計、体重計などで体調を管理するのと同じように、声で心の健康状態も日常的にチェックできるわけだ。

なぜ声で心の状態がわかるのか

 それにしても、なぜ声で心の状態がわかるのか。鍵を握るのは、声帯の不随意反応だという。

 「声帯はもともと副交感神経である反回神経の支配を受けているが、脳がストレスを感じると交感神経の方が優位になる。すると声帯の筋肉が収縮して固くなり、周波数が高くなってしまう。緊張したときに声が上ずったり、びっくりしたときに声が裏返ったりするのは、このため。このような声帯の反応は自分の意思ではコントロールできない不随意反応。つまり、声は“嘘”をつけない。ミモシスでは、この不随意反応と普段意識的に言葉を発しているときの随意反応とを組み合わせ、周波数の変動パターンなどを分析することで心の状態を測定している」(徳野特任教授)。

緊張すると自然と声が上ずったり、心臓がドキドキしたりする。これは脳が受けたストレスが反回神経(副交感神経系)を伝わって声帯や心臓に伝わるから。ストレス下では声帯の筋肉がこわばり、周波数が高くなる。これは自分の意思では制御できない不随意反応だ。一方、リラックスしているとき、声帯は緩み、周波数は自ずと低くなる。ミモシスでは、これらの反応を通して心の元気さを分析する(出所:徳野特任教授)
緊張すると自然と声が上ずったり、心臓がドキドキしたりする。これは脳が受けたストレスが反回神経(副交感神経系)を伝わって声帯や心臓に伝わるから。ストレス下では声帯の筋肉がこわばり、周波数が高くなる。これは自分の意思では制御できない不随意反応だ。一方、リラックスしているとき、声帯は緩み、周波数は自ずと低くなる。ミモシスでは、これらの反応を通して心の元気さを分析する(出所:徳野特任教授)
[画像のクリックで拡大表示]

 徳野特任教授はミモシスの精度を医学的に検証している。例えば、心の活量値を調べることで、うつ病患者と健康な人を高精度に判別することができたという。うつ病患者では健康な人に比べ、心の活量値が明らかに低くなるからだ。

 また、自衛隊のレンジャー訓練参加者を対象にした精度検証も行った。ミモシスの元気圧は、訓練前より訓練中に低くなり、訓練後は再び上がった。つまり、訓練中は訓練前よりストレスが多くなり、訓練が終わった後はまたストレスが少なくなっていた。これは同時に行った心理テストと血液バイオマーカー(BDNF値)検査の結果と同じ傾向だった。ミモシスでも従来の検査手法と同様の結果が得られたわけだ。

 徳野特任教授は、防衛医科大学校などで自衛官のストレス研究に携わり、また陸上自衛隊の医官としてイラクや東日本大震災などの復興支援にも当たってきた。そのような経験を積む中で必要性を痛感したのが、ストレスや心の状態を測定できる客観的な指標だったという。

 「ストレスや抑うつ状態を調べるには自己記入式のアンケートを用いるのが一般的だが、これはあくまで主観的な指標。本人がストレスを過小評価していたり、自覚していなかったりする『報告バイアス』があると、正しい結果は得られない。とりわけ厳しい訓練で鍛えられてきた自衛官の場合、ストレスを抱えていても弱音を吐かず、ぎりぎりまで頑張ってしまう。そして、突然バタンとつぶれてしまうことも珍しくない。もっと早く心の不調を捉えて手を打つには、主観的な指標ではなく、ストレスの度合いを定量化できる客観的な指標が不可欠と考えた」

“ボイスバイオマーカー”として国際的にも注目、一方で課題も…

 そこで徳野特任教授は血液や唾液に含まれる物質をバイオマーカーにしてストレス度を測定する方法を模索していたが、コストや反応性などの問題から断念。そんなとき、たまたま音声感情認識技術の開発に携わっていた東京大学大学院工学系研究科の光吉俊二特任准教授と出会い、共同研究を行うことになったという。

 「声は血圧や体温、血液などと同じバイオマーカーの一つとして非常に有望だと思った。しかも、話してもらうだけなので採取も簡単。注射で採血するような痛みもない。最近は“ボイスバイオマーカー”と呼ばれ、国際的にも注目されている。我々が共同研究を始めた10年ほど前は論文検索をしても1、2件ほどしかヒットしなかったが、現在は年間1000件程度は出てくる」

 ただし、バイオマーカーとして認知されるようになるにつれ、課題も出てきたという。プライバシー保護という壁だ。「ミモシスが登場した当初は、携帯電話で話す声をそのまま自動録音して分析していたが、プライバシー保護の観点からそれができなくなり、現在のような定型文を読んでもらう仕様になった」と徳野特任教授。声は個人情報の一つであり、健康データでもある。プライバシー保護やデータ管理の問題は、ミモシスの技術が今後いろいろな場面で応用されていく上で避けては通れない課題になるという。

 現在、ミモシスは企業や自治体などが運営するメンタルヘルス領域のサービスにも活用されている。PST代表取締役の大塚寛氏はこう語る。

 「ミモシスは車にたとえると“エンジン”に相当する。我々はエンジンを開発してメーカーに供給し、メーカーがこれを搭載した独自の“車”を造り上げる。社会的な需要やインフラに応じて様々な車の形態が考えられ、用途に応じてエンジンが活用される。将来的にはロボットへの搭載も考えている」

PST代表取締役の大塚寛氏(写真提供:PST)
PST代表取締役の大塚寛氏(写真提供:PST)
[画像のクリックで拡大表示]

 ミモシス活用の第1号となったのは、日立システムズが2017年から企業向けに始めた「音声こころ分析サービス」だ。スマホなどから声を録音すると、音声データが日立システムズのクラウド上で分析され、スマホやパソコンの画面に結果が表示される。

 結果は本人の同意の下、産業医なども閲覧できる仕組み。心の活量値が低下してメンタルヘルスに問題ありと判断されれば、早期に産業医が本人との面談を行い、うつ病などへの進展を防ぐという。

 2015年から社員50人以上の事業所にストレスチェックが義務化され、企業には社員のメンタルヘルス対策が求められるようになった。声による分析は、心の不調を早期に発見し、悪化を防ぐツールとして役立つ。

 ミモシスはこの他、神奈川県が県民の健康増進を促す目的で開発した公式アプリ「マイME-BYOカルテ」や、スマホにプリインストールされたヘルスケアサービスアプリなどにも導入されている。

コロナ禍での興味深い“発見”も

 さらにPSTでは海外への展開も計画しているという。

 「ミモシスは周波数などの生体情報を通して音声分析をしているので、言語に依存しないという特長がある。つまり、日本語だけでなく多言語に対応できる。現在、ヨーロッパなど7カ国での事業展開を準備している」(大塚氏)

 また、2019年からは米国ジョージア州と「クライシス・マネジメント・システム」の共同研究を開始した。ジョージア州では退役軍人のメンタルヘルス不調に伴う自殺率の上昇が社会問題になっており、予防につなげるシステム作りが進められているという。

 「現状では、日本での“命の電話”に相当するクライシス・コールセンターの担当者が、相談者の気分状態や緊急性を判断して対応に当たっている。ここに当社のミモシスの技術を加えることで、自殺予防のシステム向上につなげたい。相談者の気分状態をコンピューターで定量化し、緊急性を適正に判断できるトリアージ手法を目指すべく、共同研究を進めていく」と大塚氏。共同研究には徳野特任教授も参加している。2021年には自殺予防をテーマにした国際会議(Zero Suicide International Summit)が横浜で開催されることも決まったそうだ。

 ただ、今年は新型コロナウイルスの世界的な感染拡大のため、海外展開や共同研究などは一時停止を余儀なくされた。しかし、その一方で非常に興味深い“発見”もあったという。

 「新型コロナウイルスの感染が広がる中、スマホで継続的にミモシスを使っている全国のユーザー間で、心の元気度が同時に低下傾向を示すという現象が起きた。このようなことは今回が初めて。いわばコロナ禍によって日本人全体の元気度が落ちたと解釈できる。個人の心の状態だけでなく、マスで見ると日本人全体の心のトレンドまでがわかり、興味深い。詳しく調べて論文にまとめたい」と徳野特任教授は話す。

声から病気を判別する新技術とは

 ミモシスは音声からストレスを定量化するが、その進化形とも呼べるのが現在開発中の声から病気を判別する新技術「VOISFIA(ボイスフィア)」だ。声を分析することで、うつ病や認知症、パーキンソン病などの病気を見分けることが可能だという。

 「うつ病と認知症とパーキンソン病は、症状がよく似ている。例えば言葉がスムーズに出てこないのは、うつ病で気分がすぐれないからなのか、認知症でもの忘れがあるからなのか、あるいはパーキンソン病で声が出にくいからなのか、医師でも慣れていなければ判別するのは難しい。しかし、独自の音声指標を用いて分析するとそれらには明らかな違いがあり、識別可能なことがわかってきた」(徳野特任教授)

縦軸は音声分析に基づいて、うつ病、パーキンソン病、認知症ごとに開発された試験的指標。横軸は各疾患の重症度を示す。音声分析による指標と疾患の重症度との間には相関が認められる(出所:徳野特任教授)
縦軸は音声分析に基づいて、うつ病、パーキンソン病、認知症ごとに開発された試験的指標。横軸は各疾患の重症度を示す。音声分析による指標と疾患の重症度との間には相関が認められる(出所:徳野特任教授)
[画像のクリックで拡大表示]

 病気の診断がついている患者に定型文を読んでもらい、声の周波数や特徴量などを独自に解析して、病気ごとの共通点を見つける。認知症にはいろいろなタイプがあるが、アルツハイマー型認知症とレビー小体型認知症の識別も可能だという。

 「今後は脳血管性認知症と前頭側頭型認知症の判別もできるようにしたい。また、うつ病の場合は大うつ病と双極性障害、非定型うつ病を区別できることも判明した。これからも研究を重ねて精度を高め、ボイスフィアを診断補助ツールとして完成させたい。数年後を目途に医療機器としての認定も目指す。アフターコロナは、遠隔医療やロボットなど非接触技術への需要が今以上に大きくなるだろう。バイオマーカーとしての“声”の出番はますます増えるはずだ」と大塚氏は熱く語る。

 現在、PSTでは医薬品医療機器総合機構(PMDA)とボイスフィアの治験計画について話し合いを進めている。そう遠くない将来、診療の場で血圧や体温などと同じように、声も測る──。そんな光景が当たり前になる日がやって来るのかもしれない。

徳野慎一(とくの・しんいち)
東京大学大学院工学系研究科バイオエンジニアリング専攻
音声病態分析工学講座
特任教授
徳野慎一(とくの・しんいち) 1988年、防衛医科大学校卒業。医学博士。スウェーデン・カロリンスカ大学大学院留学、自衛隊中央病院心臓血管外科、陸上自衛隊師団医務官、防衛医科大学校准教授、陸上自衛隊衛生学校主任教官などを経て、2014年より東京大学医学部付属病院特任准教授。20年から現職。神奈川県立保健福祉大学ヘルスイノベーションスクール教授も務める。
大塚寛(おおつか・ひろし)
PST株式会社代表取締役
大塚寛(おおつか・ひろし) 大学卒業後、1995年にスーパーコンピューターメーカーの日本クレイ株式会社入社。2001年、日本SGIと合併。グラフィックスビジネス部長、執行役員戦略事業推進本部長を経て、08年、セグウェイジャパン株式会社代表取締役社長(現会長)。16年、PST株式会社代表取締役。つくば市ロボット特区実証実験推進協議会副会長、アキバロボットポーターサービス実証実験委員、デジタルハリウッド大学院大学非常勤講師も務める。

(タイトル部のImage:patpitchaya -stock.adobe.com)