2022年のGoogleのAI研究の成果と今後の展望~医療編~(2/2)まとめ

ヘルスケア

1.2022年のGoogleのAI研究の成果と今後の展望~医療編~(2/2)まとめ

・産科超音波検査は、質の高い妊産婦ケアの重要な要素ですが低・中所得国の女性の50%が超音波検査を受けられない
・低価格でバッテリー駆動の超音波診断装置とスマートフォンでる超音波ビデオのデータを自動的に解釈する装置を考案
・完成した医療質問応答製品ではないが医療に関する質問に詳細な回答を生成可能な大規模言語モデルMed-PaLMも発表

2.医療分野におけるジェネレーティブAI

以下、ai.googleblog.comより「Google Research, 2022 & beyond: Health」の意訳です。元記事の投稿は2023年2月23日、Greg CorradoさんとYossi Matiasさんによる投稿です。

後ろの方に、GPT-3.5とGoogleの医療質問応答用LLMであるMed-PaLMの比較のグラフが出てきます。14日に発表されたGPT-4.0との比較が気になるところかもしれませんが、実は同14日にGoogleにMed-PaLM2というモデルが発表されており、Med-PaLMが医師免許形式の質問で「合格点」に達した初のモデルであるのに対して、Med-PaLM2は一貫して「専門家」の医師同等の回答をするレベルに達しているとの事です。直接的な比較図は見つけられませんでしたが、14日にぶつけてきたと言う事は、まぁ、相当な自信があるという事なんだろうな、と思います。

それにしても、眼前で繰り広げられる巨大ゴリラ同士の殴り合いを横目でみつつ、あまりに早いAI技術の進化にどうすれば追いついていけるのだろうかと焦燥感さえも感じる昨今です。

アイキャッチ画像はstable diffusionのカスタムモデルによる生成

毎年、妊娠・出産に伴う合併症は、29万5千人の妊産婦死亡と240万人の新生児死亡の原因となり、世界の低所得者層には不釣り合いな影響を及ぼしています。産科超音波検査は、質の高い妊産婦ケアの重要な要素ですが、低・中所得国の女性の最大50%が、妊娠中に超音波検査を受けられません。

しかし、超音波探査機を操作し、その陰影画像を解釈するスキルと専門知識を持つ現場技術者の不足という決定的な欠点があります。もちろん、遠隔読影は可能ですが、インターネット接続が不安定であったり、速度が遅かったりする環境では、現実的ではありません。

MLで強化された適切なモバイル超音波があれば、助産師、看護師、地域医療従事者などの関係者は、最も必要とする人々に産科超音波を届け、手遅れになる前に問題を発見できる可能性があります。

これまでの研究で、畳み込みニューラルネットワーク(CNN:Convolutional Neural Networks)が、訓練を受けた超音波検査士が標準化された取得手順を用いて取得した超音波を解釈できることが示されていました。

AIが救命につながる情報にアクセスしやすくする可能性がある事を認識し、私たちはここ数年、学術パートナーと共同で研究を進めてきました。

米国とザンビアの研究者と協力して、超音波プローブを母親の腹部に当てるだけで得られる超音波ビデオのキャプチャを自動的に解釈するように機能を改善・拡張しました。この使い方は専門家でない人でも、簡単に教えることができる方法です。


この超音波取得手順は、数時間の超音波トレーニングで初心者でも行うことができます。

低価格でバッテリー駆動の超音波診断装置とスマートフォンだけを使うこの手法の精度は、プロの超音波診断士が妊娠年齢や胎児の悪阻を推定するための既存の臨床基準と同程度です。


このAIを活用した施術の精度は、臨床標準の妊娠年齢推定と遜色ないものです。

私たちは、携帯型医療用画像診断における広範な変革の初期段階にいます。将来的には、MLを利用したモバイル超音波診断が携帯電話の内蔵センサーを強化し、最小限のトレーニングで幅広い医療問題の現場でのトリアージやスクリーニングを可能にし、何百万人もの人々がケアへのアクセスを拡大するでしょう。

ヘルスケア分野における生成ML

医療分野に機械学習(ML:Machine Learning)を応用する長い道のりの中で、生成モデリングは、現在比較的一般的なパターン認識システムを補完する役割に落ち着くことが予想されます。

過去に私達は、データ拡張における生成画像モデルの適合性を検討し、相関する臨床事象間の相互作用を捉えるために生成モデルをどのように使用するかを議論し、研究目的のために現実的であるが完全に合成された電子医療記録を生成するために使用したこともあります。


EHR-Safeで元データから合成データを生成

現在の応用的な生成モデリングの展望を語る上で、大規模言語モデル(LLM:Large Language Models)の分野における最近の動向について言及することは欠かせません。

ほぼ10年にわたる研究の結果、生成リカレントニューラルネットワークによるテキスト合成のデモが公開され、世界中の人々の想像力をかきたてるようになりました。

実際、Googleは、このネットワークの初期バージョンを実際の消費者向け製品にいち早く導入しています。しかし、健康への応用を考えるとき、私たちは再び「測定(measurement )」という信念(mantra)に立ち戻らなければなりません。

私たちには、責任を持って技術をテストし、慎重に進めるという基本的な責任があります。ある日突然、健康上の問題を抱える人々に影響を与えるかもしれないMLシステムを構築することの重大さを過小評価することはできません。

そのため、昨年12月にLLMと臨床知識の符号化に関する査読前論文を発表しました。

(1)自動医療質問応答システムの評価ベンチマークを集約・拡張しました。
(2)独自の研究用医療質問応答LLM、Med-PaLMを紹介しました。

例えば、Med-Palmに「ストレスは鼻血の原因になりますか」と質問すると、この大規模言語モデルは「はい、ストレスは鼻血の原因になります」と説明し、考えられるメカニズムを詳細に説明する回答を生成します。Med-PaLMの目的は、研究者がLLMによる健康情報の表現、検索、伝達の実験と改良を行うことであり、完成した医療質問応答製品ではありません。

Med-PaLMは、以下のベンチマークにおいて、他のシステムを全面的に上回ったことを報告できることを嬉しく思います。

とはいえ、この論文から得られる重要な点は、私たちや他のMLシステムが行っているように、一連の医学試験問題で「合格」マークを得るだけでは、医学問題回答の実世界での使用をサポートするために必要な安全性と正確性には、まだ十分及ばないということです。

この分野での進歩は速まると期待しています。

しかし、私たちがCNNを医療用画像処理に導入するまでの道のりと同様に、LLMを健康分野に応用するためには、さらなる研究、パートナーシップ、ケア、そして忍耐が必要です。


私達のモデルMed-PaLMは、MedQA USMLEデータセットにおいて、従来の最高値を7%上回る最先端の性能を獲得しました。

おわりに

これらのトレンドはすべて2023年も継続し、おそらく加速すると予想されます。

医療用AIのイノベーションからインパクトまでの弧をより効率的に描くために、学術機関、医療技術者、AI技術者、医療機関の間の協力関係が強化されるでしょう。

これは、電話やモバイルセンサーがケアに果たす役割が、現在の遠隔臨床医療(telehealth)の枠組みをはるかに超えて拡大する可能性があるため、徐々にではありますが、変革的な影響を及ぼすと思われます。

そしてもちろん、最近のAIの分野では、生成AIや大規模言語モデルの展望に興奮しないわけにはいきません。

しかし、特に健康領域では、この約束を実現するために、パートナーシップのツール、そして最高水準のテストを用いることが不可欠です。テクノロジーは変化し続け、人間の健康について私たちが知っていることも変化し続けるでしょう。

しかし、変わらないのは、お互いを思いやり、以前より良いものを作ろうとする人々です。私たちは、AIが今後何年にもわたって医療を改善するために果たすことができる役割に期待しています。

3.2022年のGoogleのAI研究の成果と今後の展望~医療編~(2/2)関連リンク

1)ai.googleblog.com
Google Research, 2022 & beyond: Health

2)blog.google
Our latest health AI research updates

タイトルとURLをコピーしました