ディープラーニングで皮膚疾患の鑑別診断を実現(1/3)

  • 2019.09.21
  • AI
ディープラーニングで皮膚疾患の鑑別診断を実現(1/3)

1.ディープラーニングで皮膚疾患の鑑別診断を実現(1/3)まとめ

・皮膚病は患者の数に比べて皮膚科を専門とする医者の数が圧倒的に足りない
・そのため皮膚病を専門としない一般医が診断する事が多いが精度にばらつきがある
・画像とデータを元に皮膚科医と同レベルの鑑別診断用出力を出せるディープラーニングが発表

2.鑑別診断を行うディープラーニングシステムとは?

以下、ai.googleblog.comより「Using Deep Learning to Inform Differential Diagnoses of Skin Diseases」の意訳です。元記事は2019年9月12日、Yuan LiuさんとPeggy Buiさんによる投稿です。

世界中の推定19億人が、常に皮膚の状態に苦しんでおり、皮膚科医が不足しているため、代わりに多くの症例が一般開業医によって診察されています。

米国だけでも、診療所で見られる患者の最大37%が少なくとも1人の皮膚病を患っており、それらの患者の半分以上が皮膚科を専門としない医者によって診断されています。しかし、研究によれば、一般開業医と皮膚科医の間の皮膚状態診断の精度に大きなギャップがあり、一般開業医の精度は皮膚科医の77-96%と比較して24-70%と大きなばらつきがあることが示されています。

これは、最適ではない照会、治療の遅れ、診断と治療の誤りにつながる可能性があります。診断の精度を向上させる非皮膚科医の従来の戦略には、参考テキストの使用、オンラインリソース、および同僚との協議が含まれます。

診断精度の向上を支援することを目的として、機械学習ツールも開発されています。 これまでの研究は、特に病変が悪性か良性か、病変が黒色腫かなど、皮膚がんの早期スクリーニングに主に焦点を合わせてきました。

ただし、皮膚の問題の90%以上は悪性ではなく、これらのより一般的な症例に対処することも、皮膚疾患の世界的な負担を軽減するために重要です。

論文「A Deep Learning System for Differential Diagnosis of Skin Diseases」では、初期診察で見つかる最も一般的な皮膚の状態に対処するディープラーニングシステム(DLS:Deep Learning System)を開発しました。私達の研究結果は、皮膚科医が取り扱う情報と同じ情報(患者の症例に関する画像とメタデータ)を提示した場合、DLSが米国の認定皮膚科医と同等の精度を26の皮膚状態に関して達成できることを示しました。

この研究は、皮膚の状態を正確に診断するための追加の専門トレーニングを受けていない一般開業医の能力を増強するDLSの可能性を強調しています。

ディープラーニングシステムのデザイン
臨床医は、明確な回答が得られない曖昧なケースにしばしば直面します。例えば、この患者の発疹は、うっ血性皮膚炎または蜂巣炎、あるいはもしかしたら両方が重なっていますか?臨床医は、診断で症例を1つに特定するのではなく、可能性のある症例をランク付けしたリストである鑑別診断(differential diagnosis)を作成します。

鑑別診断は、診断が確認されるまで追加の精密検査(実験室試験、イメージング、手続き、診察)と治療を体系的に適用できるように、問題を組み立てる枠組みです。そのため、皮膚の症候に対してあり得る皮膚疾患をランク付けしたリストを作成するDLSは、臨床医が患者のトリアージ、診断、および治療を促すためにどのような想定をすべきかのキーとなり、鑑別診断とよく似ています。

この予測を行うために、DLSは1つ以上の皮膚異常の臨床画像と最大45種類のメタデータ(年齢、性別、症状などの病歴の自己報告コンポーネント)を含む入力を処理します。

各ケースについて、Inception-v4ニューラルネットワークアーキテクチャを使用して複数の画像が処理され、分類レイヤーで使用するために、特徴量に変換されたメタデータと組み合わされます。

私達の研究では、主にプライマリケアクリニックから遠隔皮膚科サービスに紹介された17777の匿名化された診断データでDLSを開発および評価しました。2010-2017年のデータはトレーニングに使用され、2017-2018年のデータは評価に使用されました。DLSモデルのトレーニングには、40人以上の皮膚科医が提供する50,000以上の鑑別診断が活用されました。

DLSの精度を評価するために、米国の3人の認定皮膚科専門医の診断に基づいて、それを厳密な参照標準と比較しました。合計で、皮膚科医は3,756件の鑑別診断を提供し(検証セットA)、これらの診断は投票を介して集計され、最も確からしい鑑別診断をグラウンドトゥルースラベルとして導き出しました。DLSのランク付けされた皮膚状態のリストは、この皮膚科医由来の鑑別診断と比較され、それぞれ71%および93%のtop-1およびtop-3精度を達成しました。


DLSの概略図と、参照セット(グラウンドトゥルース)が検証セットAの各ケースに対して3人の認定皮膚科医の投票によって導き出された方法。

 

3.ディープラーニングで皮膚疾患の鑑別診断を実現(1/3)関連リンク

1)ai.googleblog.com
Using Deep Learning to Inform Differential Diagnoses of Skin Diseases

2)arxiv.org
A deep learning system for differential diagnosis of skin diseases