ディープラーニングを使用して胸部X線画像内の未知の異常を検出(1/2)

ヘルスケア

1.ディープラーニングを使用して胸部X線画像内の未知の異常を検出(1/2)まとめ

・肺がん、結核、気胸などの特定の状態を検出する機械学習モデルはすでに開発されている
・しかし各モデルは固有の症例を検出するだけなので他の症例を見逃してしまう恐れがある
・学習用データに含まれていなかった症例や一般的な異常を検知するモデルが必要となった

2.X線撮影写真内の特定の疾患ではなく異常を検知する

以下、ai.googleblog.comより「Detecting Abnormal Chest X-rays using Deep Learning」の意訳です。元記事の投稿は2021年9月1日、Zaid NabulsiさんとPo-Hsuanさんによる投稿です。

異常を見逃さない目をイメージして選んだアイキャッチ画像のクレジットはPhoto by Frida Bredesen on Unsplash

医用画像アプリケーションに機械学習(ML:Machine Learning)を採用することで、胸部X線(CXR:Chest X-Ray)画像の解釈の可用性、速度向上、精度、一貫性を向上させる刺激的な機会がもたらされます。

実際、肺がん、結核、気胸などの特定の状態を検出するために、多数のアルゴリズムがすでに開発されています。ただし、特定の疾患を検出するように訓練されているため、これらのアルゴリズムの有用性は、さまざまな異常が表面化する可能性がある一般的な臨床設定では制限される可能性があります。

例えば、気胸検出器は癌を示唆する結節を強調することは期待されておらず、結核検出器は肺炎に特有の所見を識別しない可能性があります。最初のトリアージステップは、CXRに関連する異常が含まれているかどうかを判断することであるため、あらゆる種類の異常を含むX線を識別する汎用アルゴリズムにより、ワークフローが大幅に容易になります。ただし、これを行うための分類子の開発は、CXRには様々な異常が存在するために困難です。

Scientific Reportsに掲載された論文「Deep Learning for Distinguishing Normal versus Abnormal Chest Radiographs and Generalization to Two Unseen Diseases Tuberculosis and COVID-19」では、複数の匿名化されたデータセットと設定で正常なCXRと異常なCXRを区別できるモデルを紹介します。

このモデルは、結核やCOVID-19などのトレーニングセット内に含まれていなかった初見の症例だけでなく、一般的な異常に対してもうまく機能することがわかります。また、公開されているChestX-ray14データセットについて、この研究で使用したテストセット用の放射線科医が付与したラベルのセットをリリースします。

異常な胸部X線画像を検出するための深層学習システム

私たちが使用した深層学習システムは、ImageNetで事前トレーニングされたEfficientNet-B7アーキテクチャに基づいています。

インドのApollo病院から提供された200,000を超える匿名化されたCXRを使用してモデルをトレーニングしました。各CXRには、関連する放射線レポートから正規表現をベースとした自然言語処理アプローチを使用して、「正常」または「異常」のラベルが割り当てられました。

システムが新しい患者集団にどの程度一般化するかを評価するために、広範囲の異常からなる2つのデータセット(Apollo Hospitalsデータセット(DS-1)から分割したテストセットと公開されているChestX-ray14(CXR-14))でパフォーマンスを比較しました。

これらの2つのテストセットのラベルは、このプロジェクトの目的のために、米国の理事会認定の放射線科医のグループによって注釈が付けられました。システムは、DS-1で0.87、CXR-14で0.94の受信者動作特性曲線(AUROC:Areas Under he Receiver Operating characteristic Curve)を達成しました(高いほど良い値です)。

DS-1とCXR-14の評価セット内にはさまざまな異常が含まれていましたが、このモデルの使用が想定されるのは、これまで遭遇したことのない新しい病気や予期していなかった状況で利用することです。

トレーニングセット内に存在しなかった疾患が存在する新しい患者集団に対するシステムの一般化可能性を評価するため、3か国で取得されたら4つの匿名化されたデータセットを使用しました。これには、公的に入手可能な2つの結核データセットとNorthwestern Medicineの2つのCOVID-19データセットが含まれます。

このシステムは、結核の検出で0.95~0.97、COVID-19の検出で0.65~0.68のAUCを達成しました。結核やCOVID-19が陰性であっても、CXR画像内には、他の異常が含まれている可能性があります。

そのため、結核データセットのAUCが0.91~0.93であることがわかったため、システムをさらに広範囲に(データセットが対象としている疾患が陽性か陰性かのみではなく他の疾患も)検出できるかどうかを評価しました。

その結果、結核データセットのAUCが0.91~0.93、COVID-19データセットのAUCが0.86であることを確認しました。

一般的な異常 結核(トレーニングデータセット内に存在しなかった疾患) COVID-19(トレーニングデータセット内に存在しなかった疾患)
異常検出 0.87 – 0.94 0.91 – 0.93 0.86
疾患検出 0.95 – 0.97 0.65 – 0.68

複数観点(異常検出と疾患検出)から評価する目的は、以下の2つを確かめるためです。
・特定の疾患が特定の異常を示している事を検出できているか?
・特定の異常が複数の病気から発生する事を検出できているか?
私たちの研究は両方を評価します。

3.ディープラーニングを使用して胸部X線画像内の未知の異常を検出(1/2)関連リンク

1)ai.googleblog.com
Detecting Abnormal Chest X-rays using Deep Learning

2)www.nature.com
Deep learning for distinguishing normal versus abnormal chest radiographs and generalization to two unseen diseases tuberculosis and COVID-19

3)cloud.google.com
ディープ ラーニング モデルを使用した胸部放射線の解釈

タイトルとURLをコピーしました