AIが何に注目したのかを調べてがんの診断に有効な特徴を発見(1/2)

１．AIが何に注目したのかを調べてがんの診断に有効な特徴を発見(1/2)まとめ

・がんを診断する時、最も重要なステップの1つは病理医が顕微鏡で腫瘍を観察し、がんのステージを決定し、腫瘍の特徴を明らかにする事
・機械学習が病理画像中の腫瘍を正確に識別・分類できる事は示されいたが、既知の特徴を検出または定量化する事に焦点を当てていた
・今回は病理画像から予後を予測するAIを特徴を指定せずにトレーニングし、AIが何を重視したか観察するアプローチを取った

２．AIの発見から人間が学ぶ手法

以下、ai.googleblog.comより「Learning from deep learning: a case study of feature discovery and validation in pathology」の意訳です。元記事は2023年3月14日、Ellery WulczynさんとYun Liuさんによる投稿です。

アイキャッチ画像は病理医のイメージをchatGPT先生に伝えて作って貰ったプロンプトを私が修正してカスタムStable Diffusion先生に作って貰ったイラスト

患者ががんと診断された時、最も重要なステップの1つは病理医(pathologists)が顕微鏡で腫瘍を観察し、がんのステージを決定し、腫瘍の特徴を明らかにすることです。

この情報は、臨床予後を理解し、手術だけで良いのか？手術＋化学療法か？など、最も適切な治療法を決定するための中心的な情報です。顕微鏡検査を支援する病理学用の機械学習(ML:Machine Learning)ツールの開発は、多くの応用が期待される魅力的な研究分野です。

これまでの研究で、MLは病理画像中の腫瘍を正確に識別・分類できることが示されており、分泌腺の外観が正常から逸脱する度合いなどの既知の病理学的特徴を用いて患者の予後を予測することも可能です。

これらの取り組みは、既知の特徴を検出または定量化するためにMLを使用することに焦点を当てていますが、別のアプローチでは、新しい特徴を特定する可能性があります。新しい特徴の発見は、現在のワークフローでは考慮されていない情報を抽出することで、がんの予後予測や患者さんの治療方針の決定をさらに向上させる可能性があります。

本日は、オーストリアのグラーツ医科大学、イタリアのミラノ・ビコッカ大学（UNIMIB）のチームと共同で、大腸がんの新規特徴を特定するために過去数年間行ってきた進捗状況を紹介したいと思います。

(1)病理画像から予後を予測するモデルを、使用する特徴を指定せずにトレーニングし、どのような特徴が重要であるかを学習させる。

(2)その予後予測モデルを説明可能な手法で検証する。

(3)新しい特徴を特定し、患者の予後との関連性を検証する。

私たちは、最近発表した論文「Pathologist validation of a machine-learned feature for colon cancer risk stratification」において、この特徴を説明し、病理医による使用を評価しています。

私たちの知る限り、これは医療専門家が機械学習から新しい予後を予測する特徴を学習できることを初めて示したものであり、この「深層学習からの学習」というパラダイムの将来にとって有望なスタートとなりました。

予後予測モデルをトレーニングして、どのような特徴が重要であるかを学ぶ

新規の特徴を特定するための一つのアプローチとして、画像と対になった病気の進行具合を示すデータのみを用いて、患者の転帰を直接予測するMLモデルを訓練することが考えられます。これは、既知の病理学的特徴に対して人間が注釈を付けた「仲介(intermediate)」ラベルを予測するモデルを訓練し、その特徴を用いて予後を予測するのとは対照的です。

私たちのチームが最初に明らかにしたのは、一般に公開されているTCGAデータセットを用いて、さまざまな種類のがんの予後を直接予測するモデルをトレーニングすることが可能である事でした。

特に、いくつかのがん種では、このモデルの予測が予後を左右することを確認できたのは、非常に喜ばしいことでした。これは、病理学的特徴や臨床的特徴を考慮した結果です。

その後、Graz医科大学およびBiobank Grazの共同研究者とともに、大規模な非識別化大腸がんコホートを用いて、この研究を拡張しました。これらのモデル予測の解釈は興味深い次のステップとなりましたが、一般的な解釈可能性技術はこの文脈で適用するのは困難であり、明確な洞察を得ることは出来ませんでした。

モデル学習した特徴を解釈する

予後予測モデルが使用する特徴を調べるために、画像の類似性を識別するために訓練された第2のモデルを使用して、大きな病理画像の切り抜き断片をクラスタリングしました。そして、予後予測モデルを用いて、各クラスターのML予測リスクスコアの平均値を算出しました。

あるクラスターは、平均リスクスコアが高く(予後不良と関連)、見た目が特徴的であったため、際立っていました。病理医は、脂肪組織に近接した高グレードの腫瘍(すなわち、正常組織との類似性が最も低い)を含む画像であると説明し、このクラスターを「腫瘍脂肪特徴」(TAF:Tumor Adipose Feature)と呼ぶに至たりました。

この特徴の詳細については次の図を参照してください。さらに解析を進めると、TAFの相対的な量が、それ自体独立して予後を大きく左右することがわかりました。

注釈のないギガ規模の病理画像から直接患者の生存率を予測するために、予後MLモデルを開発しました。病理画像の切り抜き断片をクラスタリングするために、第2の画像類似性モデルを使用しまた。予後予測モデルは、各クラスターのモデル予測リスクスコアの平均値を算出するために使用されました。その結果、TAFと呼ばれるクラスターは、平均リスクスコアが高い(生存率が低い)点と明確な視覚的外観を持つ点で際立っています。病理医はTAFを識別することを学び、病理医によるTAFのスコアリングが予後を決定することが示されました。