1.機械学習を使用して大腸癌の内視鏡検査の精度を向上(2/2)まとめ
・合成したビデオを使った性能検証ではC2D2は医師グループの2.4倍の精度を達成した
・実際のビデオを使った検証ではC2D2の採点を医師グループは93%の割合で正しいと評価
・C2D2と自動でリアルタイムにポリープを検出する機能を組み合わせる研究も進んでいる
2.C2D2の性能
以下、ai.googleblog.comより「Using Machine Learning to Detect Deficient Coverage in Colonoscopy Screenings」の意訳です。元記事の投稿は2020年8月28日、Daniel FreedmanさんとEhud Rivlinさんによる投稿です。
アイキャッチ画像のクレジットはPhoto by Tom Claes on Unsplash
合成ビデオを使ったパフォーマンスの計測
合成ビデオを使用する場合、合成時に撮影割合を示すラベルを付与できるため、C2D2のパフォーマンスを直接測定できます。これを平均絶対誤差(MAE:Mean Absolute Error)を使用して定量化します。MAEは、アルゴリズムの予測が平均してラベルの値とどの程度異なるかを示す値です。
テストの結果、C2D2のMAEは0.075であることがわかりました。つまり、平均して、C2D2の予測はラベルの値の7.5%以内に収まっています。
対照的に、同じタスクを与えられた医師のグループによるMAEは0.177でした。つまりラベルの値の17.7%以内に収まっていました。従って、C2D2は、合成ビデオでは2.4倍の精度を達成しています。
実際のビデオでのパフォーマンス
もちろん、最も重要なのは、実際の大腸内視鏡検査のビデオを使ったパフォーマンスです。この場合の課題は、各ビデオに撮影割合を示すラベルが付与されていない事です。つまり、実際の撮影割合が何パーセントなのかはわかりません。
更に、前述したように人間の医者が常に正確であるとは限らないため、医者にラベル付けして貰ったラベルを直接使用する事はできません。ただし、C2D2は、実際の大腸内視鏡検査ビデオでも割合を推測する事ができます。実際、C2D2は、合成した内視鏡検査ビデオでも実際の内視鏡検査ビデオでも、同じように機能するように設計されています。
C2D2の実際のビデオでのパフォーマンスを確認するために、GANなどの生成モデリングの分野で一般的に使われている手法を応用しました。この手法には、「実際のビデオ」と「C2D2が推測したそのビデオの撮影割合」を人間の医者に提供する事が含まれます。その後、C2D2が推測したスコアが正しいかどうかを医者に評価してもらいます。
医者が直接撮影割合を採点する事とは困難ですが、特定の採点が正しいかを検証する作業はかなり簡単になるという考え方に基づいています。(これは、プログラミングの問題に対して、提案された解決策を検証する方が、一般にその解決策を計算するよりもはるかに簡単であるという事実に似ています)
この方法論を使用して、専門家はC2D2の採点を93%の割合で正しいと検証しました。更に定性的には、C2D2の出力は「目を使った検査(eyeball test)」でも合格しているようです。
以下の画像を参照してください。
実際の大腸内視鏡検査画像の撮影割合
上段:よく撮影された画像。腸内の「トンネル」全体が見える場合があります。C2D2の採点=0.931
中央:部分的に撮影された画像、下部は表示されていますが、上部は見えません。C2D2の採点=0.427
下段:十分に撮影されていない画像、写っているものの多くは壁です。C2D2の採点=0.227
次のステップ
C2D2は結腸壁の見落とされた領域を医師に警告します。これはポリープの発見に繋がり、それはADRが増加しinterval CRCの割合が減少する事を約束します。これは患者にとって非常に有益です。
大腸内視鏡検査の範囲に対処するこの作業に加えて、C2D2と自動でリアルタイムにポリープを検出アルゴリズムを組み合わせることにより、ポリープ検出を改善するための研究も同時に行っています。この研究は、医師が機械学習を使用する事で、特に処置中の患者のケアの質を向上させるための努力を強化する可能性があるという証拠をさらに高めています。
謝辞
この研究は、verily社の支援とDaniel Freedman, Yochai Blau, Liran Katzir, Amit Aides, Ilan Shimshoni, Danny Veikherman, Tomer Golany, Ariel Gordon, Greg Corrado, Yossi Matias, および Ehud Rivlinによって実施されました。
Nadav Rabani、Chen Barshai、Nia Stoykova、David Ben-Shimol、Jesse Lachter、Ori Segol、3D-Systemsなど、このプロジェクトに携わったすべてのチームメンバーと協力者に感謝します。 サポートとガイダンスを提供してくれたYossi Matiasにも感謝します。 この調査は、イスラエルのGoogle HealthおよびGoogle Researchのチームによって実施されました。
このプロジェクトに携わってくれたすべてのチームメンバーと協力者に感謝します。これには、Nadav Rabani, Chen Barshai, Nia Stoykova, David Ben-Shimol, Jesse Lachter, Ori Segol そして3D-Systems社などが含まれます。サポートとガイダンスを提供してくれたYossi Matiasにも感謝します。この調査は、イスラエルのGoogle HealthおよびGoogle Researchのチームによって実施されました。
3.機械学習を使用して大腸癌の内視鏡検査の精度を向上(2/2)関連リンク
1)ai.googleblog.com
Using Machine Learning to Detect Deficient Coverage in Colonoscopy Screenings
2)www.ncbi.nlm.nih.gov
Clinical and Biological Features of Interval Colorectal Cancer
3)www.sciencedirect.com
Increased Rate of Adenoma Detection Associates With Reduced Risk of Colorectal Cancer and Death
4)ieeexplore.ieee.org
Detecting Deficient Coverage in Colonoscopies
コメント