PCR検査の効率を劇的に向上できるベイジアングループテスト(1/2)

１．PCR検査の効率を劇的に向上できるベイジアングループテスト(1/2)まとめ

・PCR検査は陽性の人が陰性、もしくは本当は陰性の人が陽性と結果が出てしまう事例が多い
・結果に誤りがある事を前提にグループ単位の検査を行い検査数を大幅に減らす手法が発表される
・限られたリソースで多数のテストを実行せねばならない状況に特に適しておりコードも公開された

２．ベイジアングループテストとは？

以下、ai.googleblog.comより「Exploring Faster Screening with Fewer Tests via Bayesian Group Testing」の意訳です。元記事の投稿は2020年7月14日、Marco CuturiさんとJean-Philippe Vertさんによる投稿です。

新型コロナウイルスの感染有無を調べるPCR検査は、本当は陽性の人が陰性、もしくは本当は陰性の人が陽性と結果が出てしまう事例が多い事が報告されていますが、検査結果に誤りが含まれる事も前提に組み込んで、１人１人を個別に検査するのではなくグループ単位の検査を組み合わせていく事で、検査数を大幅に減らす事が出来ると言う手法です。

アメリカの新型コロナ感染状況を見ると理想通りには行かないだろうと言う事はわかっていますが、この考え方に基づいた検査と接触確認アプリを上手に組み合わせれば、確かに新型コロナウイルスを封じ込める事は出来るのだろうな、と思うので一応、私も関連するであろうと思われる組織のお問い合わせ先窓口などにはご連絡しておこうと思うのですが、読者の皆様も機会や伝手などがありましたらダメ元で動いて頂ければな、と思います。

アイキャッチ画像のクレジットはPhoto by National Cancer Institute on Unsplash

干し草の山に落とした針を見つけるにはどうすれば良いでしょうか？

第二次世界大戦の節目に、この問題は非常に具体的になり、医師たちは戦災に巻き込まれた人々の間で流行する疾病を効率的に検出する方法を捜し求めていました。

この課題に触発されて、当時、若い統計学者であったRobert Dorfman(後のハーバード大学の経済学教授)は、感染した個人を検出する2段階アプローチを提案しました。

このアプローチでは、病原体の有無を個々にテストする前に、4人分ずつサンプルをまとめ、まとめたサンプルに対してテストをします。

もし、まとめたサンプルが陰性である場合、4人の誰もが病原体の影響を受けていないと安全に仮定する事が出来、その場合、必要なテストの数を大幅に削減できます。このケースであれば、4人分のテストが1つのテストで実施できました。

病原体の有病率が低い場合は滅多に起こらないのですが、もし、4人のグループが陽性と判定された場合は、そのグループ内の少なくとも1人以上の人が陽性です。従って、感染した個人を特定するために更に幾つかのテストが必要になります。

左：16人をスクリーニング検査するには16回の個別テストが必要です。1人だけ陽性であれば、15人は陰性の結果になります。右：Dorfmanのグループテストの手順に従って、サンプルを4人のグループからなる4つのグループにまとめ、まとめたサンプルに対してテストを実行します。2番目のグループだけが陽性となるため、12人は陰性である事がわかり、陽性グループに属する4人だけを再検査する事になります。このアプローチでは、全件検査に必要な数は16ではなく、8つのみとなります。

Dorfmanの提案は、コンピューターサイエンスのいくつかの分野に多くの関連する後続研究を引き起こしました。情報理論、組み合わせ論、圧縮センシング、および彼の手法を改変したいくつかの手法などがありますが、特に二分割法(Binary Splitting)や個人感染確率割合(individual infection probability rates)に関する副次的知識として活用しているケースがあります。

この分野からは、いくつかの副次的な問題が認識され、それら自体が完全な文献と見なされる程にまで成長しました。

一部のアルゴリズムは、「テスト結果が完全に信頼できるノイズのないケース」に合わせて調整されていますが、「テスト結果にノイズが多く、偽陰性または偽陽性を生成する可能性があるより現実的なケース」を検討しているアルゴリズムもあります。

最後に、いくつかの戦略は適応的(adaptive：途中で計画の一部を変更できるような設計)であり、既に観察されたテスト結果に基づいてグループを提案します。(陽性グループ内の個人を再テストする事を提案しているため、Dorfmanの手法も含まれます)。一方、グループが事前に知られている、またはランダムに選ばれる非適応的な設定(non-adaptive setting)にこだわる研究もあります。

論文「Noisy Adaptive Group Testing using Bayesian Sequential Experimental Design」では、ノイズの多い設定(つまり、テスト結果に誤りが含まれている可能性がある)で動作する新しいグループテストの手法を提示します。この手法は、過去のテスト結果から次にテストするグループを適応的に決定し、信頼性の高い検出結果を素早く求め、テストをできるだけ少なくすることを目標としています。

大規模シミュレーションの結果、今回提案する手法が適応ベース手法や非適応ベース手法と比較して大幅な改善をもたらす可能性があり、疾患の有病率が低い場合、個々にテストするよりもはるかに効率的であることを示唆されています。

そのため、このアプローチは、COVID-19の広がりに対応するようなパンデミックの場合のように、限られたリソースで多数のテストを実行する必要がある状況に特に適しています。GitHubリポジトリを通じてコミュニティにコードをオープンソースとして公開しています。

テスト結果が100%信頼できない状況で適応的にグループテストを行う
グループテスト戦略とは、n人のリストの中で特定の病原体を持っている人を推測するアルゴリズムです。

実験室で一度にk個のテストを実行できると仮定すると、戦略はこれらのグループを定義するk x nのプール行列を形成します。

テストが実行されると、その結果を使用して、感染しているのか感染していないのかを判断するのに十分な情報が収集されたかどうかを決定します。十分な情報が収集されていない場合は、次のテストを行うために新しいグループを形成する方法を決定します。

私たちは、ノイズが含まれる現実的な設定で、計画を途中変更できるような適応的なテストとして、本グループテスト手法を設計しました。感染者のテスト結果が陽性となる確率は100%未満であり、非感染者の検査結果が陰性になる確率も同様です。