1.2022年のGoogleのAI研究の成果と今後の展望~自然科学編~(2/2)まとめ
・ディープラーニングの最近の進歩を活用し、生のアミノ酸配列からタンパク質の機能を正確に予測して科学技術の進歩に貢献しました
・量子機械学習でノイズの多い中級規模の量子コンピュータでも、データセットサイズにおいて指数関数的な優位性を得れる事を示した
・量子コンピュータはトランジスタやGPSの誕生と同じくらい社会的に大きな影響を与える画期的な発見を可能にする可能性がある
2.生物化学の成果
以下、ai.googleblog.comより「Google Research, 2022 & beyond: Natural sciences」の意訳です。元記事の投稿は2023年2月21日、John Plattさんによる投稿です。
アイキャッチ画像はstable diffusionのカスタムモデルによる生成
生物化学(Biochemistry)
機械学習(ML:Machine Learning)は、生物学的配列の理解にも大きな進歩をもたらしています。
2022年、私たちはディープラーニングの最近の進歩を活用し、生のアミノ酸配列からタンパク質の機能を正確に予測しました。また、欧州分子生物学研究所の欧州バイオインフォマティクス研究所(EMBL-EBI:European Molecular Biology Laboratory’s European Bioinformatics Institute)と緊密に連携して、モデルの性能を慎重に評価し、公開タンパク質データベースUniProt、Pfam/InterPro、MGnifyに数億の機能に関する注釈を追加しました。
タンパク質データベースに人間が注釈付けする事は手間がかかり、時間がかかるものですが、私たちのML手法によって、例えばPfamの注釈数を過去10年間の他の取り組みを合わせた数よりも多く増やすなど、大きな飛躍を遂げることができました。毎年、世界中の何百万人もの科学者がこれらのデータベースにアクセスしていますが、その研究に私達の注釈を利用できるようになりました。
Google ResearchのPfamへの貢献は、過去10年間にデータベースに対して行われたすべての拡張努力を上回る規模です。
2003年にヒトゲノムの最初の草案が発表されましたが、配列決定技術の技術的限界により、不完全で多くのギャップがありました。2022年、私たちはテロメア-2-テロメア(T2T:Telomere-2-Telomere)コンソーシアムが、これまで利用できなかったこれらの領域を解決するという目覚ましい成果を達成したことを祝いました。
その中には、5本の完全な染色体アームと約2億塩基対の新規DNA配列が含まれており、これらは、ヒトの生物学、進化、および疾病の問題にとって興味深く、重要なものです。
私達のオープンソースゲノムバリアントコーラーであるDeepVariantは、T2Tコンソーシアムがヒトゲノムの完全な30億5500万塩基対配列のリリースを準備するために使用したツールの1つです。また、T2Tコンソーシアムでは、Pacific Biosciences社のロングリードシーケンス装置向けに装置上でエラー訂正を行うオープンソース手法DeepConsensusを、人間の遺伝的多様性を表現できる包括的なパンゲノムリソースに向けた最新の研究でも使用しています。
量子コンピュータを使った新しい物理学の発見
例えば、センサーで何かを測定し、そのデータをコンピューターが処理するという問題を考えてみましょう。従来は、センサーのデータは古典的な情報に変換されてコンピュータ上で処理されていました。しかし、量子コンピュータでは、センサーからの量子データを直接処理することが考えられています。
量子センサーからのデータを、古典的な測定を介さずに直接量子アルゴリズムに与えることで、大きな利点が得られるかもしれません。
複数の大学の研究者と共同で執筆した最近のScience論文では、量子コンピューターが量子センサーに直接結合され、学習アルゴリズムを実行している限り、量子コンピューターは古典的なコンピューターよりも指数関数的に少ない実験から情報を抽出できることを示しました。
この「量子機械学習(QML:Quantum Machine Learning)」は、今日のノイズの多い中級規模の量子コンピュータでも、データセットサイズにおいて指数関数的な優位性を得ることができます。科学的発見において実験データはしばしば制限要因となるため、量子MLは科学者にとって量子コンピュータの膨大なパワーを解き放つ可能性を持っています。
さらに良いことに、この研究からの知見は、他の方法では抽出が困難な量子シミュレーションの出力など、量子計算の出力に関する学習にも適用可能です。
量子MLがなくても、量子コンピュータの強力な応用として、他の方法では観測やシミュレーションが不可能な量子系を実験的に探索することができます。
2022年、量子AIチームはこのアプローチで、超伝導量子ビットを用いて、複数のマイクロ波光子が結合状態にあることを示す最初の実験的証拠を観測しました。光子は通常、互いに相互作用することはなく、相互作用させるためには非線形性の追加要素が必要です。
この相互作用の量子コンピュータシミュレーションの結果は、私たちを驚かせました。このような束縛状態の存在は、壊れやすい条件に依存していると考えられていましたが、その代わりに、私たちが加えた比較的強い摂動に対しても、束縛状態が強固であることを発見しました。
n光子結合状態の占有確率と離散時間ステップの関係
光子の大部分(濃い色)は結合したままであることがわかります。
量子コンピュータを応用した物理学のブレークスルーが最初に成功したことを考えると、この技術が将来、トランジスタやGPSの誕生と同じくらい社会的に大きな影響を与える画期的な発見を可能にする可能性があると期待しています。科学的なツールとしての量子コンピュータの未来は、とてもエキサイティングです。
謝辞
Google Applied Sciences、Quantum AI、Genomics and Brainチーム、そしてGoogle Research全体や社外の協力者を含め、この投稿で紹介した進歩に尽力してくれたすべての人に感謝したいです。
最後に、この投稿を書くにあたってフィードバックをくれた、Lizzie Dorfman, Erica Brand, Elise Kleeman, Abe Asfaw, Viren Jain, Lucy Colwell, Andrew Carroll, Ariel Goldstein そして Charina Chouら多くのGooglerに感謝したいと思います。
3.2022年のGoogleのAI研究の成果と今後の展望~自然科学編~(2/2)関連リンク
1)ai.googleblog.com
Google Research, 2022 & beyond: Natural sciences
2)www.nature.com
Shared computational principles for language processing in humans and deep language models
Visual recognition of social signals by a tectothalamic neural circuit