Google Research：2022年以降にAIはどのように進化していくか？(4/6)

１．Google Research：2022年以降にAIはどのように進化していくか？(4/6)まとめ

・物理学から生物学、再生可能エネルギーや医療などの関連領域でMLのインパクトが高まる
・コンピュータビジョンモデルは個人的な問題から地球規模の問題まで様々な問題に対応可能
・MLがより強固に、広く利用できるようになるにつれて実世界の幅広い領域で可能性が広がる

２．基礎科学、ヘルスケア、サステナビリティ分野の機械学習

以下、ai.googleblog.comより「Google Research: Themes from 2021 and Beyond」の意訳です。元記事は2022年1月11日、Jeff Deanさんによる投稿です。

アイキャッチ画像のクレジットはPhoto by Michael Held on Unsplash

科学、健康、持続可能性の分野におけるMLのインパクトの拡大

近年、基礎科学分野でのMLのインパクトが高まっています。物理学から生物学に至るまで、再生可能エネルギーや医療などの関連領域で多くのエキサイティングな実用化が見られるようになりました。

コンピュータビジョンモデルは、個人的な問題から地球規模の問題まで、様々な問題に対応できるよう展開されています。医師の仕事を支援し、神経生理学の理解を深めることができますし、天気予報の精度向上や災害時の救援活動の効率化も期待できます。

他の種類のモデルも、二酸化炭素排出量を削減する方法を発見したり、代替エネルギー源の出力を向上させたりすることで、気候変動への対応に不可欠なモデルであることが証明されています。

このようなモデルは、アーティストの創造的なツールとして活用することもできます。MLがより強固になり、より発達し、広く利用できるようになるにつれて、実世界の幅広い領域で大きな影響を与えるアプリケーションの可能性が広がり続け、我々の最も困難な問題の解決に貢献することができます。

(1)新たな知見を得るためのコンピュータビジョンの大規模な適用

過去10年間のコンピュータビジョンの進歩により、さまざまな科学的領域において、コンピュータをさまざまなタスクに利用することができるようになりました。

神経科学では、自動再構成技術により、脳組織の薄切片の高解像度電子顕微鏡画像から、脳組織の神経結合構造を復元することができます。

これまでにも、蝿、マウス、小鳥の脳を対象とした脳組織構造を共同で作成しています。

そして、昨年、ハーバード大学のリヒトマン研究室と共同で、大脳皮質の全層にわたって複数の細胞タイプにまたがる、ヒト大脳皮質のシナプス結合に関する初の大規模研究を行いました。これほど詳細に画像化・再構築された脳組織のサンプルは、あらゆる生物種で最大となります。

この研究の目的は、神経科学者が人間の脳の驚くべき複雑さを研究するのに役立つ、新しいリソースを作成することです。例えば下の画像は、成人のヒトの脳にある約860億個の神経細胞のうち、6個の神経細胞を示しています。

ヒト大脳皮質の再構成から得られた1個のヒトシャンデリアニューロンと、その細胞に接続するいくつかの錐体ニューロン。操作可能なインタラクティブなバージョンやその他のサンプルギャラリーはh01-releaseのWebサイトからご覧いただけます。

また、コンピュータビジョン技術は、より大規模な、さらには地球規模の課題に取り組むための強力なツールを提供します。

ディープラーニングベースの天気予報のアプローチは、衛星やレーダー画像を入力とし、他の大気データと組み合わせて最大12時間後までの天気と降水量予測を従来の物理ベースのモデルよりも正確に生成します。また、従来の方法よりもはるかに迅速に予測を更新することができ、これは異常気象の発生時に非常に重要となります。

2020年3月30日、コロラド州デンバー上空の0.2mm/hrの降水時の比較
左：検証済の雨雲、ソースはMRMS
中央：MetNet-2で予測された確率マップ
右: 物理学に基づくHREFモデルで予測した確率分布

MetNet-2はHREFよりも早く嵐の発生を予測し、嵐の開始位置も予測できています。一方、HREFは嵐の開始位置は外しているが、その成長段階をよく捉えています。

人口予測や都市計画、災害時の人道的対応、環境科学など、さまざまな用途において、建物の痕跡を正確に記録することは不可欠です。アフリカを含む世界の多くの地域では、これまでこのような情報を得ることができませんでしたが、新しい研究により、衛星画像にコンピュータビジョン技術を適用することで、大陸規模で建物の境界を特定できることが明らかになりました。

この成果は、アフリカ大陸の大部分をカバーする5億1,600万棟の建物の位置と足跡を収録したオープンアクセス型の新しいデータリソース「Open Buildings dataset」で公開されました。また、このユニークなデータセットを使って、世界食糧計画との共同研究で、MLを適用した自然災害後の被害評価を迅速に行うことができました。

衛星画像中の建物の分別の例
左：元画像
中央：各画素に建物かそうでないかの信頼度スコアが割り当てられたセマンティックセグメンテーション
右：閾値処理と連結成分のグループ化によって得られたインスタンスセグメンテーション

これらの事例に共通するのは、MLモデルが、利用可能なビジュアルデータの分析に基づいて専門的なタスクを効率的かつ正確に実行し、インパクトの大きい下流タスクをサポートしていることです。

(2)設計空間の自動探索

もう一つのアプローチは、MLアルゴリズムに問題のデザイン空間を探索させ、可能な解決策を自動的に評価させることで、多くの分野で素晴らしい成果を上げています。

あるアプリケーションでは、Transformerベースの変分オートエンコーダは、美的に美しく、有用なドキュメントのレイアウトを作成するために学習し、同じアプローチは、可能な家具のレイアウトを探索するために拡張することができます。別のML駆動型アプローチは、コンピュータゲームのルールの微調整のための巨大なデザイン空間の探索を自動化し、プレイアビリティやゲームの他の属性を改善するために、人間のゲームデザイナーがより迅速に楽しいゲームを作成することができるようにしました。

Variational Transformer Network(VTN)モデルの可視化
レイアウト要素(段落、表、画像など)間の意味のある関係を抽出し、現実的な合成文書(例えば、より良いアライメントやマージン)を生成することができます。

その他、ML用のアクセラレータチップのコンピュータアーキテクチャーのデザインスペースの評価にもMLアルゴリズムが使用されています。また、MLを用いて、人間の専門家が生成したレイアウトよりも優れたASIC設計のためのチップ配置を、数週間ではなく数時間で迅速に生成できることを示しました。

これにより、チップ設計時の固定エンジニアリングコストを削減し、さまざまなアプリケーションに特化したハードウェアを迅速に作成するための障壁を低くすることができます。私たちは、この自動配置の手法を、近日発売予定のTPU-v5チップの設計に採用することに成功しました。

このような探索的なMLアプローチは、材料探索にも応用されています。Google ResearchとCaltechの共同研究では、いくつかのMLモデルを改造したインクジェットプリンタと特注の顕微鏡と組み合わせて、何十万もの可能性のある材料を迅速に検索できました。バッテリー技術や水の電気分解などの分野への応用が期待できる、これまで特性が調査されていないが有望な3金属酸化物材料51種類に焦点を絞ることができました。

特に、実験の生成から結果の評価までの実験ループ全体を自動化またはほぼ自動化できるようになれば、こうした自動設計空間探査アプローチは、多くの科学分野を加速させるのに役立ちます。今後、さらに多くの分野で、このアプローチが有効に活用されることを期待しています。

(3)健康への応用

MLは基礎科学の発展だけでなく、医学や人々の健康をより広く促進することができます。

コンピュータサイエンスの進歩を健康に役立てようという発想は、何も新しいものではありません。実際、私自身、初期の頃は疫学データの分析に役立つソフトウェアを開発していました。しかし、MLは新しい扉を開き、新しい機会を与え、そして新しい挑戦をもたらしてくれます。

例えば、ゲノミクスの分野です。しかし、MLは新しい機能を追加し、古いパラダイムを破壊します。Googleの研究者がこの分野で研究を始めたとき、シーケンサーの出力から遺伝子変異を推測するためにディープラーニングを使うというアイデアは、多くの専門家から奇想天外だと思われていました。

現在、このMLアプローチは最先端とみなされています。しかし、将来はMLがさらに重要な役割を果たすことになるでしょう。

ゲノミクス企業は、より正確で高速な新しいシーケンサーを開発していますが、同時に新しい推論上の課題も抱えています。私たちがリリースしたオープンソースソフトウェアDeepConsensusや、UCSCとの共同開発によるPEPPER-DeepVariantは、これらの新しい機器を最先端のインフォマティクスでサポートするものです。より迅速なシーケンスが、実際の患者に影響を与える近い将来の適用につながることを期待しています。

配列の誤りを修正して歩留まりと正答率を向上させるDeepConsensusのTransformerアーキテクチャの概略

シーケンサーデータの処理以外にも、個別化医療に向けたゲノム情報の利用を加速するために、MLを利用する機会があります。

広範囲に渡って表現型を決定し、配列を決定した個体の大規模なバイオバンクは、疾患に対する遺伝的素因を理解し管理する方法に革命を起こすことができます。

私たちのMLベースの表現型検査手法は、大規模な画像やテキストデータセットを遺伝的関連研究に使用できる表現型に変換するスケーラビリティを向上させ、私たちのDeepNull手法は大規模な表現型データを遺伝子探索にうまく利用することができます。

私たちは、この2つの手法をオープンソースとして公開し、科学者コミュニティに提供できることを嬉しく思っています。

バイオバンクのゲノムデータを使った、解剖学的形質と疾患形質の大規模な定量化の生成プロセス

ゲノミクスデータに隠された特性を見出すのにMLが役立つように、他の種類の健康データからも新しい情報を発見し、新しい洞察を得るのに役立ちます。

病気の診断には、パターンの特定、相関関係の定量化、より大きな枠組み内での新しい事象の認識など、MLが得意とするタスクが多くあります。Googleの研究者はMLを使ってこのような問題に幅広く取り組んでいますが、おそらく医療画像へのMLの応用ほどは進展していないでしょう。

実際、糖尿病性網膜症のスクリーニングにディープラーニングを応用したGoogleの2016年の論文は、Journal of the American Medical Association(JAMA)の編集者によって、10年間で最も影響力のある論文のトップ10に選ばれました。「MLと健康に関する最も影響力のある論文」ではなく「10年間全体で最も影響力のあるJAMA論文」の1つに選ばれたのです。

しかし、私たちの研究の強みは、文献への貢献にとどまらず、実世界で動作するシステムを構築する能力にまで及んでいます。私たちのグローバルネットワークを通じて、このプログラムは、インド、タイ、ドイツ、フランスで、視力を脅かすこの病気の検査を受けられなかったかもしれない何万人もの患者をスクリーニングするのに役立っているのです。

乳がん検診の改善、肺がんの発見、がんの放射線治療の促進、異常X線画像の判定、前立腺がん生検のステージングなど、これと同じパターンの支援型MLシステムが展開されると予想されます。各領域は、MLが役に立つ新しい機会を提供します。

MLが支援する大腸内視鏡検査は、基礎的な利用を超えた特に興味深い例です。

大腸内視鏡検査は、単に大腸がんの診断に使われるだけではありません。検査中にポリープを除去することは、病気の進行を食い止め、深刻な病気を防ぐための最前線なのです。

この分野では、MLは医師がポリープを見逃さないよう支援し、見つけにくいポリープを検出するのに役立ち、また、同時位置特定とマッピング技術の適用による検査済みエリアのマッピングなど、品質保証の新しい側面を付加できることを実証しています。

エルサレムのShaare Zedek医療センターと共同で、これらのシステムがリアルタイムで機能し、通常であれば見逃してしまうようなポリープを1回の手術につき平均1個検出し、誤報は1回の手術につき4個未満であることを実証しました。

胸部X線(CXR)のサンプル
(A)一般的な異常
(B)結核
(C)COVID-19
について左から真陽性と偽陽性、真陰性と偽陰性をしめしたもの。
各CXR上で、赤の輪郭はモデルが異常を識別するために着目した領域(すなわちクラス活性化マップ)を示し、黄色の輪郭は放射線科医によって識別された関心領域を示しています。

また、ヘルスケア分野での意欲的な取り組みであるCare Studioは、最先端のMLと高度なNLP技術を使って構造化データや医療記録を分析し、臨床医に適切なタイミングで最も関連性の高い情報を提供するものです。これにより、臨床医がより積極的で正確な医療を提供できるよう支援します。

臨床現場における利用しやすいさの拡大や精度の向上にMLが重要であるのと同様に、新たな重要なトレンドが出現していると考えています。

MLは、人々の日々の健康や幸福を支援するために適用されます。

私たちが普段使っているデバイスには強力なセンサーが搭載されており、健康の指標や情報を民主化し、人々が自分の健康についてより多くの情報を得た上で判断できるようにするのに役立ちます。すでに、スマートフォンのカメラで心拍数や呼吸数を測定し、ハードウェアを追加することなくユーザーを支援する製品や、非接触型の睡眠センシングをサポートし、夜間の健康状態をよりよく理解できるNest Hubデバイスが発表されています。また、音声認識システム(ASR)において、発生に困難を抱える人の声を再現し、自分の声でコミュニケーションできるようにするために、MLを活用することができます。

MLを搭載したスマートフォンが、皮膚の状態を調べたり、視力の弱い人のジョギングをサポートすることは、すぐそこまで来ているように思います。このように、MLを利用したスマートフォンは、あまりにも明るい未来を提供してくれるのです。

非接触睡眠センシングのためのカスタムMLモデルは、3Dレーダーテンソル(距離、周波数、時間の範囲にわたる活動を要約)の連続ストリームを効率的に処理し、ユーザーの存在と覚醒(起きているか眠っているか)の確率を自動的に算出します。

(4)気候危機へのML応用

もう一つの重要な領域は、気候変動です。気候変動は、人類にとって非常に緊急な脅威です。安全で豊かな未来のために、私たちは皆、協力して有害な排出物の排出曲線を曲げる必要があります。さまざまな選択が気候に与える影響について、より良い情報を得ることは、さまざまな方法でこの課題に取り組む上で役立ちます。

このため、Google マップでは最近、環境に配慮したルート案内を展開し、年間約 100 万トン(20 万台以上の自動車を道路から排除することに相当)の CO2 排出量を削減できると試算しています。

最近の事例では、ソルトレイクシティでGoogleマップの道案内を利用した場合、より速く、より排出ガスに配慮したルート案内が可能となり、CO2排出量を1.7%、移動時間を6.5%削減することができたと報告されています。

さらに、Google マップが電気自動車に対応することで、航続距離への不安を解消し、排出ガスのない車両への乗り換えを促進することができます。また、世界中の複数の自治体と協力して、過去の交通データを集計して信号のタイミングを改善するための提案を行っています。イスラエルとブラジルでの初期の試験研究では、調査した交差点での燃料消費量と遅延時間が10～20%削減されたことが確認されています。

エコルートでは、Googleマップが最速ルートと最も燃費の良いルートを表示するので、どちらかを選ぶことができます。

核融合は、より長い時間スケールで見ると、再生可能エネルギー源として画期的な可能性を秘めています。

TAEテクノロジーズ社との長年の共同研究では、1000を超える制御パラメータの設定を提案することで、同社の核融合炉における安定したプラズマの維持を支援しています。私たちの協力により、TAE社はノルマン炉の主要な目標を達成し、ブレークイーブン核融合の目標に一歩近づいたのです。

この装置は、3000万ケルビンの安定したプラズマを30ミリ秒間維持します(触われません！)。彼らは、さらに強力な装置の設計を完了し、10年以内にブレークイーブン核融合に必要な条件を実証することを望んでいます。

また、近年頻発している山火事や洪水への取り組みも拡大しています。(カリフォルニアの何百万人もの人々と同様、私も定期的な「火災シーズン」の到来に適応しなければならないのです)。

昨年は、衛星データを利用した山火事境界線マップを発表し、米国の人々が自分のスマートフォンから簡単に山火事のおおよその規模と場所を把握できるようにしました。

これをベースに、Googleが保有するすべての山火事情報をまとめ、Googleマップの新しいレイヤーとして全世界に公開することになりました。

私たちは、グラフ最適化アルゴリズムを適用して、急速に進行する火災の前で人々の安全を守るために、火災の避難経路を最適化することに役立てています。2021年の洪水予測イニシアチブでは、運用中の警報システムを3億6000万人に拡大し、洪水の危険にさらされている人々のモバイル端末に直接1億1500万件以上の通知を送り、前年の3倍以上の支援活動を行いました。

また、LSTMベースの予測モデルと新しいManifold浸水モデルを初めて実世界のシステムに展開し、システムのすべての構成要素について詳細な説明を共有しました。

Googleマップの山火事レイヤー(wildfire layer)は、緊急時に重要な最新情報を人々に提供します。

また、私たちは独自に持続可能性(sustainability)の取り組みにも力を入れています。Googleは2007年に大手企業として初めてカーボンニュートラルを実現しました。また、2017年には主要企業として初めて、エネルギー使用量を100%再生可能エネルギーでまかなうことに成功しました。

業界で最もクリーンなグローバルクラウドを運営し、再生可能エネルギーを購入する世界最大の企業でもあります。さらに、2020年には、世界中のすべてのデータセンターとキャンパスで、24時間365日カーボンフリーのエネルギーで運用することを約束した最初の大手企業となりました。

これは、エネルギー使用量を再生可能エネルギーに合わせるという従来のやり方よりはるかに難しいことですが、2030年までにこれを実現するために取り組んでいます。MLモデルのトレーニングによる炭素排出は、MLコミュニティの懸念事項です。モデルアーキテクチャ、データセンター、MLアクセラレータの種類を適切に選択することで、トレーニングによる炭素排出量を100倍～1000倍削減できることを示しました。