Google Research:2019年の振り返りと2020年以降に向けて(3/9)

Google Research:2019年の振り返りと2020年以降に向けて(3/9)

1.Google Research:2019年の振り返りと2020年以降に向けて(3/9)まとめ

・機械学習をクラウド上ではなくスマートフォン上で実行する事に注力し音声、、文字の認識が可能に
・これによりプライバシー保護と応答速度向上、ネットワーク接続がなくとも動作できるようになった
・医療分野では画像を使った困難な診断などで人間の専門家を支援できるレベルの精度を達成しつつある

2.AIによるスマートフォンの改良と医療分野への応用

以下、ai.googleblog.comより「Google Research: Looking Back at 2019, and Forward to 2020 and Beyond」の意訳です。元記事の投稿は2020年1月9日、Google Research部門トップのJeff Deanさんによる投稿です。アイキャッチ画像のクレジットはPhoto by Benjamin Davies on Unsplash

(5)スマートフォンをより知的にする
私たちの仕事の多くは、スマートフォン上で動作する機械学習を使用してスマートフォンに新しい機能を提供することにより、知的な個人用端末を実現するのに役立ちます。

スマートフォン上で実行できる強力な機械学習モデルを作成する事により、これらのスマートフォンの応答性が高まり、機内モードやインターネットに繋がっていない状態でも常に利用できるようになります。非常に正確な音声認識モデル視覚認識モデル、手書き文字認識モデルを全てスマートフォン上で実行する事を達成し、強力な新機能への道を開きました。
2019年のハイライトには次のようなものがあります:

Live Captionを使用したスマートフォン上で実行する字幕処理。スマートフォンで再生されているビデオに字幕を付ける機能で、インターネットに繋がっていなくとも、いつでも利用可能です。

録音した音声に索引をつけて、簡単に内容を検索できるようにした強力な新しい書き起こしアプリRecorderの発表

・Google翻訳のカメラ翻訳機能の改善により、文書が書かれた部分を指定すると知らない言語であっても即座に翻訳することができます。

・ARCoreのAugmented Faces APIのリリース。人間の顔を認識し、新しいリアルタイムな拡張現実ツールを可能にします

リアルタイムに手の動きを認識するアプリのデモ。ユーザーが手を使ったジェスチャーでスマートフォンを操作する新しいアプローチを実現します。

モバイルキーボード用に改良したRNNベースの手書き文字認識機能

スマートフォンのカメラを使用した新しいglobal localizationアプローチにより、より正確な方向認識が可能になりました。これは、現実世界であなたが方角と目的地までの見つけるために役立ちます。

Federated learning(federated.withgoogle.comのオンラインコミックによる説明をご覧ください!)は、2015年にGoogleの研究者によって考案された強力な機械学習アプローチです。これにより、多数のクライアント(モバイルデバイスや組織全体など)上にトレーニングデータが分散化したままでも共同でモデルをトレーニングする事ができます。

これにより、大規模な学習システムでありながら優れたプライバシー特性を持つ事が可能になります。

私達は、この分野の多くの研究課題における最先端技術の進歩に努めながら、ますます多くの製品と機能でFederated learningを使用しています。2019年、Googleの研究者は24もの学術機関の著者と協力して、Federated Learningに関する調査記事を作成し、過去数年間の進歩を強調するとともに、この分野の多くの未解決の研究問題を解説しました。

コンピュータを使って画像に処理を行った写真(computational photography)は、過去数年間でスマートフォン搭載カメラによる画像の品質に大きな進歩をもたらし、今年も例外ではありませんでした。
今年は、全員が笑顔になった瞬間を自動で認識して自撮り撮影プロ並みの浅い被写界深度の画像やポートレートの撮影Pixel PhonesのNight Sight機能を使用した素晴らしい天体写真の撮影などが容易にできるようになりました。

この研究に関する技術的な詳細は、論文、「multi-frame super resolution and mobile photography in very low-light conditions」に記載されています。これらの作業により、素晴らしい写真を撮って、貴方の人生のときめいた瞬間を思い出すことができます。

(6)健康とAI
2018年後半に、Google Research Healthチームと、Deepmind Healthと、健康関連のアプリケーションに重点を置いたGoogleのハードウェア部門のチームを合併してGoogle Healthを形成しました。2019年、私たちはこの分野で進めてきた研究を続け、さまざまなヘルスケアパートナーと協力して研究論文を発表し、ツールを構築しました。
2019年のハイライトをいくつかご紹介します。

マンモグラフィを使って乳癌を診断するように訓練したディープラーニングモデルは、米国の女性の8人に1人が罹患する状態である乳癌を、専門家よりも高い精度で発見し、偽陽性と偽陰性を減らすのに役立つことを示しました。英国の医療システムを使って撮影された匿名化されたデータに基づいてトレーニングされたモデルは、米国のまったく異なる医療システムで撮影された画像を使って患者を診断しても、同様に診断精度が向上する事が示されました。


機械学習によって正しく特定された、検出が困難な乳癌の例

皮膚疾患の鑑別診断のために訓練されたディープラーニングモデルは、プライマリケア医(訳注:様々な問題に幅広く対処できる能力を身につけている医師。皮膚科医のように特定の疾患に専門的知識を持っているわけではない)よりもはるかに正確で、皮膚科医と同等か、おそらくわずかに優れた結果をもたらすことができることを示しました。

・現在Google Healthに所属しているDeepMind Healthの同僚は、米国退役軍人局(VA:US Department of Veterans Affairs)の専門家と協力して、機械学習モデルが急性腎障害(AKI:acute kidney injury)の発症を予測できることを示しました。急性腎障害は早期に発見すれば治療可能な病状の1つで、それが起こる2日前に予測する事ができました。将来的には、この予測を活用する事により医師はこの深刻な病状の治療に48時間の余裕を持って開始する事ができます。

ディープラーニングの適用範囲を複数のパートナー組織との電子医療記録に拡大しました。 この作業の詳細については、2018年のブログ投稿をご覧ください。

・肺がんの予測について有望な一歩を踏み出しました。ディープラーニングモデルはた単一のCTスキャン画像のみを使って、訓練を受けた放射線科医と同等以上に肺がんを予測します。肺癌の早期発見は、生存率を劇的に改善します。

・Verilyおよびインドとタイのヘルスケアパートナーと協力して、眼疾患の検出と予防のための機械学習ツールの展開を拡大および評価し続けました。

・癌診断用の拡張現実顕微鏡に関する研究論文を発表しました。これにより、病理学者は、顕微鏡で組織を検査しながらスライドのどの部分が最も興味深いかについてリアルタイムのフィードバックを得ることができます。こちらの2018年のブログ投稿でも詳細を読むことができます。

病理学者向けの人間中心の類似画像検索ツールを構築し、類似症例の検査を可能にすることで、より効果的な診断を行えるようにしました。

3.Google Research:2019年の振り返りと2020年以降に向けて(3/9)関連リンク

1)ai.googleblog.com
Google Research: Looking Back at 2019, and Forward to 2020 and Beyond

2)research.google
Publication database(2019)
Optimization of Molecules via Deep Reinforcement Learning

3)modelcards.withgoogle.com
Object Detection Model Card v0 Cloud Vision API

4)ai.google
Working together to apply AI for social good

5)www.blog.google
Using AI to give people who are blind the “full picture”

6)support.google.com
Get image descriptions on Chrome

7)federated.withgoogle.com
Federated Learning An online comic with google AI