Federated Learningでスマートフォンのテキスト選択機能を改善(2/2)

１．Federated Learningでスマートフォンのテキスト選択機能を改善(2/2)まとめ

・プライバシーを保ちながらユーザー操作に基づいてテキスト選択を予測する手法を開発した
・その結果、Androidユーザー向けSmart Text Selectionモデルを大幅に改善することができた
・モデルを学習する際にプライバシーが制限要因になる必要はないことがわかった

２．Smart Text Selectionの改善

以下、ai.googleblog.comより「Predicting Text Selections with Federated Learning」の意訳です。元記事は2021年11月22日、Florian Hartmannさんによる投稿です。

アイキャッチ画像のクレジットはPhoto by Kelly Sikkema on Unsplash

端末上の学習実行用コードによって生成されたモデルの更新を集約するために、暗号通信プロトコルであるSecure Aggregationを使用し、サーバーは個々の端末から提供される更新を読まずに、連合学習モデルの学習結果を平均更新(mean update)を使って計算することができます。

Secure Aggregationによって個々に保護されるだけでなく、更新はトランスポート暗号化(transport encryption)によって保護され、ネットワーク上の攻撃者に対して二重の防御を実現しています。

最後に、モデルがデータを記憶してしまうケースについて検討しました。原理的には、学習データの特性がサーバーに送信される更新データにエンコードされ、集約プロセスを通過すると、最終的にグローバルモデル内に記憶される可能性があります。これにより、攻撃者はモデルから学習データを復元することが可能になります。そこで、モデルが意図せずに学習データを記憶してしまう度合いを定量化する分析手法であるSecret Sharerの手法を用い、モデルが機密情報を記憶していないことを実証的に検証しました。さらに、ある種のセンシティブなデータをモデルに見せないようにするデータマスキング技術も採用しました。

これらの技術を組み合わせることで、Federated Smart Text Selectionがユーザーのプライバシーを保護する方法で学習されることを保証しています。

優れたモデル品質を実現する

連合学習(Federated Learning)によるモデルの学習は、当初はうまくいきませんでした。損失は収束せず、予測はほとんどランダムに等しい状況でした。学習プロセスのデバッグは困難でした。なぜなら、学習データはデバイス上にあり、中央で収集されたものではないため、調査や検証を行うことができなかったのです。実際、このような場合、機械学習パイプラインのデバッグの最初のステップとなることが多い、データが期待通りのデータか確認できず判断すらできません。

この課題を克服するため、私たちは、学習中のモデルの挙動を理解するためのハイレベルな指標を慎重に設計しました。このような指標には、学習に使うサンプルの数、選択精度、各実体の適合率と再現率などが指標に含まれます。

これらの指標は、連合学習時に連合分析(federated analytics)を通じて収集されました。連合分析は、連合学習と似た手法でトレーニング中にモデルの重みを収集するのと同様な手法で指標が収集されます。

これらの指標と多くの分析を通じて、システムのどの部分がうまく機能し、どこにバグが存在する可能性があるのかをよりよく理解することができました。

これらのバグを修正し、データに対するオンデバイスフィルタの実装、より優れた連合最適化手法の使用、より堅牢な勾配集約器の適用など、さらなる改善を行った結果、モデルはうまく学習できるようになりました。

結果

この新しい連合アプローチを用いることで、使用する言語によって異なりますが、Smart Text Selectionのモデルを大幅に改善することができました。一般的に、複数単語の選択時の精度は5%から7%向上し、単一単語時の性能は低下しませんでした。住所(サポートされている実体の中で最も複雑なタイプ)を正しく選択する精度は、使用する言語によって8%から20%向上しました。これらの改善により、毎日数百万件もの選択範囲が自動的に拡張されています。

国際化対応

Smart Text Selectionの連合学習アプローチのもう一つの利点は、他の言語への拡張性です。サーバー内で代替データを使った学習では、実際の端末上のデータに近づけるために、各言語用に代替データを手動で調整する必要がありました。これはある程度までは有効ですが、言語が増えるごとに膨大な労力を必要とします。

しかし、連合学習パイプラインは、ユーザーの操作から学習するので、そのような手動調整は必要ありません。英語で良い結果が出た後、同じパイプラインを日本語に適用したところ、日本語の選択項目に合わせてシステムを調整する必要がなく、さらに大きな改善が見られました。

この新しい連合アプローチによって、Smart Text Selectionをさらに多くの言語に拡張していきたいと考えています。また、理想的には、システムを手動で調整することなく、低リソース言語にも対応できるようにすることです。

まとめ

私たちは、ユーザーの操作に基づいてテキスト選択を予測する連合学習方法を開発し、その結果、Androidユーザーに展開されるSmart Text Selectionモデルを大幅に改善することができました。

このアプローチは、サーバー上でユーザーデータを収集することなく動作するため、連合学習を使用する必要がありました。さらに、Androidの新しいPrivate Compute Core、Secure Aggregation、Secret Sharer手法など、多くの最新鋭のプライバシーアプローチを使用しました。この結果は、モデルの学習においてプライバシーが制限要因になる必要はなく、むしろ、ユーザーのデータのプライバシーを確保しながら、大幅に優れたモデルを得ることができたことを示しています。

謝辞

本研究は、多くの方々の協力により行われました。私たちはLukas Zilka, Asela Gunawardana, Silvano Bonacina, Seth Welna, Tony Mak, Chang Li, Abodunrinwa Toki, Sergey Volnov, Matt Sharifi, Abhanshu Sharma, Eugenio Marchiori, Jacek Jurewicz, Nicholas Carlini, Jordan McClead, Sophia Kovaleva, Evelyn Kao, Tom Hume, Alex Ingerman, Brendan McMahan, Fei Zheng, Zachary Charles, Sean Augenstein, Zachary Garrett, Stefan Dierauf, David Petrou, Vishwath Mohan, Hunter King, Emily Glanz, Hubert Eichner, Krzysztof Ostrowski, Jakub Konecny, Shanshan Wu, Janel Thamkul, Elizabeth Kemp、その他のプロジェクト関係者全員に感謝します。

３．Federated Learningでスマートフォンのテキスト選択機能を改善(2/2)関連リンク

１）ai.googleblog.com
Predicting Text Selections with Federated Learning