人の流れを統計的に処理した結果から新しい洞察を得る(2/3)まとめ

  • 2019.11.18
  • AI
人の流れを統計的に処理した結果から新しい洞察を得る(2/3)まとめ

1.人の流れを統計的に処理した結果から新しい洞察を得る(2/3)まとめ

・地理情報を地域単位、時間情報を週単位などにまとめる事でモビリティデータのプライバシー配慮を実施
・モビリティデータを用いる事で都市の人の流れが従来よりも明確に定量的に視覚化できるようになった
・同じ人口規模であってもパリは単一中心構造、ロサンゼルスは多数中心構造と人の流れが明確に違う

2.モビリティデータと都市構造の研究

以下、ai.googleblog.comより「New Insights into Human Mobility with Privacy Preserving Aggregation」の意訳です。元記事は2019年11月12日、 Adam SadilekさんとXerxes Dotiwallaさんによる投稿です。

ユーザーのプライバシーを保護しつつグローバルモビリティマップを計算
Googleが掲げるAI原則に沿って、プライバシーを保護する技術を中核として、個人を特定できない集団として扱ってモビリティを分析する方法を設計しました。個々のユーザーの動きを特定できないようにするために、差分プライバシー(differential privacy)と呼ばれる手法とk匿名性(k-anonymity)を使用して、時間の経過ともに変化する人の流れを集計します。これにより、集計データの特徴表現モデルを作成します。

2014年に最初に実装された差分プライバシーを用いるこのアプローチは、ユーザーのプライバシーと集計後データの精度の両方を維持する方法として、データにランダムな「ノイズ」を意図的に追加します。位置情報の履歴提供を意図的にの許可したユーザーのスマートフォンから収集されたデータにこの方法を適用し、人口移動がどのように行われているかのパターンを大域的によりよく理解しようとしています。

訳注:差分プライバシーは、2016年にAppleがiOS10に搭載する事を発表して話題になった事がある技術で、集団の中から個人を特定する試みを統計学的に一定以上の精度で求める事が出来ないようにする仕組みです。k-anonymityはデータが特定されるリスクを定量的に評価する手法の事です。

モデルは、場所が詳細に特定できないデータのみを扱います。位置データはS2セルなどの事前に定義された地理的領域に集約されます。

時間をより長い間隔(週間隔など)にし、緯度/経度情報を一意な地理的領域識別子として扱う事により、各読み取り値を時空間領域に瞬間的に記録します。 これらの大きな単位の時空間領域に集約することは、個人のプライバシーを保護するだけではなく、コミュニティのプライバシーを保護することもできます。

訳注:S2セルはGoogle MapやOpen Street Map、及びPokemon Goなどでも使われている、全世界を細かく分けた区画定義の事です。Pokemon Goでは基本、同一S2セル内にボス敵用のEXレイドが2つ以上開催されないとか。

最後に、地理的エリアの各ペアについて、システムは所定の時間間隔でエリア間の相対的な人の流れを計算し、差分プライバシーフィルターを適用し、大域的で、匿名化され、集約されたモビリティマップを出力します。

データセットは1回だけ生成され、十分な数のアカウントを含むモビリティフローのみがモデルによって処理されます。この仕組みは、個人データが手動で識別されるのを防ぐため、交通量と駐車可能性の推定のための重要な情報源として既に集計データが使用されているような、人の流れが非常に多いケースに限定されます。結果のマップは、効率的な検索が行えるように索引が付与され、以下で説明するモデリングに使用されます。

モビリティマップを使ったアプリケーション
世界中の都市に住む人々を集約したモビリティは、都市を定義し、更にその都市に住む人々への影響を定義します。都市の階層構造を定量化する基準であるフロー階層(Φ)を、モビリティマップから抽出して完全に定義しました。

1930年代に行われたChristallerによる研究以来、都市全体の階層については広く研究されてきましたが、個々の都市では、主に中心構造と周辺構造の違い、および都市が単一の中心部(モノセントリック)を持つのか、多数の中心部(ポリセントリック)を持つのかに焦点が当てられています。

その代わり、私達の今回の結果は、現実が従来考えられていたよりもはるかに富んでいることを示しています。モビリティマップは、都市が健康や交通などの一連の重要な生活の質の指標と強く相関しており、それを定量的に実証することができます。

以下に、パリとロサンゼルス、2つの大都市の例を示します。
2つの都市の人口はほぼ同じですが、人の流れは大きく異なります。パリはモノセントリックで、タマネギ構造は明確な移動性の高い市の中心(赤色)を持ち、中心から遠ざかるにつれて次第に明度が減少します。一方、ロサンゼルスは真にポリセントリックで、地域全体に多数の人の流れが多いエリアが点在しています。


パリ(左)とロサンゼルス(右)のモビリティマップ。
両都市の人口規模は似ていますが、モビリティパターンは非常に異なります。パリは、明確な中心を示すタマネギ構造を持ち、人の移動は中心から離れるにつれて次第に減少します。対照的に、ロサンゼルスには、この地域全体に多数の人の流れが多いエリアが点在しています。

3.人の流れを統計的に処理した結果から新しい洞察を得る(2/3)関連リンク

1)ai.googleblog.com
New Insights into Human Mobility with Privacy Preserving Aggregation

2)www.nature.com
Hierarchical organization of urban mobility and its connection with city livability

3)github.com
google/differential-privacy