distributed computing

データセット

データセット蒸留による機械学習モデルの効率的なトレーニング(2/2)

1.データセット蒸留による機械学習モデルの効率的なトレーニング(2/2)まとめ ・蒸留したデータセットは、画像分類データセットにおいて最先端の性能を達成 ・分散システムを利用してデータセットは数百のGPUを利用して作成した ・蒸留したデータ...
モデル

超並列グラフ計算:理論から実践へ(1/2)

1.超並列グラフ計算:理論から実践へ(1/2)まとめ ・大規模なグラフは数千億の頂点を含むため一台のコンピュータでは処理しきれない ・複数のコンピューターで分散処理を行う事で兆単位のグラフを処理できるが課題も発生 ・分散ハッシュテーブルを使...
アプリケーション

Menger:大規模な分散型強化学習(1/3)

1.Menger:大規模な分散型強化学習(1/3)まとめ ・RLとはデータ収集とトレーニングのループだが規模拡大すると反復処理が追いつかなくなる ・Mengerは大規模な分散RLインフラであり複数クラスタにより規模拡大が可能 ・TPUを使用...
入門/解説

Googleを巨大にした友情(7/9)

1.Googleを巨大にした友情(7/9)まとめ ・分散コンピューティング環境でリリース作業が面倒だったのでMapReduceを書いた ・使い勝手が良かったので社内でも様々な場面で使われるようになり論文を公開した ・クローンとしてHadoo...