gpipe

モデル

Image GPT:自然言語処理用の人工知能で画像を生成(3/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(3/3)まとめ ・iGPTが強力な画像特徴表現を学習可能で教師有り、半教師モデルと匹敵する事が示された ・しかしGPUにV100を使って延べ2500日が必要で画像専用モデルの約3...
モデル

Image GPT:自然言語処理用の人工知能で画像を生成(1/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(1/3)まとめ ・文章生成で有名になった人工知能を画像でトレーニングすると品質の高い画像を生成できた ・iGPTと名付けられたこのモデルは物体の外観など画像の特性を理解しているよ...
入門/解説

Google Research:2019年の振り返りと2020年以降に向けて(5/8)

1.Google Research:2019年の振り返りと2020年以降に向けて(5/8)まとめ ・2019年はニューラルネットワークのトレーニングにどのような力学が働くのか特性を理解を目指した ・AutoMLの研究も継続し、既存モデルの改...
学習手法

M4:超多言語、大規模ニューラル機械翻訳(3/3)

1.M4:超多言語、大規模ニューラル機械翻訳(3/3)まとめ ・低リソース言語の数を増やすと高リソース言語の翻訳の品質が低下する現象が観察される ・これを敷設ために良い学習アルゴリズムやモデルパラメータ数を増やす試みを行った ・最終的に50...
モデル

EfficientNet:AutoMLとモデルのスケーリングによりCNNの精度と効率を向上(2/2)

1.EfficientNet:AutoMLとモデルのスケーリングによりCNNの精度と効率を向上(2/2)まとめ ・EfficientNetのベースネットワークはAutoML MNASフレームワークによって開発された ・EfficientNe...
モデル

EfficientNet:AutoMLとモデルのスケーリングによりCNNの精度と効率を向上(1/2)

1.EfficientNet:AutoMLとモデルのスケーリングによりCNNの精度と効率を向上(1/2)まとめ ・畳み込みニューラルネットワークをスケールアップして精度と効率を向上させる新手法が発表 ・EfficientNetと命名されたこ...
学習手法

GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(3/3)

1.GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(3/3)まとめ ・GPipeを使って5億5,700万のパラメータのAmoebaNet-Bで84.3%のTop-1 Accuracyを達成 ・Top-5 ...
インフラ

GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(2/3)

1.GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(2/3)まとめ ・GPipeを使うとCloud TPUv2で利用可能なパラメータを8200万から3億1800万に増やす事ができる ・TPUv3ではアクセ...
インフラ

GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)

1.GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)まとめ ・最近のニューラルネットワークはTPUアクセラレータのメモリに収めるのが難しいくらい巨大化している ・しかし、性能とパラメータ数には強い...