クラウドTPUが新しい料金体系で新たな地域で利用可能に

モデル

1.クラウドTPUが新しい料金で新たな地域で利用可能にまとめ

・クラウドTPUの空き時間を活用するプリエンプティブ料金が新設
・プリエンプティブ料金は通常利金より70%安価
・同時にアジア、ヨーロッパ地域でも利用可能に

2.クラウドTPUのプリエンプティブな料金体系と新地域

ディープニューラルネットワークは、機械翻訳、音声認識、画像分類、碁で世界チャンピオンに勝利するなど、さまざまなビジネスおよび研究上のブレークスルーを実現しました。ディープラーニングの学習は非常に膨大な計算を必要とするため、Googleは新たにTensor Processing Unit(TPU)というハードウェアを独自開発し、翻訳、写真、検索、アシスタント、およびGmailを含む主要製品で使用しています。

GoogleはTPUをクラウドサービスとして提供し、あらゆる地域の企業が機械学習で自社の製品やサービスを変革することを可能にしています。GoogleはクラウドTPUを幅広く利用できるように、手ごろな価格で提供するよう努めています。本日、クラウドTPUはヨーロッパとアジアの2つの新しい地域で利用可能にしました。また、クラウドTPUの通常価格より70%低いプリエンプティブな価格設定も導入しました。クラウドTPUは米国、ヨーロッパ、アジアで下記の料金でご利用いただけます。貴方はクイックスタートガイドを読み、わずか数分でTPUを利用開始する事ができます。

(訳注:プリエンプティブとは余った時間、つまり誰もTPUを使ってない時間に機械学習を実行させる契約形態の事。プリエンプティブな契約のジョブが実行されていても、通常契約のジョブが開始されるとプリエンプティブ契約なジョブは強制終了され通常契約のジョブの実行が優先される。しかし、プリエンプティブな契約は大変お安い)

Google Cloud Region Normal(hourly) Preemptible(hourly)
us-central1 $6.50 $1.95
europe-west4 $7.15 $2.15
asia-east1 $7.54 $2.26

クラウドTPUのベンチマークパフォーマンス

機械学習モデルをトレーニングする事は、プログラムをコンパイルする事に似ています。エンジニア、研究者、データサイエンティストの生産性を向上するためには機械学習のトレーニングを迅速に実行する必要があります。

また、機械学習を使ったアプリケーションを開発し、他の用途に展開するためには、モデルを洗練するために繰り返し学習する必要があります。その際に重要な事はtime-to-accuracy(機械学習が求められる正確性を満たすようになるまでに学習に必要な時間)と費用です。

スタンフォード大学の研究者は、実行時間とトレーニングコストに焦点を当てたDAWNBenchと呼ばれるオープンなベンチマークを開催し、CloudNet TPUは大規模なImageNetトレーニングコスト部門で1位を獲得しました。

単一のCloud TPUがオープンソースのAmoebaNetリファレンスモデルを目標精度に達するまで学習させるのに必要なコストはたった49.30ドル、オープンソースのResNet-50モデルはわずか58.53ドルです。

私たちのTPUポッド(TPUを複数組み合わせたシステム)もImageNet Training Time部門で1位を獲得しました。TPUポッドを構成する全TPUの半分だけを使って実行されたResNet-50コードは、TPU以外を使用したどの競争相手より約6倍速く、約30分で目標精度まで学習する事ができました!

Googleは競技に参加する際、標準的な広く知られている学習アルゴリズムだけを使用するように自分たちを制限をしていました。しかし、他の参加者であるfast.aiが(ImageNet Training Costの3位、ImageNet Training Timeの4位)が、標準的なResNet-50トレーニング手順に2つの賢いチューニングを施し、より速い学習を実現していました。

DAWNBenchコンテストが終了した後、GoogleはCloud TPU ResNet-50にfist.aiと同じチューニングを簡単に適用する事ができ、これにより、単一のクラウドTPUでResNet-50のトレーニング時間が8.9時間から3.5時間に短縮され、2.5倍の改善を実現し、通常価格でわずか25ドルでResNet-50を訓練することが可能になりました。

プリエンプティブクラウドTPUは通常価格より安価なため、クラウドTPUプラットフォームはさらに手頃な価格になります。 ImageNetのResNet-50はわずか$7.50でトレーニングすることができます。

プリエンプティブ契約を利用すれば、フォールトトレラントなワークロード(つまり計算途中で終了させられても問題が発生しないように障害をあらかじめ考慮して設計された強固なシステム)をこれまで以上にコスト効率よく実行できます。これらのTPUはプリエンプティブなヴァーチャルマシンと同様に動作します。また、TensorFlowにはチェックポイントからの保存とリストアのためのサポートが組み込まれているため、納期に厳しい制限がないジョブはプリエンプティブな価格設定を気軽に利用する事ができます。これは、DAWNBenchが要求するレベルの精度を実現する最先端のディープラーニングモデルを、昼食代より安く学習させる事ができることを意味しています!

Select Open-Source Reference Models Normal training cost Preemptible training cost
(TF 1.8) (TF 1.8)
ResNet-50 (with optimizations from fast.ai): Image classification ~$25 ~$7.50
ResNet-50 (original implementation): Image classification ~$59 ~$18
AmoebaNet: Image classification (model architecture evolved from scratch on TPUs to maximize accuracy) ~$49 ~$15
RetinaNet: Object detection ~$40 ~$12
Transformer: Neural machine translation ~$41 ~$13
ASR Transformer: Speech recognition (transcribe speech to text) ~$86 ~$27

今すぐにでもCloud TPUsの使用する事ができます。

Google Cloudは、あらゆる機械学習を実行するベストなサービスとなる事を目指しています。クラウドTPUは、さまざまなマシンラーニングアプリケーションを安価に、バッチ単位でトレーニングさせる事ができます。また、最近導入されたプリエンプティブ価格で最先端のGPUも提供します。

私たちはあなたが何を構築するのを見て興奮しています!開始するには、Cloud TPUのクイックスタートをチェックし、オープンソースのリファレンスモデルを試してみてください。$300ドル分を無料で使用できるトライアルにサインアップする事も忘れないで!

最後に、Googleは開発者向けイベントであるGoogle I / OとTensorFlow開発者サミットのCloud TPU関連セッションを見ることを奨励します。 “Effective machine learning with Cloud TPUs”と“Training Performance: A user’s guide to converge faster.”です。

Effective machine learning using Cloud TPUs (Google I/O ’18)

 

 

Training Performance: A user’s guide to converge faster (TensorFlow Dev Summit 2018)

 

3.クラウドTPUのプリエンプティブな料金体系と新地域感想

やっすいなー、と思うのですが、なんでアジアだけ高いねん、その理由も説明せんかい!と突っ込みもしておきます。

4.クラウドTPUのプリエンプティブな料金体系と新地域関連リンク

1)cloudplatform.googleblog.com
Cloud TPU now offers preemptible pricing and global availability

コメント

タイトルとURLをコピーしました