AutoKeras:GoogleのAutoMLの対抗馬

基礎理論

1.AutoKeras:GoogleのAutoMLの対抗馬のまとめ

・AutoMLのベータ版は$20/hの料金でこれは他のクラウドービスよりかなり高い
・AutoKerasはNASを改良したENASを使い同等の性能をフリーソフトウェアで実現できる
・Keras以外でもENASを使ったフリーソフトウェアは存在するので代替案を知っておく事は大事

2.AutoKerasとは?

以下、towardsdatascience.comより「AutoKeras: The Killer of Google’s AutoML」の意訳です。

Google AIは、AutoMLのベータ版をついにリリースしました。AutoMLは、一部の人がディープラーニングの使い方を完全に変えると言っているサービスです。

GoogleのAutoMLは、一連のクラウドソフトウェアから構成される新しい機械学習ツールです。これはNAS(Neural Architecture Search:ニューラル アーキテクチャー サーチ)と呼ばれるGoogleの画像認識人工知能に関する最先端の研究結果を応用したものです。

(注:ディープラーニングは脳神経(ニューラル)を真似しているのですが、具体的な構造(アーキテクチャー)をどのようにするかは様々な試行錯誤や専門的な知識が必要です。AutoMLは、NAS、ニューラルの最適なアーキテクチャーをサーチし、最適な構造を自動で見つけてくれるクラウドソフトウェアです。専門知識や試行錯誤をしなくても学習用データさえ用意すれば自動的に最適な人工知能を作れるようになる!と言うのがAutoMLが注目されている理由です)

NASは基本的に、特定のデータセットで特定のタスクを実行するために最適なニューラルネットワークを自動で検索してくれるアルゴリズムです。AutoMLは、ユーザがディープラーニングやAIを知らなくても、高性能の人工知能を容易に訓練できる機械学習開発ツールです。必要なのはそのデータが何を表現しているのかわかるようにデータにラベル付けする事だけです!

GoogleのAutoMLではNASを使用して、特定のデータセットとタスクに最適なネットワークを自動で見つける事ができます。彼らはすでに、人工知能の専門家が手作業で設計したニューラルネットワークよりも優れたパフォーマンスを達成するニューラルネットワークを自動的に生成する事が出来る事を証明しています。

AutoMLは、機械学習関連業務に関する従来の常識を完全に変更するポテンシャルがあります。多くの企業では、画像分類などの比較的単純な作業を実行するためにディープラーニングを使用していますが、AutoMLを使用すれば、画像分類のために機械学習を専攻した博士を5名雇用する必要はありません。必要になるのは学習データを取り扱い、整理する事ができる人物です。

それゆえ、AutoMLはどのような企業や個人でもAIを簡単に使いこなす事ができるようになる美しい銀の弾丸なのでしょうか?

(注:銀の弾丸は、通常の弾丸では殺せない狼男を殺す事ができると言われており、転じて通常の手法では解決できない難しい事を一気に解決する魔術的手段を意味します)

いいえ、そんな簡単な話ではありません。

コンピュータで画像を扱うためにGoogleのAutoMLを使用するには、1時間あたり$20米ドルの費用がかかります。それは高すぎです!あなたが料金を支払って試してみるまで、自分が手作業で作ったネットワークよりもはるかに正確な精度を持つ人工知能が本当に出来るのかわかりません。過去にはGoogleもAIコミュニティも双方が誰とでもAIの知識を共有できるようにオープンソース文化を好んでいたのに、GoogleがAutoMLを収益化しようとしていることは興味深いことです。

そう、その通り、GoogleのAutoMLは失うのです。オープンソースの文化を。

AutoKerasを試してみてください。オープンソースのPythonパッケージであるKerasを使用してディープラーニングを非常に使いやすくします。AutoKerasはENAS、効率的な最新のNeural Architecture Searchを使用しています。あなたはAutoKerasをpipを利用して簡単にインストールする事ができます。そして、貴方専用のデータセットを使って貴方専用のアーキテクチャサーチを実行する事ができます・・・無料で。

全てのコードはオープンソースとして公開されているため、貴方専用にカスタマイズしたい場合は、いくつかのパラメータを変更して試す事もできます。Keras用に実装されているため、コードは理解しやすく、動作をより深く理解する事も簡単です。開発者は正確なモデルを素早く作成する事が出来き、研究者はアーキテクチャ検索をより深く理解することができます。

AutoKerasは、簡単なインストール、実行も容易、たくさんのサンプル、カスタマイズも容易、つまり、偉大なオープンソースプロジェクトが持つ全ての要素を備えています。あなたはNASが最後に見つけたネットワークモデルを見ることさえできます!あなたがTensorFlowまたはPytorchを好むなら、それらのフレームワークでも利用可能です!

私はAutoMLの代わりに非常に安価なAutoKerasや、他の実装を試してみることをお勧めします。もしかしたらGoogleはAutoMLを他のオープンソースの同等ソフトと差別化するために何かをしているかもしれませんが、NASを用いて作成された人工知能と手作業で構築された人工知能のパフォーマンスの差が非常に小さいことを考えると、このような急激な価格差に十分な価値があるとは思えません。

世の中で広く使われるディープ・ラーニングやAIはpaywall、つまり、高い価格設定で使用できる人を限定させるべきではない強力なテクノロジーです。はい、Google、Amazon、Apple、Facebook、Microsoftは生き残りをかけてお金を稼ぐ必要がある営利企業です。しかし、研究論文はこのように公開されており、手法を素早く実現できるディープラーニングのライブラリがあれば、それを簡単に公開することを阻止しようとする事に意味はありません。

潜在的により大きな問題もあります。知識自体が隠されてしまう事です。
最近のAI研究で素晴らしい事の1つは、研究コミュニティの多くが、Arxivなどのサイトに自らの仕事を公開してコミュニティと共有し、フィードバックを迅速に得る事が出来る事でした。さらに、Githubに作成したプログラムを投稿し、研究の検証やアルゴリズムの確認、実際のアプリケーションとして使用する傾向も高まってきています。しかしここでも、私たちは研究がpaywallの後ろに置かれているのを見る事になるでしょう。

科学を共有することは、進歩と全員の一般的な知識を高めることに役立ちます。一つのことは確かです。知識はオープンソースでなければなりません。誰にとっても優れています。

3.AutoKeras:GoogleのAutoMLの対抗馬の感想

一時間当たり$20は確かにGCPの他のクラウドサービスに比べると高価なのですが、コメント欄でも、「他のクラウドサービス上で人工知能を一から学習させる時間とコストとAutoMLを比較するとそんなに高くないのでは?」との指摘もありました。元記事執筆者のGeorgeさん曰く、その通りであるがENASを使うと比較的安価なハードウェエア上でもAutoMLに十分対抗できる性能の人工知能を作り上げる事が出来るとの事でした。

現在のGoogleは人工知能分野では「人工知能分野をけん引する世界のリーダーとして責任ある~」と極力オープンなスタンスを維持してくれていますが、将来的にどうなるかはわかりません。

例えば、Googleの広告ツールでは昔は「ある単語がどのくらい検索されているか?」は誰でも無料で見る事ができたのですが、数年前に「少額でも良いから毎月広告費を支払っている人」でないと厳密な数がわからないように仕様変更されました。そして、つい最近「調べたい単語に対して広告費を払っている人」でないと厳密な数が出ないようになり、段々と情報がクローズドになってきています。

更に、ちょっと前に、アメリカでグーグル検索経由の流入数が減ったと言う記事が話題になりました。グーグルのシェアが減少したのではなく、グーグルが検索トラフィックを減らしている、という指摘です。例えばグーグルで「人工知能」と検索すると検索結果だけが表示されるのではなく、Google自身が「アンサーボックス」と言う機能で直接回答するようになってきており、コンテンツ提供先にユーザが行かなくなってきていると言うのです。

ユーザ視点では「検索する」→「コンテンツ提供先ページに行く」→「コンテンツを読む」が、「検索する」→「Googleが要約した答えを直接提供してくれる」となって便利ではあるのですが、コンテンツを真面目に提供している側にとってはGoogleがコンテンツを盗んで集客の手段を奪う方向に舵を切り始めたと危惧してしまうでしょう。(実際にGoogleがそれをしたらインターネットに手間暇かけてコンテンツを真面目に作る人はいなくなり「インターネットは便所のラクガキ」の世界が実現して検索エンジンの存在意義がなくなるのでその可能性は少ないとは思いますが)

AutoKerasやGeorgeさんのような考え方は多様性としてあった方が好ましいと思います。

4.AutoKeras:GoogleのAutoMLの対抗馬の関連リンク

1)towardsdatascience.com
AutoKeras: The Killer of Google’s AutoML

2)github.com
autokeras
enas
ENAS-pytorch

3)webtan.impress.co.jp
グーグルがオーガニック検索トラフィックを減らしている!? いまSEO担当者は何ができるのか?

コメント

タイトルとURLをコピーしました