2022年以降のAI・データ分析の10大トレンド(1/3)

AI

1.2022年以降のAI・データ分析の10大トレンド(1/3)まとめ

・人工知能とともに働く拡張労働やモデルを直販する新しいビジネスが始まっている
・モデル開発の際に環境に配慮する事が求められる時代がやってきている
・巨大なパラメータを持つモデルを様々な形で使う時代がやってきている

2.2022年以降に盛り上がりそうなAI界隈のトレンド

以下、www.kdnuggets.comより「10 Key AI & Data Analytics Trends for 2022 and Beyond」の意訳です。

元記事は2021年12月、David Poolさんによる投稿です。アイキャッチ画像のクレジットはPhoto by Tevin Trinh on Unsplash

世界的な新型コロナウイルスの大流行により、私たちの仕事のやり方は一変しました。世界の多くがオンラインに移行する中、電子商取引、クラウドコンピューティング、サイバーセキュリティ対策の強化は、データ分析における現在のトレンドを評価する上で、氷山の一角に過ぎないのです。

リスクを管理し、コストを抑えることは、企業にとって常に重要な検討事項です。しかし、データを効果的に分析できる適切な機械学習技術を利用することは、競争力を高めたい企業にとって非常に重要となってきているのです。

モデル開発者にとってトレンドは何故重要なのでしょうか?

本稿の2022年以降のデータ分析トレンドは、開発者に業界の方向性を示すものです。データサイエンスのトレンドを把握し、現在の標準に合うようにモデルを調整することで、開発者は自分の仕事を本当に価値のあるものにすることができます。これらのデータ分析トレンドに触発されて、新しいモデルを考案するのも、既存のツールキットのモデルを更新するのも、すべてあなた次第です。

(1)クリエイターエコノミー

コンピュータゲームの世界を見てみましょう。

ユーザー生成コンテンツ(UGC:User-Generated Content)の収益化がゲームプラットフォームに不可欠な要素になってきています。データサイエンスの世界でも同様の収益化が起こっていると考えられます。

これは、分類、回帰、クラスタリングモデルなどの単純なモデルから始まり、すべてが再利用され、専用のプラットフォームにアップロードされます。これらのモデルは、日常のビジネスデータやプロセスを自動化したいビジネス・ユーザーのグローバルなマーケットプレイスで利用できるようになります。

その後、畳み込みモデル、GAN、オートエンコーダーなどの深層モデルが、ビジネス上の問題を解決するためにチューニングされ、適用されていきます。これらは、データサイエンティストのチームではなく、業務を遂行するアナリストの手に委ねられても大丈夫なように設計されています。

データサイエンティストが自分のスキルや経験をコンサルタント業として売ったり、githubなどにモデルをアップロードすることは、何も新しいことではありません。しかし、2022年には、これらのスキルが双方向型のマーケットプレイスを通じて収益化され、単一のモデルで世界的な市場に参入できるようになります。

AIを扱うAirbnbについて考えてみてください。

(2)環境AI

AIに関するほとんどの研究が複雑さの限界を押し広げることに集中しているのは当然ですが、現実には、複雑なモデルの学習と実行が地球環境に大きな影響を与える可能性があります。

2040年までにデータセンターが世界のCO2排出量の15%を占めると予測されており、2019年の研究論文「Energy considerations for Deep Learning」では、自然言語翻訳モデルを学習させると、その生涯を通じて自家用車4台分に相当するレベルのCO2を排出すると発表しています。明らかに、学習量が増えれば増えるほど、CO2が排出されることになります。

環境への影響への理解が深まるにつれ、組織は二酸化炭素排出量を削減する方法を模索しています。AIを使ってデータセンターをより効率的に利用できるようになった一方で、特定の問題を解決するための複雑なモデルだけでなく、単純なモデルにも関心が集まっていると予想されます。

実務的には、単純なベイジアンモデルが10層の畳み込みニューラルネットワークと同等の性能を発揮し、データ量や学習量、計算量も大幅に少なくなるのに、なぜ畳み込みニューラルネットワーク使わなければならないのでしょうか?

「モデル効率(Model efficiency)」は環境AIの代名詞となり、開発者はシンプルで効率的、かつ地球に負担をかけない使用可能なモデルの構築に注力するようになるでしょう。

(3)巨大なパラメーターを持つモデル

テスラのイーロン・マスクとAmazonのジェフ・ベゾスの宇宙技術競争とは異なり、大手ハイテク企業は独自のエキサイティングな競争をしています。

Google、Facebook、Microsoft、OpenAIなどが複雑さの限界に挑戦する中、最大規模のモデルのパラメータ数は3年間で2018年の9400万パラメータから2021年には1兆6000億パラメータという驚異的な数に増加しました。

現在、これらの何兆ものパラメータは自然言語を対象にしており、データサイエンティストは言語を詳細に理解するモデルを構築し、モデルが人間レベルの記事、レポート、翻訳を書くことを可能にしています。これらのモデルは更に、コードを書き、レシピを開発し、文脈から皮肉や皮肉を理解することもできます。

2021年以降には、膨大なデータセットがなくとも画像を認識することができる視覚を対象にしたモデルから、人間レベルの同様のパフォーマンスが期待できるようになるでしょう。例えば、幼児に板チョコレートを一度見せれば、再トレーニングをしなくても、それを見るたびにチョコレートを認識するようになるのと同等な事ができるようになるでしょう。

すでに開発者たちは、こうしたモデルを特定の機会に適用しています。その最も面白い例のひとつが、ゲーム開発会社の Dungeon.AI で、1970年代に流行した「ダンジョンズ&ドラゴンズ」をベースにしたファンタジーゲームのシリーズを開発したのです。

これらのリアルな世界は、1750億のパラメータを持つモデルGPT-3をベースにしています。これらのモデルは法律文の理解、広告キャンペーンのコピーライティング、画像や動画の特定グループへの分類など、特定の分野にモデルが適用され、クリエイターによるこのような活動がさらに増えることが予想されます。

(4)デジタルワーク従事者と拡張労働

認知に関する技術や機械学習モデルが世界中の企業で容易に採用されるようになるにつれ、頭を使わないマネージメントや、単純な仕事に人間に労働力として割り当てるという時代は、過去になりりつつあります。

その代わりに、企業は人間とロボットが並んで働くという拡張労働モデルを選択しつつあります。この技術の進歩により、仕事の規模拡大と優先順位付けが容易になり、人間は消費者を優先する業務に集中できるようになります。

拡張労働(Augmented Workforce)の実現は、クリエイターが注目すべきデータ分析トレンドの一つであることは間違いありませんが、正しくAIを導入し、自動化に伴う諸問題に対処することは、大きな課題です。

さらに言えば、2025年までに3つに1つの職業がロボットに置き換わるという調査結果があるため、従業員がこの流れに熱狂的ではないのは無理もありません。このような懸念は、ある程度は妥当なものです。

しかし、機械学習と自動化は従業員の生活を向上させ、より迅速に、不確実性なく重要な決定を下すことを可能にするだけだという根拠のある確信も存在します。潜在的な欠点があるにもかかわらず、拡張労働は、個人が品質保証や顧客ケアにより多くの時間を費やすと同時に、複雑なビジネス上の問題が発生したときにそれを解決することを可能にするのです。

多くの企業が将来のモデリングとしてRPA(Robotic Process Automation)、機械学習、認知自動化(cognitive augmentation)への移行に意欲的であることも、データアナリストを志す人が知っておくべきAIのトレンドの1つであると言えます。

3.2022年以降のAI・データ分析の10大トレンド(1/3)関連リンク

1)www.kdnuggets.com
10 Key AI & Data Analytics Trends for 2022 and Beyond

タイトルとURLをコピーしました