1.AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測テクノロジー編(2/3)まとめ
・データサイエンスチームは、必要な役割とスキルを分類するようになり細分化が進む
・AIを支援する企業は「サービスとしてのデータサイエンス」の側面を提供するようになる
・自然言語モデルの限界を解き放ったtransformerからコンピュータビジョンが恩恵を受け始める
2.実用化段階の人工知能やマシンラーニングの2020年の振り返りと2021年の予測
以下、www.kdnuggets.comより「Main 2020 Developments and Key 2021 Trends in AI, Data Science, Machine Learning Technology」の意訳です。元記事の投稿は2020年12月、Gregory Piatetskyさんによる投稿です。
アイキャッチ画像のクレジットはPhoto by Juan Ordonez on Unsplash
(3)Tom Davenport:@tdav ITおよびマネージメントに関するバブソン大学の著名な教授。デロイトアナリティクスおよびAIプラクティスのシニアアドバイザー。デジタルフェロー、デジタル経済に関するMITイニシアチブ
2020年
・昨年、機械学習モデルを継続的に管理するために現在広く知られている「MLOps」が普及すると予測しました。この概念は人気を博していますが、実際の使用率が高まったのは大規模な金融サービスやテクノロジー企業の間のみと思います。
・また、データサイエンスの用語を解説する翻訳者がチームにとって重要になると予測し、実際、多くの企業が翻訳者に頼っていますが、その役割は制度化されていません。
・「モデルが有用であるかどうかの唯一の考慮事項はモデルのデータへの適合」いう認識が高まる事を予測しましたが、それは実際には実現しなかったと思います。このメッセージを強調するベンダーは、実際にはあまり注目を集めていません。
2021年
・大規模な深層学習モデルの人気は2021年にピークに達するでしょう。この人気が継続するには必要となるデータとエネルギーの要件が高くなりすぎました。
・データサイエンスチームは、プロジェクトを成功させるために必要な役割とスキルを分類するようになります。「プロダクトマネージャー」は、確実に製品展開するための重要な役割となるでしょう。
・社外からAIを支援する企業は、トレーニングモデルのデータの提供や、MLOpsを使用したモデルの経時的な監視など、「サービスとしてのデータサイエンス」の側面を専門とするようになるでしょう。
(4)Carla Gentry:データサイエンティスト、分析ソリューション
2020年を改めて振り返ると、AI、機械学習、データサイエンスについて私が最も興味を持ったのは次のとおりです。
まだ多くの人がPythonやコーディング、ソフトウェアについて話していますが、AIが社会の「問題の解決」にどのように役立つかについての実際の例を示している人は多くはありません。AIはチャットボットになり、機械学習は巨大サイトで類似製品や推奨事項を見つけるために製品を分類を行い、文字やオブジェクトの認識をしています。
私は本当にクールな事が行われていないと言っているわけではありません。特にCovidが全ての人の心の最前線にあり、データサイエンスが使用されているだけでなく、機械学習がホットスポットを見つけたり、接触追跡を支援しており、新しい感染症の増加を抑えるのに役立っています。
データサイエンス、分析、機械学習は、新たな全てのワクチンの開発を支援するために使用され続けています。しかし、「信頼性」および「再現性」は「AstraZenecaとOxfordのCOVIDワクチンデータ」の事例で見たように「データの品質」と「データに代表的なサンプルを含める事」は依然として大きな課題です。
これまでのところ、基本的な「データ入門(data 101)」問題は依然として手ごわいものです。したがって、プロジェクトを開始するときはいつでも覚えておきましょう。データを確認し、異常を照会し、フォローアップします。何も想定しないでください。
興味深い余談ですが、感謝祭のディナーで、ソーシャルディスタンスを保った場所で、母は2人の「踊る人」のビデオを見せてくれました。私は「あら、素敵ね」と言ったのですが、母は微笑んで言いました「踊っている人がロボットである事に気づいた?」
まぁ、ダンスはただの数学ですよね。(AIが書く絵に似ていて、そこに魂はありません)2021年以降に、私達ができる事は無限にあります。
それでは、再現性、透明性、正確性などの基本を覚えて、機械学習とデータサイエンスを前進させましょう。これは、真の生命と形態を表しています。ブラックボックス型の思考の時代から抜け出さなければなりません。大学や研究室で機能したからといって、必ずしも現実世界で機能するとは限りません。
これを覚えておいてください。一般道路から高速道路に「入るための車線」と「出るための車線」を近い場所に設置し、大混乱を引き起こしている高速道路は、これが効率的であると考えたエンジニアによって設計されました。
誰にとって効率的なのでしょうか?
アルゴリズムやモデルを設計するときは、対象ユーザ、最終目標、目的や機能が何かを知ってください。そしてもちろん倫理的であるだけでなく、実用的な必要があります。
(5)Jake Flomenberg:Wing Venture Capitalのパートナー。データサイエンスのリーダーが直面している最大の問題に関する調査を最近発表したAI / MLを利用したアプリケーションに焦点を当てています。
2020年
COVID-19は、多くのモデルをテストする予期せぬイベントでした。残念ながら、ほとんどのAIは、急速に変化する状況にまだうまく適応していません。企業が適応を余儀なくされるにつれて、AIの可観測性とモデルの監視は、本番環境でモデルを扱う全ての人にとって明らかに必要になりました。
自然言語のAIは上昇傾向にあります。人間の自然言語理解を上回っています。GPT-3のような言語処理モデルは、要約やコード生成などの新しい使用方法を可能にします。 NLPを活用してテキストから価値を解き放つスタートアップ企業群は増え続けています。
ヘルスケア向けのAIは、化学、創薬用のタンパク質解析など、ようやく実現し始めています。AIに関連する生物学の全ての出版物の半分以上が、過去2年間に出版されたものです。
2021年
データサイエンティストが多くの関係者(組織内の利害関係者、規制当局、エンドユーザー)と信頼を築き、モデルをよりよく理解し、パフォーマンスの信頼限界を提供するために、モデルの説明可能性が大きなニーズとなります。不公平なバイアス、モデルの不安定性、規制要件など、様々な問題がこれを推進しています。
コンピュータビジョンを活用する事例が急増しています。自動運転車以外の実際の使用例が増え、資金投資も増えると思います。また、コンピュータビジョンが、自然言語モデルの限界を解き放ったtransformerネットワークのself-attention戦略などからコンピュータビジョンが恩恵を受け始めることを期待しています。
データのラベル付けがより自動化されます。小数ショットアプローチと転移学習の進歩により、コンピューターはついに、人間が全てのデータに手動でラベルを付ける必要性を減らすことができます。
(6)IPFConline:デジタルトランスフォーメーションコンサルティング、マルセイユ、フランス
IPFConlineチームにとって2020年は、AIとデータサイエンスの分野における3つの重要な事実によって特徴づけられました。
・自然言語処理の目覚ましい進歩であるOpenAIのGPT-3のリリース
・DLアルゴリズムがデータに貪欲すぎるという視点からディープラーニングの本当の限界の認識。これは、モデルの解釈を非常に困難にします。
・世界の多くの地域で大量監視用途に使用される顔認識アルゴリズムが禁止
2021年は2020年と非常によく似ていますが、深層強化学習と転移学習により、より公平で信頼性が高く、偏りの少ない新しいタイプのアルゴリズムへの道が開かれる可能性があります。
(7)Nikita Johnson:RE.WORK Deep Learning & AI イベントの創設者 #reworkDL #reworkAI #AIforGood
今年は困難な年でした。もしかしたら私達はソーシャルディスタンスにより離れているかもしれませんが、AIを社会的影響に適用する方法についての議論は私たちを結びつけ、パンデミックやより大きな社会的利益のためにAIをどのように活用できるかを探求することで増幅されました。
もちろん、DeepMindからのタンパク質フォールディングの飛躍的進歩に関する最近の発表は、今年のヘルスケア向けAIのもう1つの飛躍です。
2021年には、プライバシーとパーソナライズ、遠隔医療とメンタルヘルスのアプリケーションの進歩を含め、医療とデジタルヘルスにおけるAIの力がさらに進歩することを期待しています。
3.AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測テクノロジー編(2/3)関連リンク
1)www.kdnuggets.com
Main 2020 Developments and Key 2021 Trends in AI, Data Science, Machine Learning Technology