AI、データサイエンス、分析関連の2018年における主な発展と2019年の主な動向(1/2)

１．AI、データサイエンス、分析関連の2018年における主な発展と2019年の主な動向(1/2)まとめ

・専門家による2018年のデータサイエンスとアナリティクスのまとめ
・データがより一般的に広く使われるようになった事
・先進企業はデータから得られた知見の展開率と速度に注目

２．AI、データサイエンス、分析関連の2018年の動向と2019年の展望

以下、www.kdnuggets.comより「AI, Data Science, Analytics Main Developments in 2018 and Key Trends for 2019」の意訳です。元記事投稿は2018年12月、Gregory Piatetskyさんによる投稿で「2018年の機械学習とAIの主な進歩と2019年の主な傾向」に比べるとデータサイエンスよりの内容です。後半はこちら。

過去の記事と同様に専門家による2019年のデータサイエンテス業界の予測と分析のまとめを提供します。私達は以下の質問をしました。「2018年のデータサイエンスとアナリティクスの主な発展は何ですか？また、2019年にはどのような主な傾向が予想されますか？」

以下は、Meta Brown, Tom Davenport, Carla Gentry, Bob E Hayes, Cassie Kozyrkov, Doug Laney, Gregory Piatetsky, Bill Schmarzo, Kate Strachnyi, Ronald van Loon, Favio Vazquez, Jen Underwoodからの回答です。

１）Meta Brown(@metabrown312)は、「Data Mining for Dummiesの著者」、A4A Brown、Inc.のプレジデント、経営者と技術者の間の効果的なコミュニケーションの醸成をしています。

2018年の注目すべき分析トピックは人工知能です。人工知能は近年の他のどの分析アプリケーションよりも多くの話題を提供したかもしれません。残念ながら、その多くは意味がありません。

コンピューターの黎明期に活躍したパイオニア、アラン・チューリングは、人間の知能に匹敵する機能を備えたコンピューターを構想しました。人間が会話しても相手が人工知能なのか人間なのか判断ができないようなレベルの人工知能です。

今日の人工知能アプリケーションついて考えてみましょう。SiriやAlexaのようなパーソナルアシスタントは役に立つかもしれませんが、同じように人間と対話することと区別がつかないことはほとんどありません。オンラインヘルプアプリケーションで動いているチャットボットはとても残念な出来です。現実世界の問題について質問すると、すぐにその背後に本当の頭脳がないことがわかります。

チューリングの定義では、人工知能はまだ存在しません。ニューヨーク大学の心理学と神経科学の教授であるGary Marcusは、人工知能についての最大の誤解は「人々はもうすぐ本当の人工知能が発明できると思うこと」であると言います。

コンピュータが自律的に動作する事で実現されている実用的なアプリケーションは存在します。コンピューターは人々のように考えるのではありませんが、彼らは速くて首尾一貫しています、そしてそれらは価値ある特徴です。これらのアプリケーションは、詐欺の可能性が高い取引を警告する事や自動車を運転することのように実用的な作業を機械が実行することを可能にします。

現在の人工知能技術に明らかな限界があるにもかかわらず、一般大衆、さらにはハイテクコミュニティーでさえも、人工知能についての非現実的な主張と期待にあふれています。誇張は多くの人の間で恐れを引き起こしています。そしてまた、人工知能に幻滅する人達も現れていますが、いずれより多くの失望をもたらすでしょう。

２）Tom Davenport(@tdav)は、Babson Collegeの情報技術および管理の特別教授、the International Institute for Analytics.の共同創設者。デジタル経済に関するMITイニシアチブのフェロー。Deloitte Analyticsのシニアアドバイザー。

国際的な分析に関する年間トレンド
様々な組織はモデルの展開率にますます注意を払うようになっていますRexer Data Science Surveyによると、分析結果や作成したモデルを「ほぼ常に」展開しているのはわずか10-15％で、「頻繁に」展開しているのは50％だけです。「時折またはまれに」しか分析モデルの展開に成功していない企業は35-40％も存在します。私は展開成功率が10％未満であると言ういくつかの組織にも遭遇しました。もちろん、展開されていない分析モデルに経済的価値はありません。企業は2019年に彼らの展開率を測定し改善する必要があるでしょう。

市民データサイエンスティストとビジネスアナリスト
データサイエンスの分野では、グラフィックベースの分析と検索ベースの分析、さらに自動化された機械学習の登場により、アマチュアによる分析作業が増えることが予想されます。

トレンドに立ち向かうことは敗北に繋がる戦いなので、代わりにそれを有効にしてその周りにガードレールを置くことに集中してください。また、定量的な専門家は、非常に複雑で困難なモデリング作業、またはビジネス上の問題の理解と組織の変化への対応のいずれかに取り組む必要があります。

訳注：専門家のデータサイエンスティストに対して、データ分析に興味を持った専門家ではない人、の意味で市民データサイエンスティスト(Citizen data scientists)と言う単語を使っているようです。あまり良い感じの単語の使われ方ではないですが、確かにパーソナルコンピューターしか触った事のない人がリソースが全員で共有されるデータ分析基盤にアクセスする際は、ガードレールを設置しておかないと初めて銭湯に行った子供的な行動を起こしてしまう事はあるなと少し共感してしまいました。展開率についても同意

３）Carla Gentry(@data_nerd)は、コンサルティングデータサイエンティストで、Analytical-Solutionのオーナーです。

2018年は、分析とデータサイエンスにとってすばらしい年でした。AI、ニューラルネット、機械学習の爆発的な増加も見られましたが、経験や才能に裏付けられた例もあれば裏付けのない例もあり、玉石混交でした。私たちは、医療分野や治安活動でのAIの使用と増加を見ましたが、こちらもバイアスを含まない例から含む例もあり玉石混交でした。

データがその人の人生や生活を丸裸にしてしまうと言うことを忘れてしまっている人もいると思います。ウェアラブルデバイス(スマートウォッチなど)やIoT(スマートスピーカーなど)の場合は特にそうであり、その傾向は続くでしょう。

2019年も流行語は増えるでしょうが、企業はニューラルネットが学習に何千、何百万ものサンプルを必要とする事に気付き始めるでしょう。さらに悪いことに、ニューラルネットに新しいタイプのアイテムを認識させるたびに、一から始めなければいけません。(控えめに言っても時間がかかります)

人材はもう一つの問題です。あなたがGeoffrey HintonやYejin Choi、Yann LeCunでなければ、あなたはニューラルネットの真のエキスパートではありません。世の中に雇用できる豊富な人材が溢れている事を期待しないでください。

データサイエンスはデータに関する洞察を行う職業であり、場合によってはAI、機械学習、またはニューラルネットの専門家になる事を期待するのは正しくないのです。故に違いをもっと注意深く認識し、キャリアの浅い人はこの新しい未来の技術で競争するためにスキルを学びなおさなければならないでしょう。

私が恐れている事は人工知能に関する真の理解の欠如、つまり機械がどのように学び、人工知能を人間に害を及ぼさないように使うためにどうすれば良いかを認識しないままだと、幾つかの会社/アルゴリズム/組織は危険にさらされ続けるであろうということです。

全てのテクノロジーを元気に開発していきましょう、しかし、誤った使い方をすると祟りを受ける事も理解しましょう！

４）Bob E. Hayes(@bobehayes)は、研究者、作家、コンサルタントです。Business over Broadwayのパブリッシャーであり、産業組織心理学の博士号を取得しています。

データサイエンスとアナリティクスの分野では、強化学習、チャットボット、そしてそれが社会に与える影響など、機械学習のあらゆる事に関心を集めています。

2019年には、プライバシーとセキュリティの問題を含む、AIの倫理への注目が高まると思います。アルゴリズムが特定の決定をどのように行っているのか理解しようとする試みにますます重点が置かれるでしょう。

私たちは、機械学習が決定を下すのに役立つということだけでなく、それがどのように機能するのかを知る必要があります。(どのようにしてその結論に達したのか)。また、米国企業は、消費者の個人情報をどのように活用できるかに注力するでしょう。

カリフォルニア州はカリフォルニア州消費者個人情報保護法(2020年1月に施行)を採択しましたが、他の州も後に続く事を予測(期待)しています。

私は偽ニュースの作成と普及にAI/機械学習が使用されるｹｰｽが増加する事を恐れています。Deep fakeは、人々が言っていないことを言ったり、やっていない事をやったかのように示すビデオコンテンツの製作が如何に容易かを示しました。Max Tegmarkが言うように、AIが悪用される可能性を認識することは、心配症であると言う事ではありません。単に「安全工学」です。

ブートキャンプ、MOOC、大学など、データ専門家になるためにデータサイエンスを学ぶには多くの方法がありますが、非データ専門家(たとえば、管理職や現場の従業員)を教育する試みの成長が見込まれます。

５）Cassie Kozyrkov(@quaesita)は、Google Cloudのチーフディシジョンエンジニア、統計、AI、データ、パンク、アート、SF、演劇、意思決定科学が大好きです。

2018年の主な開発の1つは、データサイエンスの民主化です。

クラウドテクノロジーは、最初にデータセンターを建設する必要なしにリソース集約型のビッグデータおよびAIアプリケーションを一気に提供することを可能にしました。Kubeflowのようなツールは、インフラストラクチャの専門知識がなくてもスケーラブルなデータサイエンスを人々に提供しました。ツールがデータサイエンスを誰もが利用しやすいようにするこの傾向は、2019年にはさらに加速するでしょう。

６）Doug Laney(@Doug_Laney)は、Gartnerのヴァイスプレジデント、著名アナリスト、Gartnerのチーフデータオフィサーリサーチ、及び「Infonomics」の著者。

Gartnerの2019年のデータと分析戦略の予測が発表されたばかりです。その中には、情報が重要な企業資産であり、分析が不可欠なコンピテンシーであることを明示的に言及している企業戦略の増加が見られることが含まれています。これらは、企業のITに関する戦略ではなく、企業全体の戦略と計画です。

また、特に分析ニーズがより複雑になるにつれて、データリテラシーに関する教育はビジネスマンがデータ＆アナリティクスの専門家と会話する事を助けるので、より一般的になる事が予想されます。

インフォノミクスの原則と慣行がますます採用されるようになるにつれて、組織の情報資産を正式に評価するCDO(最高データ責任者)はより頻繁にCFOと連携を取るようになるでしょう。それは重要情報の管理とビジネス上の利益を多くのクライアントにもたらすでしょう。しかし、分析およびデジタルデータに関する倫理は引き続き問題となり、組織はデータサイエンスチームが遵守すべきプロの行動規範を導入し始める事になるでしょう。

また、今後3～5年の間に、ほとんどの新しいビジネスシステムにリアルタイムで文脈データを処理するインテリジェンスな仕組みが益々取り入れられるようになることが予想されます。量子コンピューティングの概念実証プロジェクトは、既存の分析手法を劇的に上回るでしょう。AIや機械学習によおって拡張され自動化されたインサイトは、レポート作成業務の大部分を置き換えるでしょう。位置解析システムの利用は現在のは10倍近く増加するでしょう。また機械学習は、データサイエンティストの採用難を緩和するでしょう。

３．AI、データサイエンス、分析関連の2018年における主な発展と2019年の主な動向(1/2)まとめ

１）www.kdnuggets.com
AI, Data Science, Analytics Main Developments in 2018 and Key Trends for 2019