データサイエンティストは10年以内に絶滅する!?

ビッグデータ

1.データサイエンティストは10年以内に絶滅する!?まとめ

・AIの進歩につれてデータサイエンスの利用しやすさはどんどん向上している
・データサイエンスの「適用」ではなく「実行」に重点が置かれるようになった
・データサイエンスはビジネス領域の専門家が備えるスキルの一部となるかもしれない

2.データサイエンティストの将来性

以下、www.kdnuggets.comより「Data Scientists Will be Extinct in 10 Years」の意訳です。元記事は2021年6月、Mikhail Mewさんによる投稿です。

少し前まで21世紀で最もセクシーな職業だったはずのデータサイエンティストですが、もう絶滅危惧種入りとの刺激的なタイトルです。しかし元サイトでも6月に最も人気のあった記事となっていたので、アメリカでも職が無くなる系の話題は盛り上がるんだなぁと思ってピックアップしました。

元記事には結構コメントが付いていたのですが、100%の同意とは言わずとも概ね同意な好意的なコメントも多く、流石の柔軟性と感心しました。

まぁ、世の中は変わっていくので、組織も、ライフスタイルも、働き方も、職業の有り方もそれにつれて変わっていきます。令和時代から続く秘伝のSQLを現代に伝える匠の技って感じの方向性を目指すのでなければ、データサイエンティストに関わらず学び続けて変わり続けていく事が大切かもしれませんね、と言うお話と思います。

アイキャッチ画像のクレジットはPhoto by solstice hannan on Unsplash

AIの進歩が飛躍的に進歩し続けるにつれて、基礎的なレベルのデータサイエンスの利用しやすさはますます向上してきました。

データの不足やコンピューティング能力など、この分野への従来の参入障壁は、新しいデータ関連スタートアップ企業が継続的にサービスを立ち上げる事によって一掃されました。これらのサービスには1日1杯分のコーヒー代で利用可能なものもあります。

そして強力なクラウドコンピューティングにより、高価なハードウェアを所有する必要がなくなりました。

データサイエンスの前提となる三位一体要件を締めくくるのは、スキルとノウハウであり、これは間違いなくデータサイエンスで最も至る所に存在するユビキタスな側面となっています。

「Xモデルを数秒で実装する」、「わずか数行のコードでデータにZアプローチを適用する」などのキャッチフレーズを宣伝するオンラインチュートリアルを見つけるために、探し回る必要はありません。

デジタルワールドでは、即興で満足させる事が最重要課題になっています。

データサイエンスが利用しやすくなった事は悪い事ではありませんが、まばゆいばかりのソフトウェアライブラリと光り輝く新モデルの下で、データサイエンスの真の目的は曖昧になり、時には忘れられることさえあります。

なぜなら、データサイエンスのために複雑なモデルを実行したり、任意のパフォーマンス指標を最適化したりするのではなく、現在の問題を解決するためのツールとして使用されるためです。

単純ですが関連性のある例は、Irisデータセット(訳注:3種のアヤメ(Iris)の花のサイズを集めたデータセット。データサイエンスの入門者用のサンプルデータセットとして良く使われる)です。

なぜ、アヤメの「がく片(Sepal)」の長さを測定するのかは言うまでもなく、がく片が何であるかを考えずにアルゴリズムを実証するためだけにそれを利用した人はどれくらいいるでしょうか?

これらは、自分の扱えるモデルのレパートリーとして新しいモデルを追加することだけに興味があるかもしれない新進の機械学習の実践者にとっては些細なことのように思えるかもしれませんが、アヤメの花の多様性を理解するために問題となる属性をカタログ化した植物学者のEdgar Andersonにとっては些細なことではありませんでした。

これは作為的な例ですが、簡単な点を示しています。 データサイエンスにおける本流は、データサイエンスを「適用」するのではなく、データサイエンスを「実行する」ことに重点が置かれるようになりました。

ただし、この不整合はデータサイエンティストの衰退の原因ではなく、症状です。問題の原因を理解するには、一歩下がって俯瞰してみる必要があります。

データサイエンスには、実務家が専門領域を持たない数少ない研究分野の1つであるという奇妙な特質があります。

薬学部の学生は薬剤師になり、法学部の学生は弁護士になり、会計学部の学生は会計士になります。したがって、データサイエンスを学んだ学生はデータサイエンティストになる必要がありますか?しかし、何のデータサイエンティストでしょうか?

データサイエンスを幅広く適用する事は、両刃の剣であることが証明されています。利点としては、データが生成および収集できるあらゆる業界に適用できる強力なツールボックスである事です。一方、これらのツールが広く適用可能であると言う事は、利用者が事前に業界固有の知識を持っていることはめったにないことを意味します。

それにもかかわらず、データサイエンスの台頭の間、雇用主はそれが何であるか、そしてそれがどのように彼らの会社に完全に統合されるかを完全に理解せずにこの初期の技術を利用するために急いでいたので、問題は重要ではありませんでした。

しかし、データサイエンスが注目を集めてからほぼ10年後、ビジネスと運営環境の両方が進化しました。雇用主らは現在、確立された業界標準によってベンチマークされた大規模な定着したチームでデータサイエンスの成熟を目指しています。差し迫った採用需要は、ビジネス、それぞれの業界、およびその利害関係者を理解して問題解決が出来る人やクリティカルシンキングが出来る人にシフトしています。

いくつかのソフトウェアパッケージを扱えたり、数行のコードをかけたりする能力だけではもはや十分ではなく、データサイエンスの専門家はコードをかけるか否かで定義されることもありません。これは、ノーコード製品、DataRobot、RapidMiner、Alteryxなどの自動機械学習ソリューションの人気が高まっていることからも明らかです。

これは何を意味するのでしょうか?

データサイエンティストは(多少は前後するかもしれませんが)10年以内に絶滅するか、少なくとも役職は消滅します。今後、データサイエンスと総称されるスキルセットは、コーディングできるかどうかに関係なく、深い業務知識を分析に吹き込むことができる新世代のデータに精通したビジネススペシャリストと対象分野の専門家によって支えられます。

彼らの肩書きは、コンプライアンススペシャリスト、プロダクトマネージャー、投資アナリストなど、それを実証する「手段」ではなく、「専門知識」を反映するものになります。

歴史的な前例を見つけるために遠くまで振り返る必要はありません。Excelのような表計算ソフトが登場した際、データ入力のスペシャリストには非常な求人ニーズがありましたが、Cole Nussbaumer Knaflic(「Story telling With Data」の著者)が適切に観察しているように、現在はMicrosoft Officeに習熟している事は求人時の最低条件です。

それ以前は、タイプライターでタイプできる能力は専門的なスキルと見なされていましたが、パーソナルコンピューティングが広く利用可能になった事で、タイピングは当然と想定されるようになりました。

最後に、データサイエンティストとしてのキャリアを検討している人や研究を始めている人にとっては、間違いなく出くわすベン図を常に参照する事をお勧めします。データサイエンスは、統計、プログラミング、専門領域の知識の合流点として説明されます。それぞれが交差領域の等しいシェアを占めているにもかかわらず、一部は他よりも高い重み付けを正当化する場合があります。

免責事項:本視点は、私の観察と経験に基づいた、私自身のものです。あなたは同意しなくても大丈夫です。生産的な議論を歓迎します。

略歴:Mikhail Mewは、研究者、投資家、データサイエンティストであり、好奇心旺盛なオブザーバーであり、投資と機械学習の合流点からの考えと洞察を提供しています。

記事へのコメントの抜粋

記事ありがとうございます。

自動化への恐れは常に聡明な人の心を押しつぶしてきました。自動分析ツールは、固定電話と同じくらい役に立ちませんが、それでもある程度の説得力は持っています。

自動化はデータサイエンスを根絶するのでしょうか?答えは絶対にNoです。

これらの自動化ツールは非常に無能であり、一般化することはできません。作業モデルの構築、展開、および利害関係者から要求された何百もの変更は、おそらく自動化対象作業ではありません。

データサイエンスのアルゴリズムをデータに盲目的に適用することは、ハンドルなしで車を運転するようなものです。データサイエンスには、専門領域の知識よりも普遍的なデータサイエンス領域の知識に新しい発展が毎日あります。

銀行、製薬などのいくつかの分野では、専門領域に関するより深い知識が必要です。ただし、すべての問題はf(x) = yです。10年後には、データサイエンティストがいなくなる可能性があり、スーパーデータサイエンティストがゲームに参加すると結論付けることができます。

ニュートンが世界に微積分を与えたように私たちに方向性を与えることができるデータサイエンス界のアイザックニュートンの登場をまだ待っています。そう、それは長い待ち時間であり、おそらく無限の評価プロセスになるでしょう。ありがとう、よろしくkanchan

素晴らしい記事です。モデリングやAIプロジェクトの場合、ビジネス知識とモデリング知識の両方を持っていることが非常に重要です。これにより、プロジェクトメンバーが、プロジェクトが解決することになっている問題/課題、可能性、およびモデルの結果を評価する方法を確実に理解できます。

この知識は、すべてのビジネスとモデリングの知識を持っている1人のプロジェクトに集められるかもしれません。または、この知識が確保されている複数の人で構成されるプロジェクトとなるかもしれません。ビジネス側の関係者がモデルの知識を持ち、モデラーがビジネスの知識、少なくとも会社が事業を行っている分野と業界の一般的な特性についての知識を持っていると便利です。

モデリングは、「Xモデルを数秒で実装する」という約束から、自分で計算しなくても統計モデルを作成できる優れたツールに至るまで、すでに多くの方法で民主化されています。モデルを作成すると常に結果が生じるため、自分が何をしているのかを知る必要があります。

ビジネスの知識がなければ、プロジェクトは自己達成的予言の間違った、またはそれほど重要ではない課題と落とし穴に焦点を合わせる可能性があります。しかし、会社自体にも落とし穴があります。データが完全に信頼できるものなのか?何を、どのように、どこで、いつ、なぜ収集したのかということです。

本当に素晴らしい記事。私はほとんどに同意しますが、いくつかの点で議論したいと思います。

(1)私は自動化の大ファンです。ただし、ガイドレールとセーフガードのない自動化(そして、特にプロジェクトの最後に統計学者に意見を聞く事)は、特にプロジェクトの定義とデータの準備段階において、経験の浅い人を非常に危険にさらす可能性があります。実際、この点については、あなたと合意していると思います。:^}

(2)私はまた、データサイエンティストの役割を変えなければならないことに完全に乗り気になっています。彼らはより良い研究者に、問題解決者に、コンサルタントになる必要があります。本質的に、彼らはソフトで社会的な側面を磨き高度な分析に繋げる必要があります。もちろん、大多数のデータサイエンティストは非常に抵抗します。

これが、最終的には、価値がある実用的なデータサイエンティストと、単に上辺の革新に従事するサイエンティストを区別するものになります。しかし、私は彼らにもジェネラリストであり続けてほしいと思っています。

私はSAPの資格勉強をしており、キャリアチェンジするため先月DSコースに参加することにし、すべての料金を支払い済みです。だから私はこれを読んだ後今少し怖いです:(

モデレーターによるフォローのコメント
これは意図的に挑発的な記事です。 データサイエンティストは10年以内に絶滅することはありません。統計学者を見てください。 彼らは100年前から存在しています。 しかし、データサイエンティストが10年以内に行うことは、ほとんどのハイテク分野の専門家と同様に、確かに変わります。 だからあなたは新しいスキルを学び続ける必要があります!

3.データサイエンティストは10年以内に絶滅する!?関連リンク

1)www.kdnuggets.com
Data Scientists Will be Extinct in 10 Years

タイトルとURLをコピーしました