何故、データサイエンティストはゼネラリストを目指すべきではないのか?(2/2)

何故、データサイエンティストはゼネラリストを目指すべきではないのか?(2/2)

1.何故、データサイエンティストはゼネラリストを目指すべきではないのか?(2/2)まとめ

・データサイエンス業界はエンジニア的側面とアナリスト的側面とリサーチャー的側面がある
・担当業務範囲が狭い段階では区別が曖昧だが段々と業務内容が拡大するにつれて細分化する
・広く浅く学習するのではなく何か一分野で自分の強みを発揮できるようにする事が活躍の近道

2.データサイエンス業界の職種

以下、www.kdnuggets.comより「Why You Shouldn’t be a Data Science Generalist」の意訳です。元記事は2018年12月、Jeremie Harrisさんによる投稿です。

3. Data Scientist
職務内容:あなたの仕事はデータセットをきれいにして調査し、ビジネス価値をもたらす予測をすることです。 あなたの日々の作業には、モデルのトレーニングと最適化、そしてそれらを製品に展開することが含まれます。

それが重要な理由:人間にとっては解析するには大きすぎ、価値があるので完全に無視する事もできない大量のデータがある場合は、そこから利用可能な見識を引き出すための何らかの方法が必要で、それがデータサイエンティストの基本的な仕事です。データセットを利用可能な結論に変換することです。

必要条件:あなたが使う事になるテクノロジーはPython、scikit-learn、Pandas、SQL、そしておそらくFlask、Sparkそして/またはTensorFlow / PyTorchを含みます。一部のデータサイエンスポジションは純粋に技術的なものですが、大多数はあなたが何らかのビジネスセンスを持っていることを要求します。それでなければ、あなたは誰も解決できない問題を解決する事はできないでしょう。

あなたが扱うべき質問は、次のようなものです。
(1)私たちの顧客は実際どの程度まで細分化できますか?
(2)どの製品をどのユーザーに販売するのかを予測するためのモデルを構築できますか?

4. Machine Learning Engineer
職務内容:あなたの仕事は、機械学習モデルを構築し、最適化し、そして本番に展開することです。一般的に、機械学習モデルはAPIまたはコンポーネントとして扱われます。これらはフルスタックアプリケーションまたは何らかのハードウェアからプラグインとして使用されますが、自分でモデルを設計するように求められることもあります。

要件:Python、Javascript、scikit-learn、TensorFlow / PyTorch(および/または大企業向けディープラーニングフレームワーク)、およびSQLまたはMongoDB(通常はアプリケーションDBに使用されます)を扱うテクノロジなどがあります。

あなたが扱うべき質問は、次のようなものです。

(1)このKerasモデルをJavascriptアプリケーションに統合するにはどうすればよいですか?
(2)どうすれば私たちの推薦システムの予測時間と予測コストを減らすことができますか?

5. Machine learning researcher
職務内容:あなたの仕事は、データサイエンスとディープラーニングにおける困難な問題を解決するための新しい方法を見つけることです。すぐに使えるソリューションを使用して作業する事が出来ないので、独自のものを作成することになります。

必要条件:Python、TensorFlow / PyTorch(または大企業向けディープラーニングフレームワーク、あるいはその両方)、そしてSQLなどの技術を使用します。

あなたが扱うべき質問は、次のようなものです。
(1)モデルの精度を最新のものに近づける方法を教えてください」
(2)カスタムオプティマイザーはトレーニング時間を短縮するのに役立ちますか?

ここで説明した5つの職務の説明は、すべての場合において単独では成り立ちません。 たとえば、初期段階では、データサイエンティストはデータエンジニアやデータアナリストである必要があります。しかし、ほとんどの職務はもっと綺麗に分類されるでしょう – そして会社が大きくなればなるほど、もっとこれらの分類が当てはまるようになるでしょう。

全体として、覚えておくべきことは、雇用されるためには、より集中的なスキルセットを構築することをお勧めします。データアナリストになりたい場合はTensorFlowを学ばないでください。機械学習研究者になりたい場合はPysparkの学習を優先しないでください。

代わりに、企業組織のために役立つ価値にどのように種類があるか考えて、その価値を実現することに集中してください。それは、何よりも、業界に入り込むための最善の方法です。

3.何故、データサイエンティストはゼネラリストを目指すべきではないのか?(2/2)関連リンク

1)www.kdnuggets.com
Why You Shouldn’t be a Data Science Generalist