データサイエンティストと機械学習エンジニアの違い

入門/解説

1.データサイエンティストと機械学習エンジニアの違いまとめ

・データサイエンティストと機械学習エンジニアの違いは明確になっていない事が多い
・データサイエンティストはデータをよりよく理解し、モデルのプロトタイプを作成する
・機械学習エンジニアはモデルを本番で使えるようにする機械学習インフラの構築と保守を担当

2.データサイエンティストと機械学習エンジニアの職務、スキル、待遇の違い

以下、www.kdnuggets.comより「The Difference Between Data Scientists and ML Engineers」の意訳です。元記事は2021年8月、Kurtis Pykesさんによる投稿で、8月度のゴールドランク記事との事で、元サイトでも人気の高かった記事です。

個人的には日本だとデータサイエンティストの方が上流工程担当なので、給与も高いイメージがありましたが、英国や米国では逆なんですね。まぁ、日本だと明確に職務が分かれていない事の方が多いですかね。

ちなみにKaggleのデータを元に「2020年の日本のデータサイエンティストの給与水準」を調べた事がありますが、日本は世界の中では高い方でありますが、上との差は大きかったです。

アイキャッチ画像のクレジットはPhoto by ThisisEngineering RAEng on Unsplash

データサイエンティスト(Data Scientists)と機械学習エンジニア(Machine Learning Engineers)の役割には、しばしば混乱があります。彼らは確かに友好的に協力し、専門知識と経験に関していくつかの重複した役割を楽しんでいますが、2つの役割はまったく異なる目的を果たします。

基本的に、私たちは「自分の仕事の背後にある科学を理解しようとするサイエンティスト」と、「他の人がアクセスできる何かを構築しようとするエンジニア」を区別しています。両者の役割は非常に重要であり、一部の企業では互換性があります。たとえば、特定の組織のデータサイエンティストは、機械学習エンジニアの作業を実行する場合があり、その逆の場合もあります。

区別を明確にするために、違いを以下の3つのカテゴリに分けます。 (1)責任 (2)専門知識 (3)期待できる給与です。

(1)責任

データサイエンティストは、データサイエンスプロセスに従います。これは、ブリッツスタイン&フィスターワークフロー(Blitzstein & Pfister workflow)とも呼ばれます。 ブリッツスタインとフィスターは当初、ハーバードCS109コースの学生にデータサイエンス問題への取り組み方を教えるためのフレームワークを作成しました。

データサイエンスプロセスは、5つの主要なフェーズで構成されています

ステージ1:ビジネス上の問題を理解
ステージ2:データを収集
ステージ3:データのクリーニングと調査
ステージ4:モデルの構築
ステージ5:洞察を視覚化し伝達する

データサイエンティストによって実行される作業の大部分は、研究環境にあります。

この環境では、データサイエンティストはデータをよりよく理解するためのタスクを実行し、データの固有のパターンを最もよく捕捉するモデルを構築しようとします。モデルを作成したら、次のステップは、モデルがプロジェクトの望ましい結果を満たしているかどうかを評価することです。そうでない場合は、モデルが目的の結果に達するまでプロセスを繰り返し、その後、機械学習エンジニアに渡します。

機械学習エンジニアは、データサイエンティストによって構築されたモデルを本番環境に展開できるようにする、機械学習インフラストラクチャの構築と保守を担当します。したがって、機械学習エンジニアは通常、研究環境でデータサイエンティストによって構築された機械学習パイプラインを再現するため開発環境で作業します。 また、他のソフトウェアシステムやクライアントがモデルにアクセスできるようにする本番環境でも作業します。

基本的に、機械学習エンジニアは、データサイエンティストによって構築されたモデルを製品展開および規模拡大できるようにする機械学習インフラストラクチャのメンテナンスを担当します。また、データサイエンティストは、機械学習エンジニアによって構築された機械学習インフラストラクチャのユーザーです。

(2)専門知識

2つの役割の違いについて人々が混乱する理由は、スキルが重複する分野がたくさんあるためです。たとえば、データサイエンティストと機械学習エンジニアの両方が、次のことについて十分な知識を持っていることが期待されます。

・教師あり学習と教師なし学習
・機械学習と予測モデリング
・数学と統計
・Python(またはR)

役割間で重複があるため、一部の組織、特に小規模な組織や新興企業は、役割を1つに統合しています。したがって、一部の組織ではデータサイエンティストが機械学習エンジニアの仕事をしており、一部の組織では機械学習エンジニアがデータサイエンティストの仕事をしています。これは実務を担当している作業者により多くの混乱をもたらします。

しかしながら、各役割に必要な専門知識の間にはいくつかの重要な違いがあります。

データサイエンティストは通常、データに関する動作を非常に上手に伝える事ができる優れたデータストーリーテラーです。この特性により、機械学習エンジニアよりもはるかに創造性が高くなると主張する人もいます。もう1つの違いは、データサイエンティストは、PowerBIやTableauなどのツールを使用して視覚化やビジネスへの洞察を共有する場合があり、必ずしも機械学習を使用する必要がないことです。

パートナーの足りない部分を補うカップルは一般的に強いです。そう考えると、コンピュータサイエンスやソフトウェア工学の基礎がしっかりしていると期待されている機械学習エンジニアにとって、前述の専門知識は弱点かもしれません。

機械学習エンジニアは、データ構造とアルゴリズムについて理解し、成果物のソフトウェアを開発するための基本的なソフトウェア群を理解している事が求められます。しかしながら、機械学習エンジニアがJava、C ++、Juliaなどの別のプログラミング言語に習熟していることは珍しいことではありません。

(3)給与の期待

正確な給与を予想する事は困難です。両方の役割の給与は、経験の量、所有する資格、拠点を置く場所、勤務するセクターなど、さまざまな要因によって異なります。

組織からはまた、さまざまな待遇が提供される事が期待できます。役割に関係なく、会社の年金制度、柔軟な在宅勤務、在宅勤務、パフォーマンスボーナス、民間医療保険への加入を受け取ることが期待できます。

・英国(UK:United Kingdom)

ジュニアデータサイエンティストは、25,000ポンドから30,000ポンドの範囲(376万円~451万円)の年収が期待できます。(経験によっては40,000ポンド(602万円)に上昇する可能性があります)[出典Prospects]

卒業生または初級レベルの機械学習エンジニアは、35,000ポンドから40,000ポンド(526万円-602万円)の初任給を期待できます。[出典Prospects]

Glassdoorによると、英国のデータサイエンティストの平均給与は46,818ポンド(704万円)です。 見込み客によると、英国の機械学習エンジニアの平均給与は52,000ポンド(782万円)です。

Prospectsによると、リードおよびチーフデータサイエンティストは60,000ポンド以上(903万円)場合によっては100,000ポンド(1505万円)を超える)の収入を得ることができます。

対照的に、経験豊富な機械学習エンジニアは、170,000ポンド(2559万円)もの収益を期待できます。(特に、GoogleやFacebookなどの多国籍企業で働いている場合)[出典Prospects]

・米国(USA:United States of America)

米国のデータサイエンティストの平均基本給は120,089ドル(1317万円)です[出典:Indeed]

対照的に、米国の機械学習エンジニアの平均基本給は150,660ドル(1652万円)です[出典:Indeed]

全体として、機械学習エンジニアは通常、平均してデータサイエンティストよりも多く支払われていると言っても過言ではありません。

最終的な結論

役割は類似していますが、データサイエンティストと機械学習エンジニアは、責任、専門知識、収入に関してまったく異なります。このトピックについて聞いたインタビューでが多くの人から、データサイエンティストから機械学習エンジニアへの移行は、機械学習エンジニアからデータサイエンティストへの移行よりもはるかに難しいと多くの人が言っています。

これは、データサイエンティストは通常、ソフトウェアエンジニアリングとコンピュータサイエンスの基礎に精通していないためです。これは険しい学習曲線です。

読んでくれてありがとう!

この記事を楽しんだら、mailchi.mpの無料の週刊ニュースレターを購読して私とつながりましょう。人工知能、データサイエンス、フリーランスについての投稿を見逃すことはありません。

3.データサイエンティストと機械学習エンジニアの違い関連リンク

1)www.kdnuggets.com
The Difference Between Data Scientists and ML Engineers

タイトルとURLをコピーしました