1.アメリカのデータサイエンス求人レポート2019(1/2)まとめ
・アメリカのデータサイエンス求人でスキル要件として上げられる事の多いソフトウェアのランキング
・求人情報件数で比較するとRの求人はPythonの求人の約半数となっている
・またRと良く比較される事の多いSASの求人件数はRの6割程度となっている
2.アメリカのデータサイエンス求人市場でニーズが高いソフトウェアスキル
以下、www.kdnuggets.comより「Data Science Jobs Report 2019: Python Way Up, TensorFlow Growing Rapidly, R Use Double SAS」の意訳です。元記事は2019年6月、Robert A. Muenchenさんによる投稿です。
データサイエンスの仕事は2019年も増え続けており、このレポートは最近のソフトウェア別の求人数の変化と広がりを共有します。データサイエンス関連ソフトウェアの人気の変遷を追跡する私の継続的な研究の一環として、転職市場に関する私の分析を更新しました。全文を読まないでも良いようにするため、以下に再掲します。
求人広告
データサイエンス用ソフトウェアの人気または市場シェアを測定するための最良の方法の1つは、特定のソフトウェアの知識と経験を求める求人広告の数を数えることです。
求人広告は情報が豊富でお金で裏付けされているので、おそらくそれらは各ソフトウェアが現在どのくらい人気があるかの最良の尺度です。 雇用需要の変化のプロットから、将来的に人気が高まる可能性があるかどうかがわかります。
Indeed.comは米国で最大の求人サイトで、求人広告が最も充実しています。共同創設者で元CEOのPaul Forsterが述べたように、Indeed.comには「主要な求人掲示板を含む1,000を超える独自の情報源からの全求人が含まれます。 – Monster、CareBuilder、HotJobs、Craigslist – 何百もの新聞、協会、そして会社のウェブサイトからの求人情報です。
Indeed.comには優れた検索機能もあります。以前は求人トレンドをグラフ化する機能もありましたが、現在は制限されています。Indeed.comを使用して求人を検索するのは簡単ですが、ソフトウェアの人気を公正な比較になるように検索する事は困難です。
いくつかのソフトウェアはデータサイエンス(例えばSPSS、Apache Spark)のためだけに使用され、他のものはデータサイエンスの仕事以外でも、より広いレポート作成業務(例えばSAS、Tableau)に使用されます。
汎用言語(例えば、Python、C、Java)はデータサイエンスの仕事に多用されていますが、それらを使用する仕事の大多数はデータサイエンスとは無関係です。
活躍の場を平準化するために、私はデータサイエンティストの求人情報だけから各ソフトウェアの需要を検索する手法を開発しました。この手法の詳細は、別の記事「How to Search for Data Science Jobs」で説明しています。このセクションの全てのグラフは、この手順を使用して必要な検索を実行しています。
2019年5月27日と2017年2月24日に、この投稿で使っている求人情報を収集しました。
1日分のデータだけではそれほど安定していないと思うかもしれませんが、多数のジョブソースがあるため、Indeed.comの求人コレクションの数には一貫性があります。同じ手法を使用して2017年と2014年に収集されたデータでは、r = .94、p = .002で相関していました。
以下の図1aは、Pythonが27,374の求人件数でTOPをリードしており、続いてSQLが25,877で続いていることを示しています。 JavaとAmazonのMachine Learning(ML)ツールはおよそ25%下回っており、17,000の求人があります。
RとCの亜種が約13,000で続きます。 RとPythonをよく比較する人がいますが、データサイエンスの求人件数で考えた場合、RはPythonの半数しかありません。
もちろん、RとPythonは同じ種類の仕事で使われているわけではありません。 私はまだ統計学者がRを好み、機械学習分野の人々がPythonを好むのを目にしていますが、Pythonは間違いなく勢いがあります。
Hadoopから順に、仕事はゆっくりと減少しています。Rはまた、SASと比較されることがよくありますが、SASはRが13,800であるのに対して8,123しかありません。
図1aの横軸は非常に長いため、一番下のH20はゼロに見えてしまっていますが、実際には257のジョブが登録されています。
図1a
データサイエンスの求人で人気の高いソフトウェアの上位群
訳注:データサイエンスなのにJavaが3位な事に少し違和感を感じたので、USA版のindeed.comを少し見てみたのですが、
例1
Preferences:
Experience with object-oriented languages such as C#, C++, or Java
例2
Requirements:
Excellent scripting and programming skills such as R and Python. Familiarity with Scala, Java or C++ is an asset
例3
SPECIAL REQUIREMENTS:
Hands-on experience in one scripting language (ex. Python, Ruby, Java) ← scripting !?
例4
Basic Qualifications:
Excellent knowledge of at least twocoding languages, e.g. Python, Java, Scala, R Language, SQL, ETL Tools, Perl and Pig;
などなど、Javaが指定されているわけではなく「プログラミングが出来る事」という条件の中で具体的な言語の一つとしてJavaがリストに挙げられている事が多いようです。また、今回は求人と言う事でビジネス界でのランキングなので、アカデミックな界隈では事情が異なるかもしれません。
3.アメリカのデータサイエンス求人レポート2019(1/2)関連リンク
1)www.kdnuggets.com
Data Science Jobs Report 2019: Python Way Up, TensorFlow Growing Rapidly, R Use Double SAS
2)r4stats.com
How to Search for Data Science Jobs
コメント