1.アメリカのデータサイエンス求人レポート2019(2/2)まとめ
・2年前と比べて250%以上の求人数の伸びを示したのはTensorflow、Apache Flink、Alteryx
・次に伸びているのはH2O、Caffe、Python、Tableauなどが100%前後の伸び率
・第3グループとして伸びているのはJulia、Apache Spark、Scala、Rが50%前後の伸び率
2.アメリカのデータサイエンス求人市場で需要が増えているソフトウェアスキル
以下、www.kdnuggets.comより「Data Science Jobs Report 2019: Python Way Up, TensorFlow Growing Rapidly, R Use Double SAS」の意訳です。元記事は2019年6月、Robert A. Muenchenさんによる投稿です。
それほど人気のないソフトウェアを比較するために、図1bにそれらを別でグラフ化しました。
MathematicaとJuliaがこのソフトウェア群のリーダーであり、それぞれ約219の仕事があります。 古代のFORTRAN言語はまだ195人の求人を抱えています。オープンソースのWEKAソフトウェアとIBMのWatsonが次に登場し、それぞれ約185ジョブになります。 XGBOOST以降はかなり緩やかに減少していきます。
ワークフローインターフェースを使用するツールがいくつかあります。EnterpriseMiner、KNIME、RapidMiner、およびSPSS Modelerです。
彼らは、50人から100人の間の求人数で、同ランキング帯にいます。他の人気の尺度の多くでは、RapidMinerは非常によく似たKNIMEツールに勝っていますが、このランキングでは後者の方が50%以上の多くの求人があります。
Alteryxもワークフローベースのツールですが、集団を引き離し、901の求人数で前項の図1a内にランキングされています。

図1b:データサイエンス求人要件に掛かれたそれほど人気のないソフトウェアツール群。求人広告件数が250未満であったソフトウェアのみです。
図1bでは、求人数が0件に見えるソフトウェアは実際にゼロです。Systat以下のどのソフトウェアも求人数は10以下です。
図1aと図1bに示されている値は単一の時点であることに注意することが重要です。人気があるソフトウェアの求人件数は日々の増減はそれほどありません。
したがって、図1aに示されているソフトウェアの相対的なランキングは、今後1、2年の間に大きく変わることはほとんどないでしょう。
図1bに示されているあまり人気のないソフトウェアパッケージでは、ジョブ数が非常に少ないため、月ごとにランクが変わる可能性はあります。しかし、相対的なランクは安定しているはずです。
次に、2017年のデータから現在(2019年)までの雇用の変化を見てみましょう。図1cは、2017年に少なくとも100件以上の求人を掲載したパッケージの変化率を示しています。
100件以上の制限がなければ、2017年に求人数が1件で2019年に5件になったソフトウェアは500%の増加率となりますが、絶対数が少ないため注目され始めたと言えるわけではないため対象外としています。雇用市場が過熱または成長しているソフトウェアは赤グラフで表示され、減っているソフトウェアは青グラフで表示されています。

図1c:2017年から2019年までの求人リストの変化率。2017年に少なくとも100以上の求人があったソフトウェアのみを表示しています。
GoogleのディープラーニングフレームワークであるTensorflowは、523%と最も成長が著しいです。次はApache Flinkです。これはストリーミングデータを分析するツールで、289%です。H2O.aiが150%成長しています。Caffeはもう1つのディープラーニングフレームワークであり、その123%の成長は人工知能アルゴリズムの人気を反映しています。
Pythonは97%しか成長していませんが、その人気は既に非常に高いため、追加された13,471の求人は他の多くのソフトウェアの総求人数を凌駕しています。
Tableauは同様の成長率を示していますが、4,784とPythonと比較すれば小数の追加求人でした。Juliaは、求人の伸び率が鈍化しているようです。私は、SASとSPSSの求人が、それぞれ6%と1%に留まってはいますが、まだ増え続けていることに驚きました。
3.アメリカのデータサイエンス求人レポート2019(2/2)関連リンク
1)www.kdnuggets.com
Data Science Jobs Report 2019: Python Way Up, TensorFlow Growing Rapidly, R Use Double SAS
2)r4stats.com
How to Search for Data Science Jobs



著者のRobert A. Muenchenは、35年の経験を持つASA(Accredited Professional Statistician TM)で、現在はテネシー大学のOIT Research Computing Support(以前のStatistical Consulting Center)のマネージャです。「R for SAS and SPSS Users 」、およびJoseph M. Hilbeとともに「R for Stata Users」の著者でもあるBobは、データサイエンスソフトウェアの動向を分析したり、人々がR言語を学ぶのを助ける人気Webサイトr4stats.comのオーナーでもあります。