データサイエンティストのためのRパッケージランキング2018年版

入門/解説

1.データサイエンティストのためのRパッケージランキング2018年版まとめ

・データ操作、視覚化、機械学習のためのRライブラリンキング
・github上の活動状況などを元に集計したランキング
・他にも優れたパッケージはあるのでR Documentationなどで検索すると良いかも

2.データサイエンティストのためのRライブラリTOP20(2018)

以下、kdnuggets.comに転載されていたactivewizards.comの「Top 20 R Libraries for Data Science in 2018」の意訳です。

以前の記事で、PythonとScalaのデータサイエンスのためのトップライブラリについて議論しました。しかし、このリストはR版なしでは完全ではありません。これらのプログラミング言語はすべて、さまざまなデータサイエンスのタスクやプロジェクトで人気があり、支持者と反対者がいます。そこで、これらのプログラミング言語が互いにどのように関係しているかを比較しながら、我々の経験に基づいて、データサイエンティストとエンジニアにとって最も有用なRライブラリのいくつかを用意しました。

Rは、データサイエンス分野でよく知られ、ますます普及しているツールです。これは主に統計計算用に設計されたプログラミング言語とソフトウェア環境であり、その使い勝手と構造は科学的タスクに非常に適しています。さらに、Rは、幅広い種類の問題を解決するために数千のパッケージを数える最も発展したライブラリシステムの1つを持っています。

汎用パッケージは数多くありますが、データ操作、視覚化、競合研究、機械学習に十分な機能を提供するものに焦点を当てたいと考えています。したがって、私たちは、すべてのライブラリがオープンソースであるため、ライブラリの主な機能とGitHubの活動をカバーするデータ科学のためのTop 20 Rパッケージのインフォグラフィック(情報を視覚的に表現したもの。元サイトの綺麗な画像を見てみてください)を用意しました。

 

カテゴリ 名前 説明
データ操作 dplyr ローカルデータもリモートDBも同じ感覚で操作可
(Data Manipulation) data.table file入出力が楽
lubridate 時刻関係の操作が楽
jsonlite RでJSONを扱い際に
画像表示 ggplot2 データ可視化の一番人気
(Graphic Displays) Corrplot 行列の可視化操作
lattice 多変量データの可視化
HTML化 plotly チャートの作成
(HTML Widgets) ggvis インタラクティブな操作感
DT DataTables 行列やData dramesをテーブルに
rCharts RからJavaScript可視化ライブラリを操作
文書変換 knitr 様々な文書フォーマットの変換
(Reproducible Research) rmarkdown RでMarkdownを扱う
Slidify HTML5形式でスライドを作成
機械学習 mlr 様々な機械学習手法を取り扱い
(Machine Learning) dmlc XGBoost Gradient Boosted Decision Trees特化
caret 沢山の分類と予測アルゴリズム
gbm Generalized Boosted Regression特化
Prophet 時系列データの予測
randomForest ランダムフォレスト特化

 

ご覧いただきありがとうございました!もちろん、このライブラリのリストは完全ではありませんが、ここでは最も一般的な人気のあるツールを収集しました。特定のタスクを解決する際にはより効率的なライブラリが数多くあるので、コメントセクションであなたの考えや経験を躊躇したり共有したりしないでください。

ActiveWizardsは、データプロジェクト(大規模データ、データ科学、機械学習、データ視覚化)に専念するデータ科学者とエンジニアのチームです。大規模データ・エンジニアリング(Hadoop、Spark、Kafka、Cassandra、HBease、MongoDBなど)データ集約型Webアプリケーション開発(RESTful API、Flask、Django、Meteor)などに従事しています。

3.データサイエンティストのためのRパッケージランキング2018年版関連リンク

1)activewizards.com
Top 20 R Libraries for Data Science in 2018 [Infographic]

2)www.kdnuggets.com
Top 20 R Libraries for Data Science in 2018

3)www.rdocumentation.org/
R Documentation and manuals | R Documentation

コメント

タイトルとURLをコピーしました