1.データサイエンティストのためのRパッケージランキング2018年版まとめ
・データ操作、視覚化、機械学習のためのRライブラリンキング
・github上の活動状況などを元に集計したランキング
・他にも優れたパッケージはあるのでR Documentationなどで検索すると良いかも
2.データサイエンティストのためのRライブラリTOP20(2018)
以下、kdnuggets.comに転載されていたactivewizards.comの「Top 20 R Libraries for Data Science in 2018」の意訳です。
以前の記事で、PythonとScalaのデータサイエンスのためのトップライブラリについて議論しました。しかし、このリストはR版なしでは完全ではありません。これらのプログラミング言語はすべて、さまざまなデータサイエンスのタスクやプロジェクトで人気があり、支持者と反対者がいます。そこで、これらのプログラミング言語が互いにどのように関係しているかを比較しながら、我々の経験に基づいて、データサイエンティストとエンジニアにとって最も有用なRライブラリのいくつかを用意しました。
Rは、データサイエンス分野でよく知られ、ますます普及しているツールです。これは主に統計計算用に設計されたプログラミング言語とソフトウェア環境であり、その使い勝手と構造は科学的タスクに非常に適しています。さらに、Rは、幅広い種類の問題を解決するために数千のパッケージを数える最も発展したライブラリシステムの1つを持っています。
汎用パッケージは数多くありますが、データ操作、視覚化、競合研究、機械学習に十分な機能を提供するものに焦点を当てたいと考えています。したがって、私たちは、すべてのライブラリがオープンソースであるため、ライブラリの主な機能とGitHubの活動をカバーするデータ科学のためのTop 20 Rパッケージのインフォグラフィック(情報を視覚的に表現したもの。元サイトの綺麗な画像を見てみてください)を用意しました。
カテゴリ | 名前 | 説明 |
データ操作 | dplyr | ローカルデータもリモートDBも同じ感覚で操作可 |
(Data Manipulation) | data.table | file入出力が楽 |
lubridate | 時刻関係の操作が楽 | |
jsonlite | RでJSONを扱い際に | |
画像表示 | ggplot2 | データ可視化の一番人気 |
(Graphic Displays) | Corrplot | 行列の可視化操作 |
lattice | 多変量データの可視化 | |
HTML化 | plotly | チャートの作成 |
(HTML Widgets) | ggvis | インタラクティブな操作感 |
DT DataTables | 行列やData dramesをテーブルに | |
rCharts | RからJavaScript可視化ライブラリを操作 | |
文書変換 | knitr | 様々な文書フォーマットの変換 |
(Reproducible Research) | rmarkdown | RでMarkdownを扱う |
Slidify | HTML5形式でスライドを作成 | |
機械学習 | mlr | 様々な機械学習手法を取り扱い |
(Machine Learning) | dmlc XGBoost | Gradient Boosted Decision Trees特化 |
caret | 沢山の分類と予測アルゴリズム | |
gbm | Generalized Boosted Regression特化 | |
Prophet | 時系列データの予測 | |
randomForest | ランダムフォレスト特化 |
ご覧いただきありがとうございました!もちろん、このライブラリのリストは完全ではありませんが、ここでは最も一般的な人気のあるツールを収集しました。特定のタスクを解決する際にはより効率的なライブラリが数多くあるので、コメントセクションであなたの考えや経験を躊躇したり共有したりしないでください。
ActiveWizardsは、データプロジェクト(大規模データ、データ科学、機械学習、データ視覚化)に専念するデータ科学者とエンジニアのチームです。大規模データ・エンジニアリング(Hadoop、Spark、Kafka、Cassandra、HBease、MongoDBなど)データ集約型Webアプリケーション開発(RESTful API、Flask、Django、Meteor)などに従事しています。
3.データサイエンティストのためのRパッケージランキング2018年版関連リンク
1)activewizards.com
Top 20 R Libraries for Data Science in 2018 [Infographic]
2)www.kdnuggets.com
Top 20 R Libraries for Data Science in 2018
3)www.rdocumentation.org/
R Documentation and manuals | R Documentation
コメント