ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版

入門/解説

1.ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版まとめ

・ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ30選
・一般的なデータサイエンス用ツールは対象外とし、ニューラルベースとNLPとCV用途に限定
・データサイエンス、データ視覚化、機械学習のためのPythonライブラリは前回参照

2.ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ30選

以下、www.kdnuggets.comより「Top Python Libraries for Deep Learning, Natural Language Processing & Computer Vision」の意訳です。元記事の投稿は2020年12月、Matthew Mayoさんによる投稿です。

先週投稿したデータサイエンスと機械学習用のPython人気ライブラリと対になる投稿です。

アイキャッチ画像のクレジットはPhoto by Jeff Hopper on Unsplash

この記事では、KDnuggetsのスタッフが最もよいと判断した、ディープラーニング、自然言語処理、コンピュータービジョンのための上位30のPythonライブラリをまとめています。

前回の投稿では、データサイエンス、データ視覚化、機械学習のための上位のPythonライブラリを確認しました。今回は、ディープラーニング、自然言語処理(NLP)、コンピュータービジョン(CV)のトップライブラリを見ていきます。これらのカテゴリについては、これ以上説明する必要はありません。

このカテゴリ分類は任意であり、場合によっては一部のカテゴリのライブラリが他よりも多くなりますが、読者にとって最も役立つことを期待して、使用目的ごとにツールをグループ化するために最善を尽くしました。

最近の全てのNLPおよびCV研究がディープラーニング技術を使用して実行されているわけではないことは明らかですが、最先端の結果を得るためにそのような技術に向かう傾向が進んでいるので、私達はこの点では恣意的な分類ロジックを採用しました。

私達のリストは、私達のチームが合意によって共に決定したライブラリで構成されており、一般的でよく使用されるPythonライブラリを代表しています。また、今回のリストにライブラリを含めるためには、Githubリポジトリを持っている事を条件としました。

カテゴリは特定の順序ではなく、各カテゴリに含まれるライブラリも特定の順番ではありません。星やその他の指標によって任意に順序を作成することも検討しましたが、ライブラリの認識された価値や重要性を明示的に逸脱しないようにするために、それに反対することにしました。従って、ここでのリストは完全にランダムです。ライブラリの説明は、何らかの形でGithubリポジトリから直接取得されます。

このデータの収集に貢献してくれたAhmed Anisと、入力、洞察、提案をしてくれたKDnuggetsの残りのスタッフに改めて感謝します。

以下のGregory Piatteskyによる視覚化は、各ライブラリをタイプ別に表し、星と貢献者毎にグラフ化しています。そのシンボルサイズは、ライブラリがGithubで対数スケールで行ったコミット数を反映していることに注意してください。


図1:ディープラーニング、自然言語処理、コンピュータービジョン用トップPythonライブラリ
星の数と貢献者の数によってグラフ化されてます。印の大きさはコミット数を表現しています。

本題に入りましょう、KDnuggetsのスタッフが最もよいと判断した、ディープラーニング、自然言語処理、コンピュータービジョンのための上位30のPythonライブラリを紹介します。

ディープラーニング

(1)TensorFlow
スター: 149000, コミット: 97741, 貢献者: 2754

TensorFlowは、機械学習のためのエンドツーエンドのオープンソースプラットフォームです。ツール、ライブラリ、コミュニティなど包括的で柔軟な利用環境を備えているため、研究者はMLの最先端技術を推進し、開発者はMLを利用したアプリケーションを簡単に構築して展開できます。

(2)Keras
スター: 50000, コミット: 5349, 貢献者: 864

KerasはPythonで記述された深層学習APIであり、機械学習プラットフォームTensorFlow上で実行されます。

(3)PyTorch
スター: 43200, コミット: 30696, 貢献者: 1619

強力なGPUアクセラレーションを備えたPython用のテンソルと動的ニューラルネットワーク

(4)fastai
スター: 19800, コミット: 1450, 貢献者: 607

fastaiは、最新のベストプラクティスを使用して、ニューラルネットのトレーニングを高速で精密に簡素化します

(5)PyTorch Lightning
スター: 9600, コミット: 3594, 貢献者: 317

高性能AI研究用の軽量なPyTorchラッパー。単調な繰り返しを行う事なく、モデルの規模を拡大できます。

(6)JAX
スター: 10000, コミット: 5708, 貢献者: 221

PythonとNumPyで構成されたプログラムの変換:微分、ベクトル化、JITからGPU/TPUなど

(7)MXNet
スター: 19100, コミット: 11387, 貢献者: 839

軽量で、移植性が高い、柔軟な分散/モバイルディープラーニング。
動的でミューテーション対応のDataflowDepスケジューラーを使用します。
Python、R、Julia、Scala、Go、Javascript等で利用可能

(8)Ignite
スター: 3100, コミット: 747, 貢献者: 112

PyTorchでのニューラルネットワークのトレーニングと評価を柔軟かつ透過的に支援する高レベルのライブラリ。

自然言語処理

(9)FastText
スター: 21700, コミット: 379, 貢献者: 47

fastTextは、単語特徴表現と文章分類を効率的に学習するためのライブラリです。

(10)spaCy
スター: 17400, コミット: 11628, 貢献者: 482

PythonとCythonを使用した実務用途の強力な自然言語処理(NLP)

(11)gensim
スター: 11200, コミット: 4024, 貢献者: 361

Gensimは、トピックモデリング、ドキュメントインデックス作成、および大規模なコーパスを使用した類似性検索のためのPythonライブラリです。対象ユーザは、自然言語処理(NLP)および情報検索(IR)コミュニティです。

(12)NLTK
スター: 9300, コミット: 13990, 貢献者: 319

NLTK(Natural Language Toolkit)は、自然言語処理の研究開発をサポートするオープンソースの一連のPythonモジュール、データセット、およびチュートリアルです。

(13)Datasets (Huggingface社)
スター: 4300, コミット: 568, 貢献者: 64

PyTorch、TensorFlow、NumPy、Pandasの自然言語処理などの高速で効率的なオープンアクセスデータセットと評価指標

(14)Tokenizers (Huggingface社)
スター: 3800, コミット: 1252, 貢献者: 30

研究と生産のために最適化された高速の最先端のトークナイザー

(15)Transformers (Huggingface社)
スター: 3500, コミット: 5480, 貢献者: 585

Transformers:PytorchおよびTensorFlow2.0用の最先端の自然言語処理

(16)Stanza
スター: 4800, コミット: 1514, 貢献者: 19

多くの人間用言語のためのスタンフォード公式NLP Pythonライブラリ

(17)TextBlob
スター: 7300, コミット: 542, 貢献者: 24

シンプルでPython指向のテキスト処理-感情分析、品詞タグ付け、名詞句の抽出、翻訳など。

(18)PyTorch-NLP
スター: 1800, コミット: 442, 貢献者: 15

PyTorch用の自然言語処理(NLP)の基本ユーティリティ

(19)Textacy
スター: 1500, コミット: 1324, 貢献者: 23

高性能のspaCyライブラリ上に構築された、さまざまな自然言語処理(NLP)タスクを実行するためのPythonライブラリ。

(20)Finetune
スター: 626, コミット: 1405, 貢献者: 13

Finetuneは、ユーザーが最先端の事前トレーニング済みNLPモデルをさまざまなダウンストリームタスクに活用できるようにするライブラリです。

(21)TextHero
スター: 1900, コミット: 266, 貢献者: 17

テキストの前処理、特徴表現、視覚化をzeroからheroまで

(22)Spark NLP
スター: 1700, コミット: 4363, 貢献者: 50

Spark NLPは、Apache SparkML上に構築された自然言語処理ライブラリです。

(23)GluonNLP
スター: 2200, コミット: 712, 貢献者: 72

GluonNLPは、簡単なテキスト前処理、データセットの読み込み、ニューラルモデルの構築を可能にするツールキットであり、自然言語処理(NLP)の調査をスピードアップするのに役立ちます。

コンピュータービジョン

(24)Pillow
スター: 7800, コミット: 10799, 貢献者: 303

PillowはフレンドリーなPILの分身です。 PILはPython Imaging Libraryです。

(25)OpenCV
スター: 49600, コミット: 29453, 貢献者: 1234

オープンソースのコンピュータビジョンライブラリ

(26)scikit-image
スター: 4000, コミット: 12352, 貢献者: 403

Pythonでの画像処理

(27)Mahotas
スター: 644, コミット: 1273, 貢献者: 25

Mahotasは、numpy配列で動作する高速コンピュータービジョンアルゴリズム(速度を上げるために全てC ++で実装されています)のライブラリです。

(28)Simple-CV
スター: 2400, コミット: 2625, 貢献者: 69

SimpleCVは、OpenCVとPythonプログラミング言語を使用したオープンソースのマシンビジョン用フレームワークです。

(29)GluonCV
スター: 4300, コミット: 774, 貢献者: 101

GluonCVは、コンピュータービジョンにおける最先端(SOTA)の深層学習モデルの実装を提供します。

(30)Torchvision
スター: 7500, コミット: 1286, 貢献者: 334

torchvisionパッケージは、一般的なデータセット、モデルアーキテクチャ、およびコンピュータビジョン用の一般的な画像変換で構成されています。

3.ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版関連リンク

1)www.kdnuggets.com
Top Python Libraries for Deep Learning, Natural Language Processing & Computer Vision

2)github.com
tensorflow / tensorflow
keras-team / keras
pytorch / pytorch
fastai / fastai
PyTorchLightning / pytorch-lightning
google / jax
apache / incubator-mxnet
pytorch / ignite
facebookresearch / fastText
explosion / spaCy
RaRe-Technologies / gensim
nltk / nltk
huggingface / datasets
huggingface / tokenizers
huggingface / transformers
stanfordnlp / stanza
sloria / TextBlob
PetrochukM / PyTorch-NLP
chartbeat-labs / textacy
IndicoDataSolutions / finetune
jbesomi / texthero
JohnSnowLabs / spark-nlp
dmlc / gluon-nlp
python-pillow / Pillow
opencv / opencv
scikit-image / scikit-image
luispedro / mahotas
sightmachine / SimpleCV
dmlc / gluon-cv
pytorch / vision

タイトルとURLをコピーしました