1.arXiv.orgの投稿論文数で振り返る2019年のAI関連トレンドまとめ
・cs.LGはComputer Science Languageではなく、Machine Learningカテゴリなので要注意
・cs.LGは2018年に比べて2019年は倍近くになっており、2000を越えている月もあった
・GANは上昇傾向にあるかもしれない、逆に強化学習はやや下降傾向にあるかもしれない
2.arXiv.orgの2018年と2019年の論文投稿数の比較
あけましておめでとうございます。
arXiv.orgの投稿論文の傾向を元に最新の人工知能研究のトレンドを分析する試みは過去にも何度かやってみているのですが、あまり思ったような感じに出来ていません。従来は、論文のタイトルだけを使っていたのですが、APIで概要(Abstract)も取れる事を知ったので、概要も使ってみたところ、余計にわけがわからなくなりました。
「Machine learning」や「Neural Network」などの、まぁ、当然頻出するであろう単語は無視しても良いとして、同様に上位に出て来る「algorithm」や「classification」などの大量に出て来る単語は頻出は予想されますが、意味がない単語かというと意味はある単語のような気もしてくるのでゴチャゴチャやっているうちに時間切れになってしまいました。
そのため、シンプルに数の推移で傾向を見てみました。
非常にわかりやすいなぁ、BERTやGPT-2の出現でcs.LG、つまり言語系の研究が急増したんだなぁ、と思ったのですが、実はcs.LGってComputer Science Languageじゃないってご存知でした?
1.cs(Computer Science)
cs.LG – Machine Learning
cs.AI – Artificial Intelligence
cs.CL – Computation and Language
cs.CV – Computer Vision and Pattern Recognition
cs.NE – Neural and Evolutionary Computing
2.stat(Statistics)
stat.ML – Machine Learning
そう、実はStatistics(統計)カテゴリではMLがMachine Learningなのに、Computer Scienceカテゴリだと、LGがMachine Learningなのです!新年早々、やらかすところでした。
まぁ、複数カテゴリに登録している論文も多いので、一概には言えないのですが、単純にMachine Learning関係の論文が月によっては倍近くになっており、投稿論文数が2000を越えている月もあります。概要だけを斜め読みするとしても毎日70論文以上!。
これだけ大量な情報を人の子がどうにかして消化しきれるものなのか、新年早々、小難しい事で考え込んでしまいましたが、有限な時間を上手にヤリクリして今年も一歩一歩着実に進んでいくしかないですね。
それと以下、ゴチャゴチャやってみた中で何となく感じた傾向メモです。
・adversarialは2018年に比べて2019年は相対的にやや上昇傾向
・reinforcementは逆に相対的にやや下降傾向
・graph、segmentation、3dなどが相対的にやや上昇傾向
・semantic、inference、policyなどが相対的にやや下降傾向
3.arXiv.orgの投稿論文数で振り返る2019年のAI関連トレンド関連リンク
1)arxiv.org
Computer Science (since January 1993)
Statistics (since April 2007)
コメント