入門／解説

人工知能とデータサイエンスの2019年の主な進展と2020年の予測developments編(1/3)

１．人工知能とデータサイエンスの2019年の主な進展と2020年の予測developments編(1/3)まとめ・「分析業務」および「AIを現行業務に適用する業務」のステータスと認識の改善・解釈する必要があるデータは、常に偏見に対するリ...

2020.02.13

入門／解説

１．TyDi QA：多言語対応した質問回答ベンチマーク(2/2)まとめ・自然なデータセットを構築するために答えをまだ知らない人に質問文を作ってもらった・その結果、質問文と回答文に共通な単語が少なくなり、同じ意味が異なって表現される事例も...

2020.02.12

入門／解説

１．TyDi QA：多言語対応した質問回答ベンチマーク(1/2)まとめ・日本語を含む11種類の多様な言語を網羅する質問回答用のデータセットであるTyDi QAが公開・TyDi QAは共通点の少ない言語を集めたため多様な言語に多様な対応可...

2020.02.11

入門／解説

１．ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(2/3)まとめ・固定したデータセットを利用した公平性の確認は２つの欠陥がある事が知られている・第一にテストセットが不完全かシステム固有のバイアスを内包し...

2020.02.09

入門／解説

１．ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(1/3)まとめ・機械学習の公平性は一般的に固定したデータセットを利用して公平性を確認する事で行われる・機械学習の影響を受けたデータが次の入力に使われるよ...

2020.02.08

入門／解説

１．LaserTagger：制御可能で効率的な文章生成アプローチ(1/2)まとめ・Transformerをベースとしたseq2seqモデルは高い性能を持つが文章生成に使うと３つの弱点がある・幻覚、大量のトレーニングデータ、推論速度、の3...

2020.02.06

入門／解説

１．学習ベースの画像圧縮手法に関する第3回ワークショップまとめ・CVPR 2020で第三回学習ベースの画像圧縮コンペが開催される事が発表し挑戦受付中・本ワークショップシリーズの初のビデオ圧縮タスクであるPフレーム圧縮に関するコンペも開催...

2020.02.05

入門／解説

１．Meena：どんな会話にも対応できるチャットボット(3/3)まとめ・PerplexityがMeena開発中に作ったSSA値などの人間による評価と強い相関関係を示す事がわかった・Perplexityは言語モデルの不確実性を測定する従来...

2020.02.04

入門／解説

１．Meena：どんな会話にも対応できるチャットボット(1/3)まとめ・現在の人工知能を使ったチャットボットは特定の会話はこなせるが雑談に対応できる能力は低い・MeenaはGPT-2を超える26億のパラメータを内部に持つ新しいニューラル...

2020.02.02

入門／解説

１．ハエの脳のニューロン接続を見える化(2/2)まとめ・フロードフィリングネットワークにより校正にかかる時間が大幅に短縮できた・また、自動シナプス検出用のモデルも訓練する事で更に堅牢性を向上した・ヘミブレインコネクトーム使って中心複合...

2020.02.01

入門／解説

１．ハエの脳のニューロン接続を見える化(1/2)まとめ・ショウジョウバエの脳の半分がどのように相互接続されているかニューロン構造の詳細判明・昨年時点の研究では３D画像を自動再構築する所まで出来ていたが接続詳細まではわからなかった・判明...

2020.01.31

入門／解説

１．モデルが出力する「予測の不確実性」はどこまで信用できますか？(2/2)まとめ・モデルは予測の不確実性が増した事を認識せずに自信を持って間違う傾向がある・ディープアンサンブルがデータの変化に対する耐久性を最も改善するシンプルな戦略・...

2020.01.28

入門／解説