dataset

オフライン強化学習における未解決の課題への取り組み(1/3)

１．オフライン強化学習における未解決の課題への取り組み(1/3)まとめ・強化学習は医療など試行錯誤によるデータ収集が難しい現実世界には適用が難しい・オフラインRLは実際に動かさなくても過去に収集されたデータを使って学習可能なため有望・...

2020.08.29

入門／解説

１．MentorMix：現実世界の誤ラベルがディープラーニングに及ぼす影響を調査(1/3)まとめ・ディープラーニングの学習には大規模データが必要だが大規模になると誤ラベルが混ざる・ラベルにノイズが多い場合の対処法は研究されてきたが合成し...

2020.08.26

入門／解説

１．ICML 2020におけるGoogleの存在感まとめ・7/12から7/18の間インターネット上のヴァーチャルイベントとしてICML 2020が開催・Google社員も多数参加し100を超える論文の発表やワークショップを開催・本サイ...

2020.07.23

学会

１．自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)まとめ・同じ音声のembeddingは、別の音声のembeddingよりembedding空間内で近い場所に位置するはず・これを利用しBERTと同様なデータ自体の構造にのみ依...

2020.07.02

モデル

１．自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)まとめ・非セマンティックタスクとは、声の調子など、人間の音声の「意味以外の側面」に焦点を当てたタスク・従来のベンチマークでは非セマンティックタスク用の特徴表現が有用か否かを比...

2020.07.01

学習手法

１．CVPR 2020におけるGoogleの存在感まとめ・6/14 - 6/19の間インターネット上のヴァーチャルイベントとしてCVPR 2020が開催・Google社員も多数参加し70近くの受理された出版物やワークショップを開催・本...

2020.06.25

学会

１．BLEURT:人工知能が生成した文章の品質を評価(3/3)まとめ・BLEURTは、何百万もの合成文章ペアを使用してモデルを「ウォームアップ」して品質を向上した・既存の評価手法と比較するとBLEURTは最も良く人間による品質評価と相関...

2020.06.08

入門／解説

１．BLEURT:人工知能が生成した文章の品質を評価(2/3)まとめ・BLEURTは単語の重複度合に関わらず文章間の意味的類似性を捕捉できる新しい自動評価基準・内部的にはBERTの「文脈を意識した単語表現(contextual word...

2020.06.07

入門／解説

１．Meta-Dataset：少数ショット学習用のデータセットのためのデータセット(3/3)まとめ・Meta-Datasetを使った研究によりサポートデータの数とアルゴリズムの重要性が判明・様々なモデルは、微調整時に提供されるサポートデ...

2020.05.23

入門／解説

１．Meta-Dataset：少数ショット学習用のデータセットのためのデータセット(2/3)まとめ・Meta-Datasetは少数ショット画像分類用のこれまでで最大規模の複数データセットを交えたベンチマーク・「事前トレーニング」と「メタ...

2020.05.22

ビッグデータ

１．Meta-Dataset：少数ショット学習用のデータセットのためのデータセット(1/3)まとめ・ディープラーニングのパフォーマンスは多くの場合、手動でラベル付けした大量の学習用データに依存・より少ないデータから学習する手法に関心が集...

2020.05.21

入門／解説

１．COVID-19 Research Explorer:新型コロナウィルス関連文献に特化した検索システムまとめ・Googleが新型コロナウィルス関連文献を検索しやすくするCOVID-19 Research Explorerを発表・自然...

2020.05.06

入門／解説