dataset

AI

CATS4ML:機械学習の未知の不明を明らかにするコンペ

1.CATS4ML:機械学習の未知の不明を明らかにするコンペまとめ ・機械学習モデルのパフォーマンスは学習アルゴリズムとデータ品質の両方に依存 ・機械学習の評価に使用されるデータセットの品質はアルゴリズム程探求されていない ・CATS...
AI

ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)まとめ ・最もパフォーマンスの高いモデルであっても約20%の確率で情報を幻覚化するように見える ・最先端のモデルでも幻覚、数値的推論、および稀なトピックに苦労してい...
AI

ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)まとめ ・自然言語生成は元の文章に存在しない幻覚のような文章を生成してしまう事がまだある ・既存のデータセットでは幻覚の原因がデータノイズなのかモデルの欠点なのか特...
AI

arXiv.orgの投稿論文数で振り返る2020年のAI関連トレンド

1.arXiv.orgの投稿論文数で振り返る2020年のAI関連トレンドまとめ ・arXiv.orgのAPIは同一パラメーターで取得数がブレる事があるので要注意 ・AL/MLはもうコンピューターサイエンスや統計学の領域には留まっていない...
AI

Google Research:2020年の振り返りと2021年以降に向けて(5/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(5/5)まとめ ・TensorFlowは5周年で累計ダウンロード数は1億6000万を超え、JAXへの投資も倍増 ・データセットの公開、各種助成金などにより...
タイトルとURLをコピーしました