ベンチマーク

データセット

ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)まとめ・最もパフォーマンスの高いモデルであっても約20%の確率で情報を幻覚化するように見える・最先端のモデルでも幻覚、数値的推論、および稀なトピックに苦労している事がわ...
データセット

ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)まとめ・自然言語生成は元の文章に存在しない幻覚のような文章を生成してしまう事がまだある・既存のデータセットでは幻覚の原因がデータノイズなのかモデルの欠点なのか特定が困難...
アプリケーション

Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(2/2)

1.Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(2/2)まとめ・Pr-VIPEを使用して異なった視点から撮影された動画から同じポーズを検索する事が可能・カメラパラメータを使用せずに異なる視点から同じポーズを取得で...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(5/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(5/5)まとめ・TensorFlowは5周年で累計ダウンロード数は1億6000万を超え、JAXへの投資も倍増・データセットの公開、各種助成金などにより研究コミ...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(3/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(3/5)まとめ・機械学習アルゴリズムや基礎理論の研究により効率的な手法の探求が前進・強化学習は履歴データの利用やサンプル効率の向上、適用分野の拡大・AutoM...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(2/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(2/3)まとめ・ゼロショット機能実現は単純に事前トレーニングタスクを規模拡大するだけで十分だった・CLIPは視覚タスクの抱える課題であるデータが高コストである事などを軽減する・...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(1/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(1/3)まとめ・自然言語を教師に視覚的概念を効率的に学習するネットワークCLIPの紹介・CLIPはGPT-2やGPT-3の「ゼロショット」機能を視覚タスクで実現・個々のタスク用...
入門/解説

グラフニューラルネットワークのわかりやすい紹介(2/3)

1.グラフニューラルネットワークのわかりやすい紹介(2/3)まとめ・グラフニューラルネットワークは2005年に発表されたが関連する概念はそれ以前からあった・過去数年間、GNNはSMS分析や計算化学分野、特に創薬分野に熱心に使われている・GN...
アプリケーション

時系列予測にAutoMLを使用する(2/2)

1.時系列予測にAutoMLを使用する(2/2)まとめ・最新コンペであるM5予測コンペでAutoMLは銀メダルゾーンにあたる成績を収めた・人間の参加者が数か月かかったモデル設計を2時間と人的介入なしでAutoMLは達成・他のデータセットでも...
モデル

ViT:規模拡大可能な画像認識用のTransformers(2/2)

1.ViT:規模拡大可能な画像認識用のTransformers(2/2)まとめ・画像タスク用に特化したモデルは不要であるか最適ではない可能性がある・データのサイズが増え続けており画像タスクに関する新しいアプローチが必要・ViTは視覚タスクや...
公平性

MinDiff:機械学習モデルの不公平な偏見を軽減(2/2)

1.MinDiff:機械学習モデルの不公平な偏見を軽減(2/2)まとめ・分類器のエラー率のグループ間差異は不公平な偏見の重要な一部だが唯一の偏見ではない・MinDiffが不公平な偏見に対処する手法や研究を前進させ、改善させる事を願っている・...
AI関連その他

AIのアルゴリズムの効率性は16か月毎に2倍に上昇(2/2)

1.AIのアルゴリズムの効率性は16か月毎に2倍に上昇(2/2)まとめ・少量のコンピューティングで達成された顕著な進歩の測定に力を注ぐことが重要・今後も効率的な最新技術を引き続き追跡し、視覚と翻訳タスク以外も追加して行く予定・未掲載のSOT...