data set

アプリケーション

BlenderBot 2.0:長期記憶とインターネット検索能力を合わせ持つチャットボット(2/2)

1.BlenderBot 2.0:長期記憶とインターネット検索能力を合わせ持つチャットボット(2/2)まとめ ・BlenderBot 2.0は検索拡張対応世代モデルで会話に含まれている知識を超えた応答が可能 ・学習用の2つのデータセット「W...
データセット

MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)

1.MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)まとめ ・Open Imagesは「女の子」のラベルを「女性」に付与するかは作業者の感覚依存であった ・MIAPでは知覚された性別表現...
データセット

Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)

1.Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)まとめ ・機械学習ではモデル構築が優先されデータ関連作業の優先度が低くなる事はよくある ・データ整備を軽視すると時間経過とともに技術的負債が発生し...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)まとめ ・視覚言語間マッチングモデルは文章や画像を入力して関連性の高い画像を見つけるのに役立つ ・最先端の視覚および視覚対言語モデルは厳選されたトレー...
モデル

ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2)

1.ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2) ・Panoptic-DeepLabは複数フレームにおける深度推定やインスタンスID付与ができない ・ViP-DeepLabは2つの連続...
ロボット

iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(2/2)

1.iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(2/2)まとめ ・iGibson Challenge 2021には実際のアパートから派生させた8つの風景が含まれる ・各環境内には人間の挙動...
基礎理論

RxR:多言語の案内指示に対応する能力を測るベンチマーク(2/2)

1.RxR:多言語の案内指示に対応する能力を測るベンチマーク(2/2)まとめ ・RxRには約1,000万語が含まれており既存のデータセットの約10倍の規模 ・RxRを使い現在の最良のモデルであっても人間の半分程度のスコアである事が判明 ・R...
基礎理論

RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2)

1.RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2)まとめ ・話し言葉や書き言葉を使った指示に応じて複雑な環境を案内できるAIの開発は大きな課題 ・視覚と言語のナビゲーション(VLN)と呼ばれるこの課題には、空間言語の高度...
データセット

ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)まとめ ・最もパフォーマンスの高いモデルであっても約20%の確率で情報を幻覚化するように見える ・最先端のモデルでも幻覚、数値的推論、および稀なトピックに苦労している事...
データセット

ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)まとめ ・自然言語生成は元の文章に存在しない幻覚のような文章を生成してしまう事がまだある ・既存のデータセットでは幻覚の原因がデータノイズなのかモデルの欠点なのか特定が...
アプリケーション

Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(2/2)

1.Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(2/2)まとめ ・Jukeboxは局所的には一貫性のある音楽を作成できるが曲全体で見るとまだ構造把握が甘い ・ダウンサンプリングとアップサンプリングを行っているためノ...
アプリケーション

Chimera Painter:GANを使用して幻想的な生き物を創造(2/3)

1.Chimera Painter:GANを使用して幻想的な生き物を創造(2/3)まとめ ・GANをトレーニングするために、三次元の生き物モデルを利用して画像データセットを作成 ・合成生物を生成するためには新しいファンタジー風のデータセット...