音声

1/23ページ

Open Images V6:新しいタイプの注釈localized narrativesが特徴(2/2)

AI

1.Open Images V6:新しいタイプの注釈localized narrativesが特徴(2/2)まとめ ・Open Images V6では、視覚的関係の注釈の種類を1桁(約1.4k)増やした ・個々のアクションを実行する人間を含んだ250万の注釈も増やした ・2350万の人間が検証した新しい画像レベルのラベルも追加した 2.Open Images V6の収録データ数 以下、ai.goo […]

Open Images V6:新しいタイプの注釈localized narrativesが特徴(1/2)

AI

1.Open Images V6:新しいタイプの注釈localized narrativesが特徴(1/2)まとめ ・多くの点で世界最大の画像データセットであるOpen Imagesのバージョン6が公開 ・バージョン6では新しいタイプの注釈「localized narratives(物語化した注釈)」が追加された ・これはマルチモーダルな注釈、つまり音声や文章、マウスの動きを使って表現した全く新し […]

TyDi QA:多言語対応した質問回答ベンチマーク(1/2)

AI

1.TyDi QA:多言語対応した質問回答ベンチマーク(1/2)まとめ ・日本語を含む11種類の多様な言語を網羅する質問回答用のデータセットであるTyDi QAが公開 ・TyDi QAは共通点の少ない言語を集めたため多様な言語に多様な対応可能なモデルを訓練できそう ・TyDi QAには言語とデータの課題を表す11言語からの200,000を超える質問と回答のペアが含まれる 2.TyDi QAとは? […]

LaserTagger:制御可能で効率的な文章生成アプローチ(2/2)

AI

1.LaserTagger:制御可能で効率的な文章生成アプローチ(2/2)まとめ ・従来のseq2seqを使ったモデルと比較してLaserTaggerには3つの利点がある ・制御可能で幻覚の影響を受けにくい事、最大100倍の速度で予測を実行可能である事 ・数千程度の学習データを使用してトレーニングした場合でも適切な出力を生成可能 2.LaserTaggerとBERTベースモデルの比較 以下、ai. […]

Google Research:2019年の振り返りと2020年以降に向けて(6/8)

AI

1.Google Research:2019年の振り返りと2020年以降に向けて(6/8)まとめ ・従来は分割して段階的に行った作業を大規模ニューラルネットワークで一気にやる事が主流になりつつある ・これらの研究結果はBERTの検索エンジンへの投入を初め実世界で使われるようになってきている ・機械による知覚は静止画像から動画やライブ性、意味や複雑な状況の把握などに対象が移ってきている 2.自然言語 […]

1 23