モデル VideoBERT:ビデオ内の画像と音声を組み合わせて学習(2/3)
1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(2/3)まとめ ・ビデオ内の画像とテキストを組み合わせたクロスモーダルな文章を元にVideoBERTを学習させた ・VideoBERTを、料理、ガーデニング、車両修理など、10...
モデル
学習手法
モデル
入門/解説
その他の調査
入門/解説
その他
入門/解説
AI関連その他
入門/解説
入門/解説
その他