視覚

AI

CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(2/2)

1.CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(2/2)まとめ ・CNNよりTransformerモデルの方が大規模データセットに対応する能力が高い ・CoAtNetsは畳み込みと自己注意を組み合わせたハイブリ...
AI

拡散モデルを使用してGANより忠実度の高い画像を生成(1/2)

1.拡散モデルを使用してGANより忠実度の高い画像を生成(1/2)まとめ ・画像合成は、GAN、VAE、自己回帰モデル等を使って行われているがどれも一長一短 ・2015年に発表された拡散モデルは安定性と生成サンプルの品質で最近注目を集め...
AI

CVPR 2021におけるGoogleの存在感

1.CVPR 2021におけるGoogleの存在感まとめ ・6/19 - 6/25の間インターネット上のヴァーチャルイベントとしてCVPR 2021が開催 ・Google社員も多数参加し70を超える受理された出版物やワークショップを開催...
AI

MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)

1.MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)まとめ ・Open Imagesは「女の子」のラベルを「女性」に付与するかは作業者の感覚依存であった ・MIAPでは知覚された性別...
AI

VTN:Transformerを使用した文書レイアウトの自動化(2/2)

1.VTN:Transformerを使用した文書レイアウトの自動化(2/2)まとめ ・レイアウトの品質と多様性という2つの基準に従ってVTNのパフォーマンスを評価 ・従来の研究は配置ルールに準拠できなかったり多様性に問題があったがVTN...
タイトルとURLをコピーしました