WebBigData

XMC-GAN：クロスモーダルな対照学習でテキストから画像を生成(2/2)

１．XMC-GAN：クロスモーダルな対照学習でテキストから画像を生成(2/2)まとめ・XMC-GAN は各データセットで最先端のスコアを実現し他の手法より評価者に好まれた・特により複雑なOpenImagesでもXMC-GAN は高品質の...

2021.06.04

学習手法

１．XMC-GAN：クロスモーダルな対照学習でテキストから画像を生成(1/2)まとめ・テキストの説明文から画像を生成する合成タスクは最近大きな注目を集めている・従来の画像合成手法はGANを使うケースが多いがモード崩壊などの問題を抱える ...

2021.06.03

学習手法

１．MicrosoftがGPT-3を利用した最初の製品を発表まとめ・ローコード開発ツールのMicrosoft Power Apps内でGPT-3の一部機能が使用可能に・話言葉を計算式に変換可能になり6 月末までに北米全域で試用できるよう...

2021.06.02

アプリケーションモデル

１．人々の表情は国や地域が変わっても場面によって共通なのか？(2/2)まとめ・ビデオ内の場面を自動的に認識させるために2種のDNNを使用した・表情と場面の相関関係は文化間の違いに関わらず７割程度が同じだった・逆に言えば地域間で最大30...

2021.06.01

AI関連その他

１．人々の表情は国や地域が変わっても場面によって共通なのか？(1/2)まとめ・人間の表情は国や地域に関わらず場面によって普遍的かもしれない・しかし過去に行われた研究は調査ベースで規模が小さく結果に一貫性がない・DNNを活用して表情分析...

2021.05.31

AI関連その他

１．KELM：ナレッジグラフを言語モデルの事前トレーニング資料に統合まとめ・大規模な自然言語処理モデルは、インターネットから取得した自然言語の資料を活用する・自然言語のテキストだけでは、知識の範囲が限られるため他の情報源もある事が望まし...

2021.05.30

学習手法基礎理論

１．Project Guideline：視力の弱い人が一人で走れるようにする(2/2)まとめ・既存のデータセットは自動運転車用でランニング用途の学習に使う事が難しかった・自動運転車用データ、合成データ、本当のランニングデータの３段階で転...

2021.05.29

アプリケーション公平性

１．Project Guideline：視力の弱い人が一人で走れるようにする(1/2)まとめ・失明または弱視状態の人にとって支援者なしに一人でランニングすることは困難・Project Guidelineは路面に案内線が塗装されている様々...

2021.05.28

アプリケーション公平性

１．DeformableRavens：変形可能な物体を操作することを学ぶ(2/2)まとめ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...

2021.05.27

モデル学習手法AI

１．DeformableRavens：変形可能な物体を操作することを学ぶ(1/2)まとめ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこ...

2021.05.26

モデル学習手法

１．ALIGN：ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能・ALIGN embeddingsを使って演算するとパ...

2021.05.25

モデル

１．ALIGN：ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現・微調整を行うとALIGNはBiTやViTなどのほ...

2021.05.24

モデル