人工知能/機械学習

AI関連その他

人々の表情は国や地域が変わっても場面によって共通なのか?(1/2)

1.人々の表情は国や地域が変わっても場面によって共通なのか?(1/2)まとめ ・人間の表情は国や地域に関わらず場面によって普遍的かもしれない ・しかし過去に行われた研究は調査ベースで規模が小さく結果に一貫性がない ・DNNを活用して表情分析...
学習手法

KELM:ナレッジグラフを言語モデルの事前トレーニング資料に統合

1.KELM:ナレッジグラフを言語モデルの事前トレーニング資料に統合まとめ ・大規模な自然言語処理モデルは、インターネットから取得した自然言語の資料を活用する ・自然言語のテキストだけでは、知識の範囲が限られるため他の情報源もある事が望まし...
アプリケーション

Project Guideline:視力の弱い人が一人で走れるようにする(2/2)

1.Project Guideline:視力の弱い人が一人で走れるようにする(2/2)まとめ ・既存のデータセットは自動運転車用でランニング用途の学習に使う事が難しかった ・自動運転車用データ、合成データ、本当のランニングデータの3段階で転...
アプリケーション

Project Guideline:視力の弱い人が一人で走れるようにする(1/2)

1.Project Guideline:視力の弱い人が一人で走れるようにする(1/2)まとめ ・失明または弱視状態の人にとって支援者なしに一人でランニングすることは困難 ・Project Guidelineは路面に案内線が塗装されている様々...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)まとめ ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合 ・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)まとめ ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない ・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能 ・ALIGN embeddingsを使って演算するとパ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現 ・微調整を行うとALIGNはBiTやViTなどのほ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)まとめ ・視覚言語間マッチングモデルは文章や画像を入力して関連性の高い画像を見つけるのに役立つ ・最先端の視覚および視覚対言語モデルは厳選されたトレー...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)まとめ ・文対文タスクと画像対文タスクでトレーニングされたマルチタスクモデルが最も優秀だった ・文対文のトレーニングを追加すると画像対文、文対画像で...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)まとめ ・類似性が高いと予想される新しいペアを抽出し、そのペアを人が評価する事にした ・キャプションの類似性が高い画像同士は類似性が高い可能性がある...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)まとめ ・自動画像キャプションはアルゴリズムで画像の説明を作成するタスクで目覚ましい進歩を遂げた ・これにより視覚情報と言語情報を紐づける研究に利用...