人工知能/機械学習

アプリケーション

Project Guideline:視力の弱い人が一人で走れるようにする(1/2)

1.Project Guideline:視力の弱い人が一人で走れるようにする(1/2)まとめ ・失明または弱視状態の人にとって支援者なしに一人でランニングすることは困難 ・Project Guidelineは路面に案内線が塗装されている様々...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)まとめ ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合 ・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)まとめ ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない ・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能 ・ALIGN embeddingsを使って演算するとパ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現 ・微調整を行うとALIGNはBiTやViTなどのほ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)まとめ ・視覚言語間マッチングモデルは文章や画像を入力して関連性の高い画像を見つけるのに役立つ ・最先端の視覚および視覚対言語モデルは厳選されたトレー...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)まとめ ・文対文タスクと画像対文タスクでトレーニングされたマルチタスクモデルが最も優秀だった ・文対文のトレーニングを追加すると画像対文、文対画像で...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)まとめ ・類似性が高いと予想される新しいペアを抽出し、そのペアを人が評価する事にした ・キャプションの類似性が高い画像同士は類似性が高い可能性がある...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)まとめ ・自動画像キャプションはアルゴリズムで画像の説明を作成するタスクで目覚ましい進歩を遂げた ・これにより視覚情報と言語情報を紐づける研究に利用...
モデル

FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(2/2)

1.FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(2/2)まとめ ・FELIXは完全に非自己回帰であり最先端のスコアを達成しながら高速な推論を実現可能 ・事前トレーニングとマスク言語モデルを念頭に必要なトレーニングデータ...
モデル

FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(1/2)

1.FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(1/2)まとめ ・seq2seqは自然言語生成タスクで好まれるが単一言語が対象の際は最適でない可能性 ・自己回帰で低速であり単一言語では入力が出力にコピーされるだけの事が...
基礎理論

ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(1/2)

1.ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(2/2)まとめ ・深淵広大なネットワークには非常に類似した特徴表現を持つ連続したレイヤーが出現する ・これはブロック構造と呼ばれデータセットサイズに対するモデルサ...