モデル

アプリケーション

VTN:Transformerを使用した文書レイアウトの自動化(1/2)

1.VTN:Transformerを使用した文書レイアウトの自動化(1/2)まとめ ・レイアウトやデザインルールは従う事は簡単だが例外があるため明確に定義することは困難 ・機械学習を使った自動デザインはレイアウト要素間の定義情報がないと新要...
アプリケーション

MicrosoftがGPT-3を利用した最初の製品を発表

1.MicrosoftがGPT-3を利用した最初の製品を発表まとめ ・ローコード開発ツールのMicrosoft Power Apps内でGPT-3の一部機能が使用可能に ・話言葉を計算式に変換可能になり6 月末までに北米全域で試用できるよう...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)まとめ ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合 ・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)まとめ ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない ・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能 ・ALIGN embeddingsを使って演算するとパ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現 ・微調整を行うとALIGNはBiTやViTなどのほ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)まとめ ・視覚言語間マッチングモデルは文章や画像を入力して関連性の高い画像を見つけるのに役立つ ・最先端の視覚および視覚対言語モデルは厳選されたトレー...
モデル

FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(2/2)

1.FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(2/2)まとめ ・FELIXは完全に非自己回帰であり最先端のスコアを達成しながら高速な推論を実現可能 ・事前トレーニングとマスク言語モデルを念頭に必要なトレーニングデータ...
モデル

FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(1/2)

1.FELIX:タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(1/2)まとめ ・seq2seqは自然言語生成タスクで好まれるが単一言語が対象の際は最適でない可能性 ・自己回帰で低速であり単一言語では入力が出力にコピーされるだけの事が...
モデル

ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2)

1.ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2) ・Panoptic-DeepLabは複数フレームにおける深度推定やインスタンスID付与ができない ・ViP-DeepLabは2つの連続...
モデル

ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(1/2)

1.ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(1/2) ・人間は二次元画像である写真から三次元環境に関する視覚情報を非常に簡単に取得できる ・自動運転などを実現するためには同様に平面画像から...
モデル

自動進化する強化学習でDDQNを凌駕する(2/2)

1.自動進化する強化学習でDDQNを凌駕する(2/2)まとめ ・発見されたアルゴリズムの中でDQNRegとDQNClippedが優れたパフォーマンスを出した ・これらはDQNが一般的にQ値を過大評価してしまう事を各々の方法で回避している ・...