アプリケーション

Project Guideline:視力の弱い人が一人で走れるようにする(2/2)

1.Project Guideline:視力の弱い人が一人で走れるようにする(2/2)まとめ ・既存のデータセットは自動運転車用でランニング用途の学習に使う事が難しかった ・自動運転車用データ、合成データ、本当のランニングデータの3段階で転...
アプリケーション

Project Guideline:視力の弱い人が一人で走れるようにする(1/2)

1.Project Guideline:視力の弱い人が一人で走れるようにする(1/2)まとめ ・失明または弱視状態の人にとって支援者なしに一人でランニングすることは困難 ・Project Guidelineは路面に案内線が塗装されている様々...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)まとめ ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合 ・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)まとめ ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない ・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能 ・ALIGN embeddingsを使って演算するとパ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現 ・微調整を行うとALIGNはBiTやViTなどのほ...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)まとめ ・視覚言語間マッチングモデルは文章や画像を入力して関連性の高い画像を見つけるのに役立つ ・最先端の視覚および視覚対言語モデルは厳選されたトレー...
アプリケーション

スマートフォンでウェアラブルデバイスに匹敵する視線追跡を実現(3/3)

1.スマートフォンでウェアラブルデバイスに匹敵する視線追跡を実現(3/3)まとめ ・アイトラッカーは覚醒状態や健康状態を検出するためのツールとして使用可能 ・精神的疲労感がある人とない人では視線の軌跡が大きく変わる事などを利用する ・ALS...
アプリケーション

スマートフォンでウェアラブルデバイスに匹敵する視線追跡を実現(2/3)

1.スマートフォンでウェアラブルデバイスに匹敵する視線追跡を実現(2/3)まとめ ・スマートフォンのアイトラッカーは、最先端のウェアラブルデバイスのアイトラッカーに匹敵 ・実験室などで使われる100倍高価なアイトラッカーから得られるデータと...
アプリケーション

スマートフォンでウェアラブルデバイスに匹敵する視線追跡を実現(1/3)

1.スマートフォンでウェアラブルデバイスに匹敵する視線追跡を実現(1/3)まとめ ・眼球の運動を追跡する事はヘルスケアや様々なアプリケーションで役立つ可能性がある ・従来は高価な専用のハードウェアが必要となるため進歩の速度が限られていた ・...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)まとめ ・文対文タスクと画像対文タスクでトレーニングされたマルチタスクモデルが最も優秀だった ・文対文のトレーニングを追加すると画像対文、文対画像で...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)まとめ ・類似性が高いと予想される新しいペアを抽出し、そのペアを人が評価する事にした ・キャプションの類似性が高い画像同士は類似性が高い可能性がある...