視覚

入門/解説

2020年3月29日時点の日本のCOVID-19 Community Mobility Reports

1.2020年3月29日時点の日本のCOVID-19 Community Mobility Reportsまとめ ・首都圏は東京を中心に人の動きが半減しており小売店や行楽地が大きな影響を受けている事が伺える ・東京は就業地以外は既にニューヨ...
学習手法

視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(3/3)

1.視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(3/3)まとめ ・把握ロボットではヘッドとバックボーンの両方を転送した方がバックボーン部のみより成功率が高い ・物体の位置を認識する必要がない画像分類タスクなどの重みはパフ...
モデル

視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(2/3)

1.視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(2/3)まとめ ・多くの視覚タスクモデルは「バックボーン(backbone)」と「ヘッド(head)」の2つの部分から構成される ・ヘッドはタスク固有でもあるため転移学習で...
学習手法

視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(1/3)

1.視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(1/3)まとめ ・ロボットが「物体に対して何が出来て何が出来ないのか?」を直接知覚できるようになると学習効率が良い ・これをアフォーダンスベースの操作と言い入力画像にアクシ...
学習手法

Dreamer:長期視点で考える事が出来る強化学習(3/3)

1.Dreamer:長期視点で考える事が出来る強化学習(3/3)まとめ ・モデルベースのエージェントは500万フレーム未満、シミュレーション内の28時間で効率的に学習可能 ・モデルフリーのエージェントは学習が遅く1億フレーム、23日間に相当...
学習手法

Dreamer:長期視点で考える事が出来る強化学習(2/3)

1.Dreamer:長期視点で考える事が出来る強化学習(2/3)まとめ ・強力な世界モデルでさえ、正確に予測できる範囲が限られており多くは近視眼的だった ・Dreamerは、バリューネットワークとアクターネットワークでこの制限を克服 ・Dr...
入門/解説

組成の一般化能力の測定(3/3)

1.組成の一般化能力の測定(3/3)まとめ ・compound divergenceという新しい指標によりデータセットの難度を数値で表す事ができた ・代表的な3つの標準的なMLアーキテクチャは難度があがるにつれて正確性が直線的にさがってしま...
データセット

Open Images V6:新しいタイプの注釈localized narrativesが特徴(2/2)

1.Open Images V6:新しいタイプの注釈localized narrativesが特徴(2/2)まとめ ・Open Images V6では、視覚的関係の注釈の種類を1桁(約1.4k)増やした ・個々のアクションを実行する人間を含...
データセット

Open Images V6:新しいタイプの注釈localized narrativesが特徴(1/2)

1.Open Images V6:新しいタイプの注釈localized narrativesが特徴(1/2)まとめ ・多くの点で世界最大の画像データセットであるOpen Imagesのバージョン6が公開 ・バージョン6では新しいタイプの注釈...
入門/解説

ストリートビュー画像を道案内用AIの研究者に提供(2/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(2/3)まとめ ・研究コミュニティがTouchdownタスクを使用できるようにストリートビュー画像が利用しやすくなった ・Googleの利用規約と個人情報保護のために大量ダウンロードや無...
入門/解説

ストリートビュー画像を道案内用AIの研究者に提供(1/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(1/3)まとめ ・前方に進み線路そばの赤い消火栓の後で左折し3ブロック進む、などの指示はAIにとって難しい ・VLN(視覚と言語による案内)と、SDR(特定視点からの空間的記述の解決)が...
画像生成

DermGAN:機械学習トレーニング用に多様な皮膚状態の医療用画像を合成(1/2)

1.DermGAN:機械学習トレーニング用に多様な皮膚状態の医療用画像を合成(1/2)まとめ ・機械学習モデルを様々なケースで使用できるようするために肌の違いを含む多様な学習データが必要 ・肌画像の多様性を改善するためDermGANと呼ばれ...