自己教師

モデル

SPICE:自己教師学習で音の高さを推定

1.SPICE:自己教師学習で音の高さを推定まとめ・メロディーを認識するためには音の高さの変化、つまりピッチの変化を追跡する能力が必要・しかし音の高さをそのまま認識する絶対音感より相対的に認識する相対音感の方が人間の脳でも一般的・SPICE...
入門/解説

VTAB:視覚タスク用のベンチマーク(2/2)

1.VTAB:視覚タスク用のベンチマーク(2/2)まとめ・VTABによる評価では最高パフォーマンスを示した特徴表現学習アルゴリズムはS4L・S4L(Self-Supervised Semi-Supervised Learning)は特に「構...
ロボット

Form2Fit:物体の分解と組立てを行う事でロボットが組合わせの概念を学習(2/3)

1.Form2Fit:物体の分解と組立てを行う事でロボットが組合わせの概念を学習(2/3)まとめ・Form2Fitは吸着、配置、マッチングの3つのネットワークにより構成される・完成品を解体する事は組立より簡単であると言う洞察を元に分解データ...
学習手法

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)まとめ・機械学習で動画内でどのような活動が行われているのかを認識させるのは困難・従来手法では細かくラベル付けされた大量の動画が必要になるがこれは高価・動画内の音声は画像...
入門/解説

TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)

1.TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)まとめ・TCCを使うとポーズ、照明、ボディ、オブジェクトの種類などの差異に関わらず同じ動作を特定できる・そのため、ラベル付き画像が少数しかない状態でアクションの分類や様々なア...
入門/解説

TCC:繰り返し動作に着目して動画を理解する学習手法(1/2)

1.TCC:繰り返し動作に着目して動画を理解する学習手法(1/2)まとめ・特定の順序で行われる動作はキーとなる動作が常に存在し、他の条件が異なっても共通である・例えばワインでもお茶でも水でも注ぐと言う動作には入れ物を手で掴む動作が必ず存在す...
学習手法

集積カプセルオートエンコーダー(1/6)

1.集積カプセルオートエンコーダー(1/6)まとめ・脳が備えている自己教師と帰納的バイアスのお蔭で人間が効率的な学習が可能になっている可能性がある・この直感によって教師なしバージョンのカプセルネットワークが新たに開発された・カプセルネットワ...
ロボット

TossingBot:物理学と深層学習の統合(1/2)

1.TossingBot:物理学と深層学習の統合(1/2)まとめ・非構造化環境でロボットを安全に動作させる事は依然として困難・TossingBotは乱雑な状況で稼働可能なピッキングロボット・投げたオブジェクトが何処に着地したかを観察して学習...
モデル

SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(1/2)

1.SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(1/2)まとめ・現在の強化学習の問題点の1つは人間に比べて学習に非常に時間がかかる事である・人間が効率的に学習できる理由は世界モデルを持っているからと推測されている・モデルベ...
モデル

GANにおけるラベル付きデータの必要性の低減(2/2)

1.GANにおけるラベル付きデータの必要性の低減(2/2)まとめ・回転タスクによって意味のある特徴を学習させた後に更に学習をさせる・これによりサンプル効率が高まり高品質なラベル付けが可能・GANで使う様々な機能をまとめたCompare GA...
モデル

GANにおけるラベル付きデータの必要性の低減(1/2)

1.GANにおけるラベル付きデータの必要性の低減(1/2)まとめ・Conditional GANはトレーニングにラべル付きデータを必要とする・本論文ではGANをトレーニングする際に必要なラベル付きデータ量を減らす・未ラベル付け画像を回転させ...
学習手法

教師無し学習で物体の動きを追跡する人工知能を学習させる

1.教師無し学習で物体の動きを追跡する人工知能を学習させるまとめ・動画の色を利用して動画内の物体の動きを追跡する学習法をGoogleが公開・白黒化した動画を再カラー化させる作業を行わせる事で同時に物体追跡もできるようになった・ラベル付き動画...