自己教師学習

モデル

SPICE:自己教師学習で音の高さを推定

1.SPICE:自己教師学習で音の高さを推定まとめ ・メロディーを認識するためには音の高さの変化、つまりピッチの変化を追跡する能力が必要 ・しかし音の高さをそのまま認識する絶対音感より相対的に認識する相対音感の方が人間の脳でも一般的 ・SP...
入門/解説

VTAB:視覚タスク用のベンチマーク(2/2)

1.VTAB:視覚タスク用のベンチマーク(2/2)まとめ ・VTABによる評価では最高パフォーマンスを示した特徴表現学習アルゴリズムはS4L ・S4L(Self-Supervised Semi-Supervised Learning)は特に...
ロボット

Form2Fit:物体の分解と組立てを行う事でロボットが組合わせの概念を学習(2/3)

1.Form2Fit:物体の分解と組立てを行う事でロボットが組合わせの概念を学習(2/3)まとめ ・Form2Fitは吸着、配置、マッチングの3つのネットワークにより構成される ・完成品を解体する事は組立より簡単であると言う洞察を元に分解デ...
学習手法

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)まとめ ・機械学習で動画内でどのような活動が行われているのかを認識させるのは困難 ・従来手法では細かくラベル付けされた大量の動画が必要になるがこれは高価 ・動画内の音声...
モデル

GANにおけるラベル付きデータの必要性の低減(2/2)

1.GANにおけるラベル付きデータの必要性の低減(2/2)まとめ ・回転タスクによって意味のある特徴を学習させた後に更に学習をさせる ・これによりサンプル効率が高まり高品質なラベル付けが可能 ・GANで使う様々な機能をまとめたCompare...