学習手法

学習手法

Pixel 4のタッチ操作を機械学習で改良(1/2)

1.Pixel 4のタッチ操作を機械学習で改良(1/2)まとめ ・長押し操作はユーザーの行動とシステムの応答を切り離すためユーザ体験に悪影響 ・ユーザー操作のサンプルデータからユーザ操作を推測できる機械学習モデルを設計 ・最近のアップデート...
学習手法

自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)

1.自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)まとめ ・非セマンティックタスクとは、声の調子など、人間の音声の「意味以外の側面」に焦点を当てたタスク ・従来のベンチマークでは非セマンティックタスク用の特徴表現が有用か否かを比...
学習手法

AttentionAgent:重要度が低い情報を無視する強化学習エージェント(1/2)

1.AttentionAgent:重要度が低い情報を無視する強化学習エージェント(1/2)まとめ ・人間は選択的注意の仕組みにより膨大な情報を圧縮し意思していると考えられている ・強化学習エージェントは逆に全視覚情報に加えて将来予測まで情報...
学習手法

定型書式から必要な情報を自動で抽出(2/2)

1.定型書式から必要な情報を自動で抽出(2/2)まとめ ・モデルはほとんどの項目でうまく機能したがdelivery_date(配達日)には改善の余地があった ・これは今回使用した学習データにはdelivery_dateが余り含まれていなかっ...
学習手法

DADS:教師なしで有用なスキルを発見する強化学習(2/2)

1.DADS:教師なしで有用なスキルを発見する強化学習(2/2)まとめ ・DADSは環境にとらわれないため、ロボット移動タスクにも操作タスクにも適用可能 ・スキルに追加のトレーニングが必要ないため、サンプル効率が非常に高く追加トレーニングが...
学習手法

DADS:教師なしで有用なスキルを発見する強化学習(1/2)

1.DADS:教師なしで有用なスキルを発見する強化学習(1/2)まとめ ・教師有り強化学習はシミュレーション環境を飛び出して現実世界の複雑な動作を学習できるようになった ・しかし、様々なタスク用に報酬関数を手動で設計する必要がありこれがボト...
学習手法

Big Transfer(BiT):視覚タスクで大規模な事前トレーニングを活用(2/3)

1.Big Transfer(BiT):視覚タスクで大規模な事前トレーニングを活用(2/3)まとめ ・BERTと同様にBiTも事前トレーニング済みのモデルを下流タスク用データで微調整をして転移学習する ・事前トレーニングで使用する画像の量と...
学習手法

Big Transfer(BiT):視覚タスクで大規模な事前トレーニングを活用(1/3)

1.Big Transfer(BiT):視覚タスクで大規模な事前トレーニングを活用(1/3)まとめ ・視覚タスクにおけるラベル付きデータの欠如を軽減する一般的なアプローチは事前学習 ・事前学習は実際にかなりうまく機能するが非常に大規模データ...
学習手法

Data Echoing:バッチデータを再利用する事でアクセラレータを最大限に活用(1/2)

1.Data Echoing:バッチデータを再利用する事でアクセラレータを最大限に活用(1/2)まとめ ・アクセラレータは並行して処理を増やす事とトレーニングをより速く処理する事で学習速度を向上できる ・並行して処理には限界がある事がわかっ...
学習手法

深層強化学習の力でロボットが俊敏で知的な移動を実現(2/3)

1.深層強化学習の力でロボットが俊敏で知的な移動を実現(2/3)まとめ ・ロボットにオフィス内を移動させる等の複雑なタスクは速度、方向、高さを複数回調整する必要がある ・従来は複雑なタスクを複数の階層的小タスクに分解することで解決していたが...
学習手法

深層強化学習の力でロボットが俊敏で知的な移動を実現(1/3)

1.深層強化学習の力でロボットが俊敏で知的な移動を実現(1/3)まとめ ・強化学習のサンプル効率の悪さは依然として多くのアルゴリズムにとって主要なボトルネック ・脚式ロボットのためのデータ効率の良い強化学習として効率的な学習方法を発表 ・必...
学習手法

深層強化学習を使って半導体チップの設計を自動化

1.深層強化学習を使って半導体チップの設計を自動化 ・機械学習に専用ハードウェアを使用する事が増えているがチップ設計に数年単位の時間がかかる ・チップ設計を強化学習に行わせて、過去の経験から学び、時間をかけて改善するアプローチを実現 ・これ...