人工知能/機械学習

学習手法

Pixel 4のタッチ操作を機械学習で改良(1/2)

1.Pixel 4のタッチ操作を機械学習で改良(1/2)まとめ ・長押し操作はユーザーの行動とシステムの応答を切り離すためユーザ体験に悪影響 ・ユーザー操作のサンプルデータからユーザ操作を推測できる機械学習モデルを設計 ・最近のアップデート...
モデル

RepNet:人工知能で動画内の反復行動を数える(2/2)

1.RepNet:人工知能で動画内の反復行動を数える(2/2) ・RepNetは反復行動動画を合成し、更に軸をずらしてカメラの動きを摸倣した合成データで学習した ・特定の反復行動にとらわれず多くの異なる領域で反復動作を数える事ができるモデル...
モデル

RepNet:人工知能で動画内の反復行動を数える(1/2)

1.RepNet:人工知能で動画内の反復行動を数える(1/2) ・月の満ち欠けや心拍や呼吸、製造ラインや交通パターンなどの反復行動は現実世界で一般的 ・反復行動を理解する事でより複雑な行動パターンを認識できたり様々な洞察を得る事ができる ・...
モデル

自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)

1.自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)まとめ ・同じ音声のembeddingは、別の音声のembeddingよりembedding空間内で近い場所に位置するはず ・これを利用しBERTと同様なデータ自体の構造にのみ依...
学習手法

自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)

1.自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)まとめ ・非セマンティックタスクとは、声の調子など、人間の音声の「意味以外の側面」に焦点を当てたタスク ・従来のベンチマークでは非セマンティックタスク用の特徴表現が有用か否かを比...
学習手法

AttentionAgent:重要度が低い情報を無視する強化学習エージェント(1/2)

1.AttentionAgent:重要度が低い情報を無視する強化学習エージェント(1/2)まとめ ・人間は選択的注意の仕組みにより膨大な情報を圧縮し意思していると考えられている ・強化学習エージェントは逆に全視覚情報に加えて将来予測まで情報...
学会

CVPR 2020におけるGoogleの存在感

1.CVPR 2020におけるGoogleの存在感まとめ ・6/14 - 6/19の間インターネット上のヴァーチャルイベントとしてCVPR 2020が開催 ・Google社員も多数参加し70近くの受理された出版物やワークショップを開催 ・本...
学習手法

定型書式から必要な情報を自動で抽出(2/2)

1.定型書式から必要な情報を自動で抽出(2/2)まとめ ・モデルはほとんどの項目でうまく機能したがdelivery_date(配達日)には改善の余地があった ・これは今回使用した学習データにはdelivery_dateが余り含まれていなかっ...
モデル

GPT-3がAPI経由で利用可能に

1.GPT-3がAPI経由で利用可能にまとめ ・GPT-2比で100倍近い性能を持つと推測されるGPT-3が発表されAPI経由で使用可能になる ・テキストを入力するとテキストを出力するという非常に汎用的なAPIで微調整も可能 ・現時点では限...
学習手法

DADS:教師なしで有用なスキルを発見する強化学習(2/2)

1.DADS:教師なしで有用なスキルを発見する強化学習(2/2)まとめ ・DADSは環境にとらわれないため、ロボット移動タスクにも操作タスクにも適用可能 ・スキルに追加のトレーニングが必要ないため、サンプル効率が非常に高く追加トレーニングが...
学習手法

DADS:教師なしで有用なスキルを発見する強化学習(1/2)

1.DADS:教師なしで有用なスキルを発見する強化学習(1/2)まとめ ・教師有り強化学習はシミュレーション環境を飛び出して現実世界の複雑な動作を学習できるようになった ・しかし、様々なタスク用に報酬関数を手動で設計する必要がありこれがボト...
基礎理論

Big Transfer(BiT):視覚タスクで大規模な事前トレーニングを活用(3/3)

1.Big Transfer(BiT):視覚タスクで大規模な事前トレーニングを活用(3/3)まとめ ・標準的な視覚タスクベンチマークでBiT-Lを評価し少数セット設定でなくとも効果的である事が判明 ・タスク毎にハイパーパラメータを調整をせず...