safety

脚式ロボットが学習時に転倒して破損しないようにする(3/3)

１．脚式ロボットが学習時に転倒して破損しないようにする(3/3)まとめ・2脚バランスタスクでは2脚だけで最大4回ジャンプしてバランスを維持することができた・実世界で自律的かつ安全にロボットが脚式運動スキルを学習できることが示唆された。・現時...

2022.05.23

ロボット学習手法

１．脚式ロボットが学習時に転倒して破損しないようにする(2/3)まとめ・ロボットを使い効率的歩行、キャットウォーク、2脚バランスタスクで実験を行った・学習者ポリシーは安全回復ポリシーを発動する必要性を回避しながら学習できた・安全トリガーセッ...

2022.05.22

ロボット学習手法

１．脚式ロボットが学習時に転倒して破損しないようにする(1/3)まとめ・脚式ロボットはは本質的に不安定であり学習中にロボットが転倒し破損する可能性がある・仮想空間で学習させる事もできるが現実世界に転移学習する際に微妙な違いが問題を引き起こす...

2022.05.21

ロボット学習手法

１．LaMDA：人間より機知に富んだ会話が可能な対話モデル(2/2)まとめ・品質指標は微調整の有無にかかわらず、モデルパラメータの数とともに一般に改善する・根拠性はモデルサイズが大きくなると向上するが外部の知識源を参照する事が可能・微調整を...

2022.01.28

モデル

１．LaMDA：人間より機知に富んだ会話が可能な対話モデル(1/2)まとめ・LaMDAは最大1370億のパラメータを持つ対話に特化したニューラル言語モデル・微調整を行い外部の知識ソースを活用する方法をモデルを教えて品質を向上した・品質は分別...

2022.01.27

モデル

１．取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(2/3)まとめ・強化学習に可逆性を統合する手法として探索のRAEと制御のRACを提案した・RAEとRACの重要な違いはRAEは可逆的な動作を推奨するだけで禁止していない事...

2021.11.16

学習手法

１．BlenderBot 2.0：長期記憶とインターネット検索能力を合わせ持つチャットボット(2/2)まとめ・BlenderBot 2.0は検索拡張対応世代モデルで会話に含まれている知識を超えた応答が可能・学習用の２つのデータセット「Wiz...

2021.08.04

アプリケーション

１．Project Guideline：視力の弱い人が一人で走れるようにする(1/2)まとめ・失明または弱視状態の人にとって支援者なしに一人でランニングすることは困難・Project Guidelineは路面に案内線が塗装されている様々な環...

2021.05.28

アプリケーション公平性

１．Uberの自動運転は人工知能が歩行者を無視した事が原因まとめ・自動運転車の初の死亡事故として報道されたUberの事故は人工知能が原因と判明・レーダーは歩行者を検知していたが人工知能がそれを無視してしまったとの事・現時点ではまだ詳細な原因...

2018.05.21

その他の分野