学習手法

学習手法

学習用データが非常に少ない言語で機械翻訳を実現した手法(1/2)

1.学習用データが非常に少ない言語で機械翻訳を実現した手法(1/2)まとめ ・機械翻訳サービスは大多数の人が話す言語をカバーしているが数としては合計100言語程度 ・100言語は世界で話されている言語の1%強に過ぎず地域もヨーロッパ系に偏っ...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(3/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(3/3)まとめ ・2脚バランスタスクでは2脚だけで最大4回ジャンプしてバランスを維持することができた ・実世界で自律的かつ安全にロボットが脚式運動スキルを学習できることが示唆された。 ...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(2/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(2/3)まとめ ・ロボットを使い効率的歩行、キャットウォーク、2脚バランスタスクで実験を行った ・学習者ポリシーは安全回復ポリシーを発動する必要性を回避しながら学習できた ・安全トリガ...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(1/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(1/3)まとめ ・脚式ロボットはは本質的に不安定であり学習中にロボットが転倒し破損する可能性がある ・仮想空間で学習させる事もできるが現実世界に転移学習する際に微妙な違いが問題を引き起...
学習手法

GraphWorld:グラフニューラルネットワーク用データセットを自動生成(2/2)

1.GraphWorld:グラフニューラルネットワーク用データセットを自動生成(2/2)まとめ ・GraphWorldは標準的なデータセットがカバーする領域を超える範囲のデータを生成 ・グラフが学術的なベンチマークセットと異なるとGNNモデ...
学習手法

GraphWorld:グラフニューラルネットワーク用データセットを自動生成(1/2)

1.GraphWorld:グラフニューラルネットワーク用データセットを自動生成(1/2)まとめ ・グラフニューラルネットワークは人気が高まっているがベンチマークセットは多くない ・グラフは相互接続性や接続の偏りなどで様々な形を持つが既存ベン...
学習手法

Alpa:わずか1行でJAXニューラルネットワークを並列化(2/2)

1.Alpa:わずか1行でJAXニューラルネットワークを並列化(2/2)まとめ ・Alpaは標準的な専門家が設計したTransformerモデルでは最高のフレームワークに匹敵する ・mixture-of-expert層を持つTransfor...
学習手法

Alpa:わずか1行でJAXニューラルネットワークを並列化(1/2)

1.Alpa:わずか1行でJAXニューラルネットワークを並列化(1/2)まとめ ・データ並列を行うと複数アクセラレータで並列処理できるのでモデルの規模拡大が可能 ・しかし、最近の大規模モデルはデータ並列では間に合わずモデル並列処理が必要にな...
ロボット

VFS:強化学習で長期目線が必要な行動を実現(2/2)

1.VFS:強化学習で長期目線が必要な行動を実現(2/2)まとめ ・各遷移に影響を与えその結果を予測するために必要な機能情報はVFS特徴表現内にある ・原理的には高レベルのエージェントがすべてのスキルを連鎖させる事が可能になる ・VFSは風...
モデル

Pix2Seq:言語モデルを使って物体検出を行う(2/2)

1.Pix2Seq:言語モデルを使って物体検出を行う(2/2)まとめ ・Pix2Seqでは物体検出を言語モデリングタスクとみなしており特別な設計をしていない ・システムの出力が比較的簡潔なトークンの並びで表現されるような領域に応用可能 ・幅...
モデル

Pix2Seq:言語モデルを使って物体検出を行う(1/2)

1.Pix2Seq:言語モデルを使って物体検出を行う(1/2)まとめ ・物体検出タスクを行う従来のアプローチは高度にカスタマイズされており汎用性がない ・物体検出タスクを画素を入力とする言語モデリングタスクとみなすPix2Seqを考案 ・P...
学習手法

FormNet:書式に基づいた文書理解を実現(2/2)

1.FormNet:書式に基づいた文書理解を実現(2/2)まとめ ・FormNetは多くの代替案に欠けている数学的正しさを備えていると見なせる ・新しいRichAtt機構とスーパートークンにより優れたフォーム理解能力を発揮可能 ・FormN...