人工知能/機械学習

LabelDP：秘匿対象をラベルに限定する事で差分プライバシーの精度を向上(1/2)

１．LabelDP：秘匿対象をラベルに限定する事で差分プライバシーの精度を向上(1/2)まとめ・米国国勢調査も採用している差分プライバシーは製品を実世界に展開する際に良く使われる・差分プライバシーを使うとシステムがプライバシーをどの程度...

2022.06.07

プライバシー学習手法

１．CoCa：様々な視覚タスクのバックボーンとして利用できる基盤モデル(2/2)まとめ・CoCaモデルは、最小限の改造で多くのタスクに対して直接微調整を行うことが可能・CoCaは画像分類やクロスモーダル検索などのゼロショットでも最先端モ...

2022.06.06

モデル学習手法

１．CoCa：様々な視覚タスクのバックボーンとして利用できる基盤モデル(1/2)まとめ・機械学習モデルは幅広いタスクに対応可能な大規模基盤モデルを元に設計する事が多い・自然言語処理では、BERT、T5、GPT-3などの事前学習済大規模モ...

2022.06.05

モデル学習手法

１．30億のパラメータを持つ巨大モデルを学習させた際の知見まとめ・非常に巨大なモデルを学習させる際は混合精度と全精度で違いが出る可能性がある・通常の学習では問題は発生しないが学習の収束が見込めるトレーニングの後半に出る・DALL·E ...

2022.06.04

画像生成学習手法

１．ViT-VQGAN：画像量子化技術を再考して画像生成と画像理解の性能を向上(2/2)まとめ・VIMは犬や猫など与えられた特定のクラスの画像を合成するクラス条件付き生成が可能・画像理解タスクでも分類精度を60.3%(iGPT-L)から...

2022.06.03

モデル

１．ViT-VQGAN：画像量子化技術を再考して画像生成と画像理解の性能を向上(1/2)まとめ・事前学習は入力信号が文章である事を仮定しないので量子化すれば画像も扱う事が可能・画像を離散トークンにエンコードし、それをCNNまたはTran...

2022.06.02

モデル

１．言語モデルに思考の連鎖を促し推論能力を向上(2/2)まとめ・算術的推論は標準的なプロンプトでは比較的平坦に規模拡大と共に性能が向上する・思考の連鎖プロンプトではモデル規模を大きくすると標準プロンプトを大幅に上回った・追加の改良を行...

2022.05.27

基礎理論

１．言語モデルに思考の連鎖を促し推論能力を向上(1/2)まとめ・大規模言語モデルは数学の文章問題など段階的に思考していく事が必要なタスクで苦戦する・思考連鎖プロンプトはモデルに問題を中間ステップに分割して段階的に考える事を促す新手法・...

2022.05.26

基礎理論

１．学習用データが非常に少ない言語で機械翻訳を実現した手法(2/2)まとめ・単一巨大モデルを高リソース言語の翻訳タスクと低リソース言語のMASSタスクで訓練した・入力が同じ言語で不明瞭な文章か、まったく別の言語かはモデルからすれば大きな...

2022.05.25

学習手法

１．学習用データが非常に少ない言語で機械翻訳を実現した手法(1/2)まとめ・機械翻訳サービスは大多数の人が話す言語をカバーしているが数としては合計100言語程度・100言語は世界で話されている言語の1%強に過ぎず地域もヨーロッパ系に偏っ...

2022.05.24

学習手法

１．脚式ロボットが学習時に転倒して破損しないようにする(3/3)まとめ・2脚バランスタスクでは2脚だけで最大4回ジャンプしてバランスを維持することができた・実世界で自律的かつ安全にロボットが脚式運動スキルを学習できることが示唆された。 ...

2022.05.23

ロボット学習手法

１．脚式ロボットが学習時に転倒して破損しないようにする(2/3)まとめ・ロボットを使い効率的歩行、キャットウォーク、2脚バランスタスクで実験を行った・学習者ポリシーは安全回復ポリシーを発動する必要性を回避しながら学習できた・安全トリガ...

2022.05.22

ロボット学習手法