human feedback

評価が難しい作業を実行するAIを人間が評価しやすくする工夫

１．評価が難しい作業を実行するAIを人間が評価しやすくする工夫まとめ・AIが意図しなかった動作をしてしまう事は合致問題(alignment problem)として知られる・合致問題は「モデルの出力を人間が評価する事が困難または時間がかか...

2021.09.25

基礎理論

１．人間による評価を使って要約を学ぶ(3/4)まとめ・初期要約モデル、人間が要約品質を定量化、報酬モデル、RLによる微調整の4ステップで実現・要約品質の定量化はラベル付け作業者に高い報酬と緊密な連携を取る事で実現した・報酬モデルを最適...

2020.10.31

モデル学習手法

１．人間による評価を使って要約を学ぶ(1/4)まとめ・人間による評価を強化学習に取り込んで優れた要約文を書き上げる言語モデルを開発・人間による評価モデルは巨大な教師ありモデルや人間が作成した要約よりも優れていた・本研究は長期的にはAI...

2020.10.29

モデル