モデル 人間による評価を使って要約を学ぶ(3/4)
1.人間による評価を使って要約を学ぶ(3/4)まとめ ・初期要約モデル、人間が要約品質を定量化、報酬モデル、RLによる微調整の4ステップで実現 ・要約品質の定量化はラベル付け作業者に高い報酬と緊密な連携を取る事で実現した ・報酬モデルを最適...
モデル
モデル
モデル
モデル
モデル
モデル
モデル
学習手法
学習手法
学習手法
学習手法
学習手法