1.BlenderBot 2.0:長期記憶とインターネット検索能力を合わせ持つチャットボット(2/2)まとめ
・BlenderBot 2.0は検索拡張対応世代モデルで会話に含まれている知識を超えた応答が可能
・学習用の2つのデータセット「Wizard of the Internet」と「Multi-Session Chat」も公開
・BlenderBot 2.0は1.0比で幻覚を9.1%から3.0%に減らし会話全体の一貫性も12%向上
2.BlenderBot 2.0の能力
以下、ai.facebook.comより「Blender Bot 2.0: An open source chatbot that builds long-term memory and searches the internet」の意訳です。元記事の投稿は2021年7月16日、Jason WestonさんとKurt Shusterさんによる投稿です。
アイキャッチ画像のクレジットはPhoto by Jordan on Unsplash
会話能力に合わせて調整したモデル設計
BlenderBot 2.0は、Facebookの「検索拡張対応世代(Retrieval Augmented Generation)」に基づくモデルを使用します。これは、会話自体に含まれている知識を超えた知識を組み入れて対話に応答する事を可能にするアプローチです。
会話中、情報検索コンポーネントとseq2seqジェネレーターを組み合わせたモデルは、長期記憶とインターネット検索で見つけた文書の両方から関連情報を探します。
これを行うために、会話の文脈を指定して関連する検索キーワードを生成する追加のニューラルネットワークモジュールを使用して、従来のencoder-decoderアーキテクチャを強化します。次に、BlenderBot 2.0は、結果として得られた知識を会話履歴に追加します。会話履歴は、Fusion-in-Decoderメソッドを使用してエンコードされます。
最後に、このエンコードされた知識を考慮に入れて、チャットボットは応答を生成します。私たちの手法は、チャットボットの長期記憶領域から情報を取得でき、それに何を追加するかも決定します。これは、会話の文脈に基づいて保存される記憶を生成する追加のニューラルモジュールを使用することによって実現されます。
機械学習モデルの最近の傾向は、これまで以上に大きなモデルをトレーニングしようとする事です。これには、かなりの計算機資源が必要です。これらのモデルは、学習した内容をモデルの重みに格納しようとします。しかし、常に成長し変化し続けているインターネット全体を重みに保存することは、ほぼ不可能に思えます。私たちの方法は、代わりにその場でインターネットにアクセスします。
経験と世界の知識を組み合わせる
ニューラルネットワークをトレーニングするために、クラウドソーシングを使って特別にトレーニングデータを収集しました。そして本日、「Wizard of the Internet」と「Multi-Session Chat」として知られる2つの会話型データセットをリリースします。
(1)Wizard of the Internet
インターネット検索から得た新しい情報で補強された人間との会話
(2)Multi-Session Chat
会話内で得た知識を参照する、長く複数回行われる人間との会話
Wizard of the Internetデータセットは、関連する検索エンジン用のクエリを生成する方法に関してBlenderBot 2.0の教師となり、また、検索結果に基づく関連する応答に関する教師を提供します。
Multi-Session Chatは、新しい知識を長期記憶に保存するチャットボットの教師と、それらの記憶が与えられた場合の関連する応答の教師を提供します。したがって、データセットを組み合わせてマルチタスクトレーニングを実行できます。これにより、BlenderBot2.0はこれらすべてのスキルと同じようにこなす事ができます。
私たちは、新しいチャットボットがその前身の能力に基づいて構築されることを望んでいます。BlenderBot 1.0は、Blended Skill Talkタスクでトレーニングされました。これは、魅力的な個性、知識、共感の表明、そしてこれら3つすべてをシームレスにブレンドします。そのため、BlenderBot 2.0は、これらすべてのリソースでトレーニングされました。
BlenderBot 2.0のテスト
BlenderBot 1.0は、GoogleのMeenaやMicrosoftのGPT-2拡張であるDialoGPTなどの他のチャットボットよりも優れていることがすでに示されています。従って、新しいモデルを評価するために、BlenderBot 1.0をベンチマークとして比較を行い、マルチセッションチャットでの長期的な会話のパフォーマンスと、会話内で知識をうまく活用する能力を評価しました。
人間の評価者によると、以前の会話セッションが中断したところから再開することに関して、BlenderBot 2.0はBlenderBot 1.0を上回ります。エンゲージメントスコアが17%向上し、以前の会話セッションの使用が55%向上したことがわかりました。
これらの結果は、新しいシステムの長期記憶コンポーネントにより、長期間にわたってより良い会話を維持できることを示しています。
知識を使用する能力をテストすると、BlenderBot 2.0は幻覚を9.1%から3.0%に減らし、会話全体での一貫性が12%向上している事がわかりました。インターネットを先を見越して検索する新しいチャットボットの機能により、これらのパフォーマンスが向上します。
BlenderBot 2.0は、インターネットから新しい情報を取得し、それを会話に組み込みます。
安全性
私達は会話エージェントの安全性を真剣に受け止めています。特に、会話エージェントが安全でない、または不快な発話を生成することがあることが知られているためです。
これは、好ましくない応答を引き出すように設計されたプロンプトを人間が意図的に入力として与えた場合に発生する可能性があります。この問題を軽減するために利用可能な手法について大規模な調査を実施し、2つの新しい方法を開発しました。
「焼き付けた安全性(baked-in safety)」と「難しいプロンプトに対する堅牢性(robustness to difficult prompts)」です。
また、研究コミュニティが共に進歩するのを支援するために、一連の対話安全ワークショップを共同開催しています。
私たちの調査によると、これらのアプローチは既存の手法よりも優れています。安全レシピを実装すると、自動分類器で測定した攻撃的な反応が90%減少した一方、実際の人々との会話内での安全な応答の数を74.5%増加しました。
これらの安全対策のレシピをリリースに含めています。さらに、何かを傷つけたり欺いたりする幻覚を持つAIシステムは、現実世界に害を及ぼす可能性があります。人間の評価者によるテストでは、以前の方法と比較して、私たちの方法がこのリスクをある程度軽減することを確認しました。
しかし、安全性の問題はまだ解決されていないことを私たちは知っています。インターネットと長期記憶を利用して会話の応答を実現するというBlenderBot 2.0のアプローチは、新たな安全性の課題をもたらします。
研究コミュニティとして、私たちはそれらに取り組む必要があり、このようなリリースによって可能になった安全性に関する再現可能な研究は、コミュニティがこの分野で重要な新しい進歩を共にするのに役立つと信じています。
今後の展望
ここで紹介したモデルの革新は、現在の最先端のシステムに比べて重要な進歩を遂げています。他の研究者が、長期記憶を構築し、インターネットを検索する、知識を追加するためのBlenderBot2.0の新しい機能をどのように進歩させるかを見て興奮しています。
もちろん、やるべきことはまだあります。モデルの幻覚を減らしましたが、いくつか残っています。
モデルがより深く理解するまで、モデルは時々矛盾します。同様に、私たちのモデルは、何が安全かどうかをまだ完全には理解できていません。
そして、彼らは長期記憶を作り上げますが、それから真に学ぶことはありません。つまり、彼らは自分自身の過ちを改善しません。しかし、私たちはその分野でいくつかの小さな進歩を遂げました。
最後に、人間と同じようにコミュニケーションと理解を行うように構築されたエージェントが、会話だけでなく、視力も持つ事が出来るようになる日を楽しみにしています。私達はこれをMultimodal BlenderBotで調査しています。
そのため、明らかになった次の幾つかのステップは、これらの最新の技術を1つのAIシステムに融合することです。これが私たちのBlenderBot研究の目標です。
チャットボットのこれらの改善により、仮想アシスタントやデジタルフレンドなどのアプリケーションの最先端を進歩させることができると私たちは考えています。このリリースと対応するデータセットが、コミュニティがこれらおよび他の多くの方向に集合的にさらに進歩するのに役立つことを願っています。
3.BlenderBot 2.0:長期記憶とインターネット検索能力を合わせ持つチャットボット(2/2)関連リンク
1)ai.facebook.com
Blender Bot 2.0: An open source chatbot that builds long-term memory and searches the internet
2)parl.ai
BlenderBot 2.0: An open source chatbot that builds long-term memory and searches the internet