1.SGD:スキーマガイド付き対話学習用データセット(2/2)まとめ
・SGDデータセットは関数とそのパラメータをリスト化するマスタースキーマアプローチを採用していない
・代わりにスキーマガイドアプローチを採用しスキーマの特徴表現を学習させ対話システムへの追加入力とする
・このスキーマガイドアプローチによりトレーニングデータに存在しない新しいサービスへの対応が可能
2.スキーマガイドアプローチ
以下、ai.googleblog.comより「Introducing the Schema-Guided Dialogue Dataset for Conversational Assistants」の意訳です。元記事の投稿は2019年10月28日、Abhinav RastogiさんとPranav Khaitanさんによる投稿です。
SGDデータセットが利用できるようになったため、仮想アシスタントをトレーニングして、Webで利用可能な多様なサービスをサポートできるようになりました。
これを行う一般的なアプローチでは、「サポートされている全ての関数とそのパラメータをリストした大規模な関数定義(マスタースキーマ)」が必要です。ただし、考えられるすべてのユースケースに対応するマスタースキーマを開発することは困難です。その問題が解決されたとしても、マスタースキーマは新規または小規模のサービスの統合を複雑にし、アシスタントのメンテナンス作業を増加させます。
更に、たとえば映画チケット、フライトチケット、コンサートチケットの枚数を照会または指定するためのロジックの類似性など、サービス全体に共通してモデル化できる類似の概念が多数あります。しかし、マスタースキーマアプローチは、それらの間の共通性を明示的に手動で定義しない限り、概念を共通して扱えるようなモデリングの促進に繋がりません。
私たちが提案する新しいスキーマガイドアプローチは、これらの制限に対処します。この方法では、アシスタントのマスタースキーマを定義する必要はありません。
代わりに、各サービスまたはAPIは、その「スキーマにリストされている関数」と「それらに関連付けられた属性」の自然言語による説明を提供します。 次に、これらの説明を使用して、スキーマの分散セマンティック特徴表現(distributed semantic representation of the schema)を学習し、これを対話システムへの追加入力として使用します。
対話システムは、領域またはサービス固有のパラメータを含まない単一の統合モデルとして実装されます。この統合モデルにより、異なるサービス間の類似概念を共通表現する事が容易になり、スキーマの分散特徴表現の使用により、トレーニングデータに存在しない新しいサービスへの対応が可能になります。このアプローチは、オープンソースの対話状態追跡モデルに実装されGithubで公開されています。
第8回対話システム技術コンペ
ダイアログシステムテクノロジーチャレンジ(DSTC)は、新しいダイアログテクノロジーの開発を促進するための一連の研究コンテストです。 今年、Googleは、最近締結された8回目のDSTCの一環として、トラックの1つである「スキーマガイド付きの対話状態の追跡」を開催しました。 AAAI-20のDSTC8ワークショップで発表され、産業界と学術界の合計25チームからの提出物を受け取りました。
このデータセットは、大規模な対話モデルを構築するための優れたベンチマークとして機能すると考えています。 私たちは、研究コミュニティが対話技術の進歩のためにこれを使用して実現する全ての革新的な方法を楽しみにしています。
謝辞
この投稿は、共著者のXiaoxue Zang、Srinivas Sunkara、およびRaghav Guptaの研究を反映しています。 また、データの収集を支援してくれたAmir FayaziとMaria Wang、およびモデルの設計と実装に関する洞察についてGuan-Lin Chaoにも感謝します。
3.SGD:スキーマガイド付き対話学習用データセット(2/2)関連リンク
1)ai.googleblog.com
Introducing the Schema-Guided Dialogue Dataset for Conversational Assistants
2)arxiv.org
Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset
3)github.com
google-research/schema_guided_dst
4)sites.google.com
The Eighth Dialog System Technology Challenge
コメント