TF-Ranking：ランクキング作成用TensorFlowライブラリ(1/2)

１．TF-Ranking：ランクキング作成用TensorFlowライブラリ(1/2)まとめ

・TensorFlowでlearning-to-rankと呼ばれる教師付き学習でランク付けを実現できるTF-Rankingが発表
・様々な損失関数、複数アイテム、ランキング評価基準最適化など多彩な機能を備える
・大規模データにも適用できるためウェブ検索やニュース推薦などデータ集約型ランキングで利用可能

２．大規模データでもランキングを容易に作成できるTF-Ranking

以下、ai.googleblog.comより「TF-Ranking: A Scalable TensorFlow Library for Learning-to-Rank」の意訳です。元記事は2018年12月5日、Xuanhui WangさんとMichael Benderskyさんによる投稿です。後半はこちら。

ランキングとは、「特定のリストの有用性を最大にするためにリストを並べる手法」と定義され、検索エンジンや推薦システム、機械翻訳、対話型システム、さらには計算生物学に至るまで、様々な広範囲な分野で利用されている手法です。これらのようなアプリケーション(および他の多くのアプリケーション)では、研究者は、しばしばラーニング・ツー・ランク(learning-to-rank)と呼ばれる教師付き学習のテクニックを使用します。

多くの場合、これらのlearning-to-rankのテクニックは非常に大きなデータセットに対して適用されます。そして、そのような大きなデータセットを扱うケースではTensorFlowのスケーラビリティ(大規模データに適応できる能力)が利点になる可能性が高いです。しかし、現在のTensorFlowには、learning-to-rankのテクニックを使用するための、簡単な方法はありません。私達が知る限りでは、learning-to-rankの手法を大規模データに適用することに特化した他のオープンソースライブラリもありません。

本日、私達は、ランク付けのためのスケーラブルなTensorFlowベースのライブラリであるTF-Rankingを発表できる事にワクワクしています。最近発表した論文で説明したように、TF-Rankingは、最先端のlearning-to-rankアルゴリズムを含む使用感が統一されたフレームワークを提供し、ペア値やリスト値に対応する損失関数、複数項目のスコアリング、ランキング評価基準最適化、偏りのないlearning-to-rankをサポートします。

TF-Rankingは高速かつ使いやすく、高品質なランキングモデルを作成します。統一されたフレームワークにより、機械学習の研究者、実践者、愛好者は、単一のライブラリから様々なランキングモデルを利用し、評価し、選択することができます。

更に私たちは、有用なオープンソースライブラリとなるためには、使いやすいデフォルト機能を提供するだけでなく、ユーザーに独自のカスタムモデルを開発する権限を与えることだと強く信じています。したがって、ユーザーが独自のカスタマイズされた損失関数、スコアリング関数、ランキング基準を定義しプラグインとして有効化できる柔軟なAPIを提供します。

既存のアルゴリズムとランキング評価基準のサポート
learning-to-rankアルゴリズムの目的は、損失関数を最小にする事です。損失関数は、ランキングの有用性を表現しています。

つまり、「Aによるランキング」が「Bによるランキング」より有用であれば、「Aによるランキング」を表現する損失関数は「Bによるランキング」を表現する損失関数より小さくなります。ランキングの有用性が増せば損失関数の値が小さくなるように損失関数を設計し、損失関数が最小になる値を探れば、最も有用なランク付けを求める事ができるのです。TF-Rankingは、前述したように、広範囲の標準的な、ポイント毎、ペア毎、リスト毎に対応する損失関数をサポートしています。

これにより、TF-Rankingライブラリを使用している研究者は、従前の評価基準を用いてランキングを再現し、拡張することができます。実務者はそのアプリケーションに最も最適な選択を行うことができます。更に、TF-Rankingはembeddingsの手法により作成した疎な特徴量(自然言語など)を数百万のトレーニングインスタンスを介して処理する事ができます。従って、ウェブ検索やニュース推薦などの実世界のデータ集約型ランキングシステムを構築することに関心がある人は、TF-Rankingを堅牢でスケーラブルなソリューションとして使用できます。

実証的評価は、機械学習や情報検索研究にとって重要です。これまでの研究との互換性を確保するため、MRR(Mean Reciprocal Rank)やNDCG(Normalized Discounted Cumulative Gain)など、よく使用されるランキング評価基準の多くをサポートしています。オープンソースのTensorFlow視覚化ダッシュボードであるTensorBoardでは、トレーニング時にこれらの指標を容易に視覚化することができます。

TensorBoardに表示されるトレーニングステップ(X軸)とNDCG基準(Y軸)の例。
トレーニングに経過と共に向上するランキング基準を示します。異なる基準をダッシュボード上で直接比較することもできるので、基準に基づいて最適なモデルを選択できます。