dataset

データセット

SGD:スキーマガイド付き対話学習用データセット(2/2)

1.SGD:スキーマガイド付き対話学習用データセット(2/2)まとめ ・SGDデータセットは関数とそのパラメータをリスト化するマスタースキーマアプローチを採用していない ・代わりにスキーマガイドアプローチを採用しスキーマの特徴表現を学習させ...
データセット

SGD:スキーマガイド付き対話学習用データセット(1/2)

1.SGD:スキーマガイド付き対話学習用データセット(1/2)まとめ ・バーチャルアシスタントの保守運用や機能追加の難しさは適切なデータセットがない事が一因 ・Schema-Guided Dialogueデータセット(SGD)はこの問題に対...
入門/解説

PAWS:自然言語の言い換えの理解を促進する新しいデータセット(3/3)

1.PAWS:自然言語の言い換えの理解を促進する新しいデータセット(3/3)まとめ ・BERTなどの強力なモデルはPAWSでトレーニングすると大幅に性能が向上 ・BOWなどの文脈情報を学習できないモデルではPAWSを使っても性能向上せず ・...
入門/解説

PAWS:自然言語の言い換えの理解を促進する新しいデータセット(2/3)

1.PAWS:自然言語の言い換えの理解を促進する新しいデータセット(2/3)まとめ ・PAWSの作成には「言い換えペアになるかはわからないが意味ある文章を作成する単語交換モデル」を使用 ・単語変換モデルの出力結果を人間の評価者が目で言い換え...
ビッグデータ

PAWS:自然言語の言い換えの理解を促進する新しいデータセット(1/3)

1.PAWS:自然言語の言い換えの理解を促進する新しいデータセット(1/3)まとめ ・語順が変わっても意味が変わらないフレーズを言い換えペア、意味が変わるペアを非言い換えペアと言う ・言い換えペアと非言い換えペアの識別は最先端のモデルでも苦...
その他

自然言語による対話を訓練するための2つの新しいデータセット

1.自然言語による対話を訓練するための2つの新しいデータセットまとめ ・デジタルアシスタントの対話能力向上に利用できるデータセットが公開 ・人間同士の対話に基づいているため現実世界の対話により近いデータ ・好みに関する対話のCCPEと特定タ...
モデル

MediaPipeを利用してオンデバイスでリアルタイムに手の動きを知覚(2/2)

1.MediaPipeを利用してオンデバイスでリアルタイムに手の動きを知覚(2/2)まとめ ・手の形状を認識するランドマークモデルは手動でラベル付けされたデータに加えて合成画像も使用 ・純粋な合成画像では一般化性能が低下するため混合トレーニ...
学習手法

Project Euphoniaの非標準音声用のパーソナライズされた音声認識(2/2)

1.Project Euphoniaの非標準音声用にパーソナライズした音声認識(2/2)まとめ ・部調整モデルはASLスピーチに関しては、ベースラインモデルに比べてかなり改善する事が検証された ・2つのレイヤーの微調整だけで全体を微調整した...
入門/解説

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(6/6)

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(6/6)まとめ ・GWASkbの作成に使用されたシステムは、Snorkel IEフレームワークの上にPythonで実装されている ・本システムは少数の誤検出を発生させるため、全て...
入門/解説

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(4/6)

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(4/6)まとめ ・GWASkbは多くのアプリケーションに有用なレベルで手動キュレーションDBに掲載された8割を自動収集 ・GWASkb手動キュレーションDBに掲載されていないが有...
入門/解説

TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)

1.TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)まとめ ・TCCを使うとポーズ、照明、ボディ、オブジェクトの種類などの差異に関わらず同じ動作を特定できる ・そのため、ラベル付き画像が少数しかない状態でアクションの分類や様々...
ビッグデータ

YouTube-8Mセグメントデータセットの発表

1.YouTube-8Mセグメントデータセットの発表まとめ ・従来のYouTube-8Mデータセットは機械的に付与したラベルと同程度の品質のビデオレベルラベルであった ・YouTube-8Mセグメントデータは人間が目で付与した時間的に特定さ...