データセット

データセット

CVSS:大規模多言語音声間翻訳データセット(2/2)

1.CVSS:大規模多言語音声間翻訳データセット(2/2)まとめ ・CVSSは翻訳音声の他に、翻訳音声の発音に合わせた正規化された翻訳文も提供 ・CVSSはCreative Commons Attribution 4.0 Internati...
データセット

CVSS:大規模多言語音声間翻訳データセット(1/2)

1.CVSS:大規模多言語音声間翻訳データセット(1/2)まとめ ・ある言語の音声を別の言語の音声に自動翻訳する事を音声合成翻訳(S2ST)という ・S2STは直接翻訳するタイプと複数システムを連結して実現する2種が存在する ・直接型のS2...
データセット

データセット蒸留による機械学習モデルの効率的なトレーニング(2/2)

1.データセット蒸留による機械学習モデルの効率的なトレーニング(2/2)まとめ ・蒸留したデータセットは、画像分類データセットにおいて最先端の性能を達成 ・分散システムを利用してデータセットは数百のGPUを利用して作成した ・蒸留したデータ...
データセット

データセット蒸留による機械学習モデルの効率的なトレーニング(1/2)

1.データセット蒸留による機械学習モデルの効率的なトレーニング(1/2)まとめ ・蒸留はトレーニングを効率的に行うためのアイディアでモデルとデータセットが対象となる ・蒸留したデータセットでモデルを学習させるとメモリと計算量を減らすことがで...
データセット

RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(2/2)

1.RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(2/2)まとめ ・RLDSはEnvLoggerやRLDS CreatorなどのツールでRL用データの収集を楽にする ・RLDSはデータセット共有ライブラリであるTF...
データセット

RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(1/2)

1.RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(1/2)まとめ ・強化学習アルゴリズムの多くはエージェントが環境と大量に相互作用する学習データが必要 ・他で収集されたデータセットを再利用する事もできるが仕様がバラ...
データセット

GoEmotions:きめ細かい感情分類を行うためのデータセット(2/2)

1.GoEmotions:きめ細かい感情分類を行うためのデータセット(2/2)まとめ ・クラスタリングすると曖昧な感情はポジティブな感情に関係している事が判明 ・喜びと興奮、緊張と恐怖、悲しみと嘆き、苛立ちと怒りなども密接な相関関係 ・絵文...
データセット

GoEmotions:きめ細かい感情分類を行うためのデータセット(1/2)

1.GoEmotions:きめ細かい感情分類を行うためのデータセット(1/2)まとめ ・感情分類は1992年に提案された6つの基本的な感情を対象とする場合が多い ・GoEmotionsは12ポジティブ、11ネガティブ、4あいまい、1中立の感...
データセット

WIT:ウィキペディアベースの画像-テキストデータセット(2/2)

1.WIT:ウィキペディアベースの画像-テキストデータセット(2/2)まとめ ・WITは108言語のデータを備えた、初の大規模多言語マルチモーダルデータセット ・WITは文脈情報を提供する初のデータセットで文脈の影響をモデル化するのに役立つ...
データセット

WIT:ウィキペディアベースの画像-テキストデータセット(1/2)

1.WIT:ウィキペディアベースの画像-テキストデータセット(1/2)まとめ ・テキストにも視覚にも対応できるマルチモーダルなモデルは豊富なデータを必要とする ・既存のデータセットは質と量の両立が出来ておらず英語以外の言語への対応も不足 ・...
データセット

発声に困難を抱える人の音声コミュニケーションを支援するモデル用のデータセットの開発(2/2)

1.発声に困難を抱える人の音声コミュニケーションを支援するモデル用のデータセットの開発(2/2)まとめ ・全体的にパーソナライズ手法は全重症度レベルと条件にわたって大幅な改善をもたらした ・個人向けに最適化されたASRモデルの単語誤り率は人...
データセット

発声に困難を抱える人の音声コミュニケーションを支援するモデル用のデータセットの開発(1/2)

1.発声に困難を抱える人の音声コミュニケーションを支援するモデル用のデータセットの開発(1/2)まとめ ・自動音声認識(ASR)テクノロジーは発声に困難を持つ個人を支援する可能性を秘めている ・ASRの精度向上は著しいが発声に困難を持つ個人...