nmt

データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)まとめ ・Wikipedia Biographiesによって機械翻訳の性別バイアス削減度合を評価する事が可能になった ・文脈を意識するモデル(contex...
データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)まとめ ・ニューラル機械翻訳は学習データ内の偏見やステレオタイプを翻訳に反映してしまう事がある ・文を個々に翻訳しており、性別情報は必ずしも個々の文内に明...
入門/解説

Google翻訳が性別を決めつけてしまう訳を減らす仕組みを拡大

1.Google翻訳が性別を決めつけてしまう訳を減らす仕組みを拡大まとめ ・Google翻訳は性別固有の表現を持たない言語と持つ言語間で翻訳する際に性別を決めつけてしまう事がある ・2018年12月に「性別固有の翻訳」の仕組みを取り入れたが...
入門/解説

M4:超多言語、大規模ニューラル機械翻訳(1/3)

1.M4:超多言語、大規模ニューラル機械翻訳(1/3)まとめ ・機械翻訳システムの品質は飛躍的に進歩しているが品質は学習用データの量に依存している ・学習用データが少ない言語では学習用データが多い言語ほど品質を向上できていない問題がある ・...
入門/解説

Google翻訳でジェンダー別の翻訳を提供する(2/2)

1.Google翻訳でジェンダー別の翻訳を提供する(1/2)まとめ ・ジェンダー別翻訳が必要と判断されると3パターンの翻訳が作られる ・女性前提の翻訳文と男性前提の翻訳文の品質が高いとそれが表示される ・品質が低いと判断されると従来の翻訳文...