translation

AI関連その他

GPT-4は技術文章の翻訳にどこまで使えそうか?

1.GPT-4は技術文章の翻訳にどこまで使えそうか? ・chatGPT(GPT-4指定)であっても、翻訳対象として与えた長文中の一部を全く翻訳しないで飛ばすという現象が割と頻繁にある ・chatGPT(GPT-4指定)であっても、大半の知識...
入門/解説

マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(1/2)

1.マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(1/2)まとめ ・最高のパフォーマンスを発揮するデータサイエンティストは分析以外にソフトスキルを持つ ・最初に重要なメッセージを伝えて、次に重要なメッセージに...
データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)まとめ ・Wikipedia Biographiesによって機械翻訳の性別バイアス削減度合を評価する事が可能になった ・文脈を意識するモデル(contex...
データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)まとめ ・ニューラル機械翻訳は学習データ内の偏見やステレオタイプを翻訳に反映してしまう事がある ・文を個々に翻訳しており、性別情報は必ずしも個々の文内に明...
アプリケーション

Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2)

1.Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2)まとめ ・ストリーミング翻訳モデルはライブ翻訳専用にモデルを再構築する手間がかかる ・マスキングとバイアスを組み合わせた独自の再翻訳アプローチで全体的に性能を向上 ...
モデル

LaBSE:言語に依存しないBERT仕様のEmbedding(2/2)

1.LaBSE:言語に依存しないBERT仕様のEmbedding(2/2)まとめ ・Tatoebaに登録されている言語を使った検証では主要14言語では他の手法と大きな差はなかった ・全112言語を含めてテストを行った場合、従来手法に20%近...
入門/解説

PAWS:自然言語の言い換えの理解を促進する新しいデータセット(2/3)

1.PAWS:自然言語の言い換えの理解を促進する新しいデータセット(2/3)まとめ ・PAWSの作成には「言い換えペアになるかはわからないが意味ある文章を作成する単語交換モデル」を使用 ・単語変換モデルの出力結果を人間の評価者が目で言い換え...
AI関連その他

Google LensのGoogle Goバージョン(2/2)

1.Google LensのGoogle Goバージョン(2/2)まとめ ・OCRエンジンの誤読に備えて、文脈やナレッジグラフから手がかりを得て精度を上げている ・翻訳した文章が元の文章のどの部分に該当するかわかるように着色を行う ・カラオ...
モデル

Translatotron:入力された音声を外国語の音声に直接翻訳する試み(2/2)

1.Translatotron:入力された音声を外国語の音声に直接翻訳する試み(2/2)まとめ ・Translatotronの翻訳品質は現時点ではまだ従来手法のシステムに劣る ・しかし、従来システムでは難しい声質の保存や推論速度の速さなどポ...
入門/解説

Google翻訳でジェンダー別の翻訳を提供する(1/2)

1.Google翻訳でジェンダー別の翻訳を提供する(1/2)まとめ ・単語だけならばジェンダー中立の検出は容易だが明示的な単語がなくてもジェンダー中立になる文が存在 ・これを解決するためにジェンダー別の翻訳を提供するためには3つのステップが...
その他の調査

マイクロソフトの翻訳アプリが新人工知能搭載でオフライン可

1.マイクロソフトの翻訳アプリが新人工知能搭載でオフライン可まとめ ・Microsoftの翻訳アプリがバージョンアップ、オフラインでも使用可能に ・新しい人工知能のアプローチで従来製品より劇的に改良と言う ・Amazon Fire、Andr...