transformer model

学習手法

学習用データが非常に少ない言語で機械翻訳を実現した手法(1/2)

1.学習用データが非常に少ない言語で機械翻訳を実現した手法(1/2)まとめ ・機械翻訳サービスは大多数の人が話す言語をカバーしているが数としては合計100言語程度 ・100言語は世界で話されている言語の1%強に過ぎず地域もヨーロッパ系に偏っ...
モデル

Image GPT:自然言語処理用の人工知能で画像を生成(1/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(1/3)まとめ ・文章生成で有名になった人工知能を画像でトレーニングすると品質の高い画像を生成できた ・iGPTと名付けられたこのモデルは物体の外観など画像の特性を理解しているよ...
入門/解説

PEGASUS:文章要約を行う最先端の人工知能(1/3)

1.PEGASUS:文章要約を行う最先端の人工知能(1/3)まとめ ・従来の自然言語の事前トレーニングは様々な下流タスクに流用できるように汎用的な目的だった ・事前トレーニングを最終的に実行するタスクに近づけたらパフォーマンスがどうなるか疑...
学習手法

AdvGen:ニューラル機械翻訳を堅牢にするために敵対的サンプルを利用(2/2)

1.AdvGen:ニューラル機械翻訳を堅牢にするために敵対的サンプルを利用(2/2)まとめ ・AdvGenの出力する敵対的サンプルを利用して堅牢性の損失が計算され、モデルにフィードバックされる ・AdvGenを用いた学習によりニューラル機械...