人工知能/機械学習

アプリケーション

VTN:Transformerを使用した文書レイアウトの自動化(2/2)

1.VTN:Transformerを使用した文書レイアウトの自動化(2/2)まとめ ・レイアウトの品質と多様性という2つの基準に従ってVTNのパフォーマンスを評価 ・従来の研究は配置ルールに準拠できなかったり多様性に問題があったがVTNは克...
アプリケーション

VTN:Transformerを使用した文書レイアウトの自動化(1/2)

1.VTN:Transformerを使用した文書レイアウトの自動化(1/2)まとめ ・レイアウトやデザインルールは従う事は簡単だが例外があるため明確に定義することは困難 ・機械学習を使った自動デザインはレイアウト要素間の定義情報がないと新要...
学習手法

SupCon:対照学習を教師有り学習に拡張(2/2)

1.SupCon:対照学習を教師有り学習に拡張(2/2)まとめ ・SupConは他の手法と比較して様々なデータセットでtop1精度を一貫して向上させる ・SupConはAutoAugment、RandAugment、およびCutMixを一貫...
学習手法

SupCon:対照学習を教師有り学習に拡張(1/2)

1.SupCon:対照学習を教師有り学習に拡張(1/2)まとめ ・自己教師あり特徴表現学習は対照学習を応用する事でより大幅に進歩した ・アンカー画像とマッチしないネガティブ画像を選択する際に問題があった ・SupConは教師有り学習のラベル...
データセット

Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(2/2)

1.Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(2/2)まとめ ・ML の専門家が「十分な専門知識を備えていない領域」でデータを管理する事も問題となる ・対象領域の専門知識よりもMLの技術的な専門知識に...
データセット

Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)

1.Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)まとめ ・機械学習ではモデル構築が優先されデータ関連作業の優先度が低くなる事はよくある ・データ整備を軽視すると時間経過とともに技術的負債が発生し...
学習手法

RetinaGAN:シミュレーション環境から現実世界への転移を一般化(2/2)

1.RetinaGAN:シミュレーション環境から現実世界への転移を一般化(2/2)まとめ ・RL-CycleGAN は「タスクレベルの物体認識」を使用してsim-to-realギャップを超える ・RetinaGANは「ロボットの物体認識」に...
学習手法

RetinaGAN:シミュレーション環境から現実世界への転移を一般化(1/2)

1.RetinaGAN:シミュレーション環境から現実世界への転移を一般化(1/2)まとめ ・シミュレーションを使ってロボットを学習させると効率的だが現実世界への転移が難しい ・GANを使ってシミュレーション画像を現実画像に変換したいが変な変...
学習手法

XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(2/2)

1.XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(2/2)まとめ ・XMC-GAN は各データセットで最先端のスコアを実現し他の手法より評価者に好まれた ・特により複雑なOpenImagesでもXMC-GAN は高品質の...
学習手法

XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(1/2)

1.XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(1/2)まとめ ・テキストの説明文から画像を生成する合成タスクは最近大きな注目を集めている ・従来の画像合成手法はGANを使うケースが多いがモード崩壊などの問題を抱える ...
アプリケーション

MicrosoftがGPT-3を利用した最初の製品を発表

1.MicrosoftがGPT-3を利用した最初の製品を発表まとめ ・ローコード開発ツールのMicrosoft Power Apps内でGPT-3の一部機能が使用可能に ・話言葉を計算式に変換可能になり6 月末までに北米全域で試用できるよう...
AI関連その他

人々の表情は国や地域が変わっても場面によって共通なのか?(2/2)

1.人々の表情は国や地域が変わっても場面によって共通なのか?(2/2)まとめ ・ビデオ内の場面を自動的に認識させるために2種のDNNを使用した ・表情と場面の相関関係は文化間の違いに関わらず7割程度が同じだった ・逆に言えば地域間で最大30...