モデル | ページ 13

FRILL：TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)

１．FRILL：TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)まとめ・FRILLはPixel 1スマートフォン上で推論時間8.5ミリ秒、TRILL比で40%のサイズ削減を達成・10ミリ秒を超える応...

2021.06.18

アプリケーションモデル

１．FRILL：TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(1/2)まとめ・昨年、音声の特徴表現を比較するベンチマークと新しい音声特徴表現モデルTRILLを公開・TRILLは有用だが単純な音声特徴を処理...

2021.06.17

アプリケーションモデル

１．VTN：Transformerを使用した文書レイアウトの自動化(2/2)まとめ・レイアウトの品質と多様性という2つの基準に従ってVTNのパフォーマンスを評価・従来の研究は配置ルールに準拠できなかったり多様性に問題があったがVTNは克...

2021.06.16

アプリケーションモデル

１．VTN：Transformerを使用した文書レイアウトの自動化(1/2)まとめ・レイアウトやデザインルールは従う事は簡単だが例外があるため明確に定義することは困難・機械学習を使った自動デザインはレイアウト要素間の定義情報がないと新要...

2021.06.15

アプリケーションモデル

１．MicrosoftがGPT-3を利用した最初の製品を発表まとめ・ローコード開発ツールのMicrosoft Power Apps内でGPT-3の一部機能が使用可能に・話言葉を計算式に変換可能になり6 月末までに北米全域で試用できるよう...

2021.06.02

アプリケーションモデル

１．DeformableRavens：変形可能な物体を操作することを学ぶ(2/2)まとめ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...

2021.05.27

モデル学習手法AI

１．DeformableRavens：変形可能な物体を操作することを学ぶ(1/2)まとめ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこ...

2021.05.26

モデル学習手法

１．ALIGN：ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能・ALIGN embeddingsを使って演算するとパ...

2021.05.25

モデル

１．ALIGN：ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現・微調整を行うとALIGNはBiTやViTなどのほ...

2021.05.24

モデル

１．ALIGN：ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(1/3)まとめ・視覚言語間マッチングモデルは文章や画像を入力して関連性の高い画像を見つけるのに役立つ・最先端の視覚および視覚対言語モデルは厳選されたトレー...

2021.05.23

モデル

１．FELIX：タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(2/2)まとめ・FELIXは完全に非自己回帰であり最先端のスコアを達成しながら高速な推論を実現可能・事前トレーニングとマスク言語モデルを念頭に必要なトレーニングデータ...

2021.05.16

モデル

１．FELIX：タグ付けと挿入を使う効率的で柔軟なテキスト編集モデル(1/2)まとめ・seq2seqは自然言語生成タスクで好まれるが単一言語が対象の際は最適でない可能性・自己回帰で低速であり単一言語では入力が出力にコピーされるだけの事が...

2021.05.15

モデル