ベンチマーク

アプリケーション

FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)

1.FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)まとめ ・FRILLはPixel 1スマートフォン上で推論時間8.5ミリ秒、TRILL比で40%のサイズ削減を達成 ・10ミリ秒を超える応...
アプリケーション

FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(1/2)

1.FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(1/2)まとめ ・昨年、音声の特徴表現を比較するベンチマークと新しい音声特徴表現モデルTRILLを公開 ・TRILLは有用だが単純な音声特徴を処理...
学習手法

XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(2/2)

1.XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(2/2)まとめ ・XMC-GAN は各データセットで最先端のスコアを実現し他の手法より評価者に好まれた ・特により複雑なOpenImagesでもXMC-GAN は高品質の...
学習手法

KELM:ナレッジグラフを言語モデルの事前トレーニング資料に統合

1.KELM:ナレッジグラフを言語モデルの事前トレーニング資料に統合まとめ ・大規模な自然言語処理モデルは、インターネットから取得した自然言語の資料を活用する ・自然言語のテキストだけでは、知識の範囲が限られるため他の情報源もある事が望まし...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)まとめ ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合 ・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)まとめ ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない ・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこ...
基礎理論

ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(1/2)

1.ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(1/2)まとめ ・ニューラルネットワークの性能を調整する際はネットワークの深さや幅が調整される ・しかし精度以外にこれらの違いがどのように影響するかについての理解...
学習手法

RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)

1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)まとめ ・シミュレーションの並行実行は簡単ではないためTFのAutoGraphなど最適化の利用が重要 ・RecSim NGにより複雑なマルチエー...
モデル

ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2)

1.ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2) ・Panoptic-DeepLabは複数フレームにおける深度推定やインスタンスID付与ができない ・ViP-DeepLabは2つの連続...
モデル

2021年時点の各分野における最先端の機械学習モデルの紹介

1.2021年時点の各分野における最先端の機械学習モデルの紹介まとめ ・未知の分野で作業を始める時、現時点の最先端モデルを調べるのは時間がかかる ・各MLタスクに最適なモデルをリスト化してまとめておくと手間がかなり省ける ・Kaggleのコ...
アプリケーション

iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(1/2)

1.iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(1/2)まとめ ・最近のコンピュータービジョン研究は動きのあるアクティブタスクの解決に取り組んでいる ・これらは知覚とアクションの両方を必要...
モデル

BigBird:疎なAttentionでより長い連続データに対応可能なTransformer(2/2)

1.BigBird:疎なAttentionでより長い連続データに対応可能なTransformer(2/2)まとめ ・ETCを更に拡張し元データに存在する構造に関する前提知識を不要とするBigBirdを開発 ・GPUやTPUを活用するためにス...