gan

入門/解説

人の流れを統計的に処理した結果から新しい洞察を得る(1/3)

1.人の流れを統計的に処理した結果から新しい洞察を得る(1/3)まとめ ・人々がどのように移動しているのかを知る事、すなわち人間のモビリティを知る事は従来は困難だった ・モバイル機器の通信状況から習得していため比較的狭い範囲狭い時間軸でしか...
入門/解説

Google AI Residency Programの第三期のハイライト

1.Google AI Residency Programの第三期のハイライトまとめ ・Google AI Residency Programの第三期生の成果の発表、論文以外にも幅広い活動を行った ・第五期の募集として2020 Google...
入門/解説

VTAB:視覚タスク用のベンチマーク(2/2)

1.VTAB:視覚タスク用のベンチマーク(2/2)まとめ ・VTABによる評価では最高パフォーマンスを示した特徴表現学習アルゴリズムはS4L ・S4L(Self-Supervised Semi-Supervised Learning)は特に...
入門/解説

Google at ICCV 2019

1.Google at ICCV 2019まとめ ・ICCVが今週韓国で開催され、Googleは200名以上の社員と40以上のプレゼンを実施 ・MediaPipeや新しいOpen Images V5データセット、Google Lensの新し...
入門/解説

フレシェ距離を使用したオーディオとビジュアルの品質測定(2/3)

1.フレシェ距離を使用したオーディオとビジュアルの品質測定(2/3)まとめ ・GANの品質を測定する手法としてFID、フレシェ インセプション 距離がある ・FIDの原則に基づいてフレシェビデオ距離(FVD)とフレシェオーディオ距離(FAD...
学習手法

M4:超多言語、大規模ニューラル機械翻訳(3/3)

1.M4:超多言語、大規模ニューラル機械翻訳(3/3)まとめ ・低リソース言語の数を増やすと高リソース言語の翻訳の品質が低下する現象が観察される ・これを敷設ために良い学習アルゴリズムやモデルパラメータ数を増やす試みを行った ・最終的に50...
学会

Google at Interspeech 2019

1.Google at Interspeech 2019まとめ ・オーストリアで国際音声コミュニケーション協会の第20回年次会議(Interspeech 2019)が開催 ・GoogleはInterspeech 2019のゴールドスポンサー...
モデル

MediaPipeを利用してオンデバイスでリアルタイムに手の動きを知覚(2/2)

1.MediaPipeを利用してオンデバイスでリアルタイムに手の動きを知覚(2/2)まとめ ・手の形状を認識するランドマークモデルは手動でラベル付けされたデータに加えて合成画像も使用 ・純粋な合成画像では一般化性能が低下するため混合トレーニ...
モデル

EfficientNet-EdgeTPU:アクセラレータでの実行に最適化したニューラルネット(2/2)

1.EfficientNet-EdgeTPU:アクセラレータでの実行に最適化したニューラルネット(2/2)まとめ ・EfficientNetsが主に使用する「深さ方向に分離可能な構造」はアクセラレータ上では必ずしも有効ではない ・通常のCN...
入門/解説

ハエの脳を自動でインタラクティブな3D画像に再構成する試み(1/2)

1.ハエの脳を自動でインタラクティブな3D画像に再構成する試み(1/2)まとめ ・ショウジョウバエの脳はニューロンの数が10万程度であり他の脳と比べてモデル化しやすい ・今回ショウジョウバエの脳をFlood-Filling Networks...
学習手法

AdvGen:ニューラル機械翻訳を堅牢にするために敵対的サンプルを利用(2/2)

1.AdvGen:ニューラル機械翻訳を堅牢にするために敵対的サンプルを利用(2/2)まとめ ・AdvGenの出力する敵対的サンプルを利用して堅牢性の損失が計算され、モデルにフィードバックされる ・AdvGenを用いた学習によりニューラル機械...
入門/解説

AdvGen:ニューラル機械翻訳を堅牢にするために敵対的サンプルを利用(1/2)

1.AdvGen:ニューラル機械翻訳を堅牢にするために敵対的サンプルを利用(1/2)まとめ ・文法等を意識せずとも言語を他の言語に直接翻訳するニューラル機械翻訳は大きな成功を収めている ・しかし、ニューラル機械翻訳は入力文のわずかな違いで大...