ロボット Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(1/3) 1.Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(1/3)まとめ ・強化学習は単純なタスクでも習熟するために数百万から数十億のデータが必要になる ・大規模分散システムを使えば迅速に強化学習をトレー... 2021.07.25 ロボット学習手法
アプリケーション Polyblur:過去に撮影した写真からノイズとピンボケを除去(2/2) 1.Polyblur:過去に撮影した写真からノイズとピンボケを除去(2/2)まとめ ・プルプッシュ手法ではフィルターサイズが大きくなっても負荷が急劇に大きくなる事はない ・扱いやすく一貫した結果が得られるため比較的穏やかなぼかしを除去ターゲ... 2021.07.11 アプリケーション
アプリケーション Polyblur:過去に撮影した写真からノイズとピンボケを除去(1/2) 1.Polyblur:過去に撮影した写真からノイズとピンボケを除去(1/2)まとめ ・未知のカメラで生成された画像からノイズ除去とシャープネスの改善を行う事は困難 ・ノイズ除去とブレ削減は矛盾した操作であるため計算効率の高い画像強調技術が必... 2021.07.10 アプリケーション
モデル ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3) 1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能 ・ALIGN embeddingsを使って演算するとパ... 2021.05.25 モデル
データセット Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3) 1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)まとめ ・文対文タスクと画像対文タスクでトレーニングされたマルチタスクモデルが最も優秀だった ・文対文のトレーニングを追加すると画像対文、文対画像で... 2021.05.19 データセット
データセット Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3) 1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)まとめ ・類似性が高いと予想される新しいペアを抽出し、そのペアを人が評価する事にした ・キャプションの類似性が高い画像同士は類似性が高い可能性がある... 2021.05.18 データセット
データセット Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3) 1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)まとめ ・自動画像キャプションはアルゴリズムで画像の説明を作成するタスクで目覚ましい進歩を遂げた ・これにより視覚情報と言語情報を紐づける研究に利用... 2021.05.17 データセット
学会 ICLR 2021におけるGoogleの存在感 1.ICLR 2021におけるGoogleの存在感まとめ ・2021年5月3日(月)から7日(金)まで仮想空間でICLR 2021が開催 ・Google AIブログで概要が発表済みの論文も10存在するので要チェック ・Gradient Bo... 2021.05.12 学会
モデル 幅広い内容の質問に長文で回答可能な質問回答システムの進歩と課題(2/2) 1.幅広い内容の質問に長文で回答可能な質問回答システムの進歩と課題(2/2)まとめ ・Routing TransformersとREALMに基づいた質問応答システムは従来のスコアを更新 ・しかし既存のベンチマークには進歩を妨げるいくつかの問... 2021.04.14 モデル学習手法
アプリケーション シネマティック フォトの背後にある技術(2/2) 1.シネマティック フォトの背後にある技術(2/2)まとめ ・引き延ばした部分の人工物が見えないようにカメラ軌道を最適化している ・アスペクト比を維持するために目立たせたい部分を予測するニューラルネットワークも活用 ・Cinematic p... 2021.03.09 アプリケーション
アプリケーション シネマティック フォトの背後にある技術(1/2) 1.シネマティック フォトの背後にある技術(1/2)まとめ ・昨年12月Googleフォトの新機能としてシネマティック フォトが公開された ・人物を背景から切り離して動かす事で写真を撮った当時の没入感を再現 ・Google フォトの上部に出... 2021.03.08 アプリケーション
アプリケーション Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2) 1.Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2)まとめ ・ストリーミング翻訳モデルはライブ翻訳専用にモデルを再構築する手間がかかる ・マスキングとバイアスを組み合わせた独自の再翻訳アプローチで全体的に性能を向上 ... 2021.02.04 アプリケーション