視覚

AI

Image GPT:自然言語処理用の人工知能で画像を生成(3/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(3/3)まとめ ・iGPTが強力な画像特徴表現を学習可能で教師有り、半教師モデルと匹敵する事が示された ・しかしGPUにV100を使って延べ2500日が必要で画像専用モデルの...
AI

rǝ:ディープラーニングとクラウドソーシングで昔の街並みを再現(1/2)

1.rǝ:ディープラーニングとクラウドソーシングで昔の街並みを再現(1/2)まとめ ・昔の町並みをタイムトラベラー体験出来るrǝと呼ばれるブラウザベースのツールが公開 ・rǝは今年リリースされたオープンソースツールで過去地図や写真から都...
AI

YouTubeストーリーで人の声だけ音量を上げる(2/2)

1.YouTubeストーリーで人の声だけ音量を上げる(2/2)まとめ ・Looking to Listenはノイズを完全分離していたがユーザは一部を残す事を好んでいた ・年齢、肌の色、言語、声の高低、話者の顔の視認性により偏りがないよう...
AI

YouTubeストーリーで人の声だけ音量を上げる(1/2)

1.YouTubeストーリーで人の声だけ音量を上げる(1/2)まとめ ・バックグラウンドノイズが大きいビデオでは被写体のスピーチが曖昧になり理解しにくい ・Looking to Listenは音声と口の動きなどの視覚信号を使い特定の人の...
AI

DELG:インスタンスレベルの画像認識の進歩(2/2)

1.DELG:インスタンスレベルの画像認識の進歩(2/2)まとめ ・今年はランドマークを対象とした2つの新しいコンペをKaggleで開催 ・1,200を超えるチームが集まりDELGの基準スコアを大幅に上回った ・メトロポリタン美術館の...
タイトルとURLをコピーしました