AI

ビデオ会議時に手話で発言権を確保できるようにする(2/2)

1.ビデオ会議時に手話で発言権を確保できるようにする(2/2)まとめ ・手話検出モデル完成後、ビデオ会議アプリに手話による発言を検知させる必要があった ・手話検出モデルは手話を検出すると超音波を発声しアプリに疑似的な発音を検知させる ...
AI

ビデオ会議時に手話で発言権を確保できるようにする(1/2)

1.ビデオ会議時に手話で発言権を確保できるようにする(1/2)まとめ ・ビデオ会議で手話を検知するのは全カメラのビデオ入力を分類対象とする必要があり困難 ・以前の試みで通話品質への影響を最小限に抑えるために軽量モデルが重要な事が判明 ...
AI

YouTubeストーリーで人の声だけ音量を上げる(2/2)

1.YouTubeストーリーで人の声だけ音量を上げる(2/2)まとめ ・Looking to Listenはノイズを完全分離していたがユーザは一部を残す事を好んでいた ・年齢、肌の色、言語、声の高低、話者の顔の視認性により偏りがないよう...
AI

YouTubeストーリーで人の声だけ音量を上げる(1/2)

1.YouTubeストーリーで人の声だけ音量を上げる(1/2)まとめ ・バックグラウンドノイズが大きいビデオでは被写体のスピーチが曖昧になり理解しにくい ・Looking to Listenは音声と口の動きなどの視覚信号を使い特定の人の...
AI

DELG:インスタンスレベルの画像認識の進歩(2/2)

1.DELG:インスタンスレベルの画像認識の進歩(2/2)まとめ ・今年はランドマークを対象とした2つの新しいコンペをKaggleで開催 ・1,200を超えるチームが集まりDELGの基準スコアを大幅に上回った ・メトロポリタン美術館の...
タイトルとURLをコピーしました