アプリケーション

アプリケーション

VoiceFilter-Lite:オンデバイス音声認識の改善(1/2)

1.VoiceFilter-Lite:オンデバイスの音声認識の改善(1/2)まとめ ・2018年に自分の声を登録して音声認識機能をパーソナライズするVoiceFilterを発表 ・VoiceFilterは成功したがスマートフォンなどのデバイ...
アプリケーション

Web MLによるGoogle Meetの背景置き換え(2/2)

1.Web MLによるGoogle Meetの背景置き換え(2/2)まとめ ・レンダリングにはジョイントバイラテラルフィルターを使用して滑らかにしている ・ハイエンド機(MacBook Pro)とローエンド機(Chromebook)で速度と...
アプリケーション

Web MLによるGoogle Meetの背景置き換え(1/2)

1.Web MLによるGoogle Meetの背景置き換え(1/2)まとめ ・ビデオ会議ソフトGoogle Meetで機械学習を使用して背景を置き換える技術が発表 ・ブラウザで直接動作するMediaPipeを使っているのでアドオンのインスト...
アプリケーション

URL2Video:Webページから自動でビデオを作成する実験(2/2)

1.URL2Video:Webページから自動でビデオを作成する実験(2/2)まとめ ・簡潔な情報提供と元ページと一致したデザインを目標としてビデオが作成されている ・経験則的な設計思想に従って、個々の場面の資産提示時間及び空間的配置が決定さ...
アプリケーション

URL2Video:Webページから自動でビデオを作成する実験(1/2)

1.URL2Video:Webページから自動でビデオを作成する実験(1/2)まとめ ・URL2Videoは指定された制約を元にWebページを短いビデオに自動変換する研究段階のソフト ・HTMLから資産とそのスタイルを抽出し同様の見た目と感性...
アプリケーション

rǝ:ディープラーニングとクラウドソーシングで昔の街並みを再現(2/2)

1.rǝ:ディープラーニングとクラウドソーシングで昔の街並みを再現(2/2)まとめ ・建物の再構築に使用できる歴史的画像は1つしかない事が多く三次元再構成は非常に困難 ・粗い三次元構造を生成した後に窓や階段などの個々の構成部品を再構成して組...
アプリケーション

rǝ:ディープラーニングとクラウドソーシングで昔の街並みを再現(1/2)

1.rǝ:ディープラーニングとクラウドソーシングで昔の街並みを再現(1/2)まとめ ・昔の町並みをタイムトラベラー体験出来るrǝと呼ばれるブラウザベースのツールが公開 ・rǝは今年リリースされたオープンソースツールで過去地図や写真から都市を...
アプリケーション

OpenAIがGPT-3をマイクロソフトにライセンス供与

1.OpenAIがGPT-3をマイクロソフトにライセンス供与まとめ ・複数年パートナーシップの一環としてOpenAIがMicrosoftにGPT-3のライセンスを供与 ・OpenAIのAPIを介したGPT-3モデルへの継続的なアクセスに影響...
アプリケーション

Menger:大規模な分散型強化学習(3/3)

1.Menger:大規模な分散型強化学習(3/3)まとめ ・Reverbが提供する水平分割機能を使用して通信スループットを向上させた ・Mengerは複数のBorgセルにまたがる数千人の行為者に効率的に拡張できた ・大規模チップ配置タスクに...
アプリケーション

Menger:大規模な分散型強化学習(2/3)

1.Menger:大規模な分散型強化学習(2/3)まとめ ・キャッシュにより行為者から受け取る多数のリクエストと学習者の作業のバランスを取った ・キャッシュは更新要求処理する学習者の負荷だけでなく行為者の平均読み取り遅延も軽減 ・高スループ...
アプリケーション

Menger:大規模な分散型強化学習(1/3)

1.Menger:大規模な分散型強化学習(1/3)まとめ ・RLとはデータ収集とトレーニングのループだが規模拡大すると反復処理が追いつかなくなる ・Mengerは大規模な分散RLインフラであり複数クラスタにより規模拡大が可能 ・TPUを使用...
アプリケーション

ビデオ会議時に手話で発言権を確保できるようにする(2/2)

1.ビデオ会議時に手話で発言権を確保できるようにする(2/2)まとめ ・手話検出モデル完成後、ビデオ会議アプリに手話による発言を検知させる必要があった ・手話検出モデルは手話を検出すると超音波を発声しアプリに疑似的な発音を検知させる ・通常...