アプリケーション

VoiceFilter-Lite:オンデバイス音声認識の改善(2/2)

1.VoiceFilter-Lite:オンデバイスの音声認識の改善(2/2)まとめ・VoiceFilter-Liteは使用者が自分の音声を登録しなかった場合はアプリ側で無効化できる・音声分離モデルに発生しがちな抑制不足と抑制過剰への対処も考...
アプリケーション

VoiceFilter-Lite:オンデバイス音声認識の改善(1/2)

1.VoiceFilter-Lite:オンデバイスの音声認識の改善(1/2)まとめ・2018年に自分の声を登録して音声認識機能をパーソナライズするVoiceFilterを発表・VoiceFilterは成功したがスマートフォンなどのデバイス上...
データセット

三次元物体認識のためのObjectronデータセットの発表(2/2)

1.三次元物体認識のためのObjectronデータセットの発表(2/2)まとめ・使用法やチュートリアルなどObjectronデータセットの技術的な詳細はgithubで入手可能・データセットには、自転車、本、ボトル、カメラ、椅子、カップ、靴な...
データセット

三次元物体認識のためのObjectronデータセットの発表(1/2)

1.三次元物体認識のためのObjectronデータセットの発表(1/2)まとめ・二次元と比較して大規模なデータセットがないため三次元で物体を理解することは困難・Objectronデータセットはこの問題を解決する三次元物体中心の短いビデオデー...
アプリケーション

Web MLによるGoogle Meetの背景置き換え(2/2)

1.Web MLによるGoogle Meetの背景置き換え(2/2)まとめ・レンダリングにはジョイントバイラテラルフィルターを使用して滑らかにしている・ハイエンド機(MacBook Pro)とローエンド機(Chromebook)で速度と精度...
アプリケーション

Web MLによるGoogle Meetの背景置き換え(1/2)

1.Web MLによるGoogle Meetの背景置き換え(1/2)まとめ・ビデオ会議ソフトGoogle Meetで機械学習を使用して背景を置き換える技術が発表・ブラウザで直接動作するMediaPipeを使っているのでアドオンのインストール...
アプリケーション

URL2Video:Webページから自動でビデオを作成する実験(2/2)

1.URL2Video:Webページから自動でビデオを作成する実験(2/2)まとめ・簡潔な情報提供と元ページと一致したデザインを目標としてビデオが作成されている・経験則的な設計思想に従って、個々の場面の資産提示時間及び空間的配置が決定される...
アプリケーション

URL2Video:Webページから自動でビデオを作成する実験(1/2)

1.URL2Video:Webページから自動でビデオを作成する実験(1/2)まとめ・URL2Videoは指定された制約を元にWebページを短いビデオに自動変換する研究段階のソフト・HTMLから資産とそのスタイルを抽出し同様の見た目と感性を維...
入門/解説

Captum:PyTorchのモデル解釈用ライブラリ

1.Captum:PyTorchのモデル解釈用ライブラリまとめ・CaptumはPyTorch用の解釈用ライブラリで最先端のアルゴリズムが利用可能になる・モデルの出力に寄与する特徴表現の識別が容易になり設計改善や出力調査が可能になる・視覚化を...
基礎理論

解釈しやすいニューロンがディープラーニングの性能を低下させる可能性

1.解釈しやすいニューロンがディープラーニングの性能を低下させる可能性まとめ・一部のニューロンは猫画像など特定クラスを優先する性質を持ちこれをクラス選択性という・クラス選択性は学習中に自動出現するので解釈可能性に関するツールとして注目されて...
学習手法

DVRL:強化学習を使って学習用データの影響を推定(2/2)

1.DVRL:強化学習を使って学習用データの影響を推定(1/2)まとめ・DVRLはデータ価値の推定やノイズ影響の除去で従来手法より優れた成果を出した・学習データが検証/テストデータと異なる分布に由来するドメイン適応シナリオも対応可・データ評...
学習手法

DVRL:強化学習を使って学習用データの影響を推定(1/2)

1.DVRL:強化学習を使って学習用データの影響を推定(1/2)まとめ・全てのデータサンプルがディープラーニングを学習させる際に等しく役立つわけではない・低品質データを削除することでパフォーマンスを向上させる事が出来る場合もある・DVRLは...