machine learning

公平性

MinDiff:機械学習モデルの不公平な偏見を軽減(2/2)

1.MinDiff:機械学習モデルの不公平な偏見を軽減(2/2)まとめ ・分類器のエラー率のグループ間差異は不公平な偏見の重要な一部だが唯一の偏見ではない ・MinDiffが不公平な偏見に対処する手法や研究を前進させ、改善させる事を願ってい...
アプリケーション

Hum to Search:鼻歌検索の背後に存在する技術(2/2)

1.Hum to Search:鼻歌検索の背後に存在する技術(2/2)まとめ ・トレーニングデータは元の歌声をハミングや口笛に変換して認識率を向上させている ・トレーニング時にはトリプレット損失関数をベースに信頼性の概念に改良を加えた ・現...
アプリケーション

Hum to Search:鼻歌検索の背後に存在する技術(1/2)

1.Hum to Search:鼻歌検索の背後に存在する技術(1/2)まとめ ・鼻歌とスタジオで録音された歌曲は使用している楽器等がかなり異なるため鼻歌検索は困難 ・従来手法は全ての歌曲について鼻歌版を作成し、鼻歌版に対して鼻歌で検索をして...
データセット

三次元物体認識のためのObjectronデータセットの発表(1/2)

1.三次元物体認識のためのObjectronデータセットの発表(1/2)まとめ ・二次元と比較して大規模なデータセットがないため三次元で物体を理解することは困難 ・Objectronデータセットはこの問題を解決する三次元物体中心の短いビデオ...
学習手法

DVRL:強化学習を使って学習用データの影響を推定(1/2)

1.DVRL:強化学習を使って学習用データの影響を推定(1/2)まとめ ・全てのデータサンプルがディープラーニングを学習させる際に等しく役立つわけではない ・低品質データを削除することでパフォーマンスを向上させる事が出来る場合もある ・DV...
モデル

Image GPT:自然言語処理用の人工知能で画像を生成(3/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(3/3)まとめ ・iGPTが強力な画像特徴表現を学習可能で教師有り、半教師モデルと匹敵する事が示された ・しかしGPUにV100を使って延べ2500日が必要で画像専用モデルの約3...
アプリケーション

Menger:大規模な分散型強化学習(2/3)

1.Menger:大規模な分散型強化学習(2/3)まとめ ・キャッシュにより行為者から受け取る多数のリクエストと学習者の作業のバランスを取った ・キャッシュは更新要求処理する学習者の負荷だけでなく行為者の平均読み取り遅延も軽減 ・高スループ...
アプリケーション

YouTubeストーリーで人の声だけ音量を上げる(1/2)

1.YouTubeストーリーで人の声だけ音量を上げる(1/2)まとめ ・バックグラウンドノイズが大きいビデオでは被写体のスピーチが曖昧になり理解しにくい ・Looking to Listenは音声と口の動きなどの視覚信号を使い特定の人の音声...
ビッグデータ

HydroNets:最近の洪水予測の改善の背後にある技術(3/3)

1.HydroNets:洪水予測の最近の改善の背後にある技術(3/3)まとめ ・HydroNetは水位予測に特化して構築された特別なディープニューラルネットワーク ・HydroNetは「地点間で共通化する処理」と「特定地点に固有の処理」を区...
ビッグデータ

HydroNets:最近の洪水予測の改善の背後にある技術(1/3)

1.HydroNets:洪水予測の最近の改善の背後にある技術(1/3)まとめ ・インドとバングラデシュで洪水予報を改善し2億5000万人以上の居住地に対象範囲を拡大 ・形態学的浸水モデルと呼ばれる浸水モデリングの新しいアプローチで範囲を拡大...
モデル

KeyPose:ステレオ画像で透明物体の三次元ポーズ推定を更に改良(2/2)

1.KeyPose:ステレオ画像で透明物体の三次元ポーズ推定を更に改良(2/2)まとめ ・ステレオKeyPoseの重要な側面の1つはEarly fusionを使用してステレオ画像を融合する事 ・Late fusionまたは単眼入力と比較する...
モデル

KeyPose:ステレオ画像で透明物体の三次元ポーズ推定を更に改良(1/2)

1.KeyPose:ステレオ画像で透明物体の三次元ポーズ推定を更に改良(1/2)まとめ ・透明な物体に対しては既存の深度センサーはうまく機能せず距離が測定できない ・以前紹介したClearGraspはニューラルネットで深度センサーの出力した...