computer vision

モデル

Omnimattes:動画内の影や砂煙も切出す事ができる最先端の人工知能(1/2)

1.Omnimattes:動画内の影や砂埃も切出す事ができる最先端の人工知能(1/2)まとめ ・前景と背景の分離を定義するマット画像があると画像やビデオの編集操作が容易になる ・最近の人工知能は画像やビデオ内に自動でマットを作成できるが影や...
データセット

画像や動画関係の機械学習に使用できる大規模データセット一覧(2/2)

1.画像や動画関係の機械学習に使用できる大規模データセット一覧(2/2)まとめ ・動画や顔認証用、性別や年齢推定、ポーズ推定などの学習に使えるデータセットがある ・「モデルアーキテクチャ」「GPU」「データセット」の観点から性能を試算する必...
データセット

画像や動画関係の機械学習に使用できる大規模データセット一覧(1/2)

1.画像や動画関係の機械学習に使用できる大規模データセット一覧(1/2)まとめ ・画像関連のニューラルネットワークをトレーニングするには大規模画像データセットが必要 ・ImageNetは最もよく知られている画像データセットで画像研究のゴール...
ヘルスケア

機械学習を使って見落としやすい腫瘍の検出を支援(1/2)

1.機械学習を使って見落としやすい腫瘍の検出を支援(1/2)まとめ ・内視鏡検査は米国だけで年間約1,900万件の検査が行われているが目視で行われている ・研究によると内視鏡検査中に腫瘍の22%~28%が見落とされて深刻化する可能性がある ...
ビッグデータ

アフリカ大陸の多種多様な建物を衛星画像から検出(1/2)

1.アフリカ大陸の多種多様な建物を衛星画像から検出(1/2)まとめ ・建物面積は人口推定や都市計画、人道的対応や環境科学まで様々な分野に応用できるので重要 ・国勢調査情報がない地域もあるアフリカで衛星画像から建物分布を調査する研究を行った ...
学会

CVPR 2021におけるGoogleの存在感

1.CVPR 2021におけるGoogleの存在感まとめ ・6/19 - 6/25の間インターネット上のヴァーチャルイベントとしてCVPR 2021が開催 ・Google社員も多数参加し70を超える受理された出版物やワークショップを開催 ・...
データセット

MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)

1.MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)まとめ ・Open Imagesは「女の子」のラベルを「女性」に付与するかは作業者の感覚依存であった ・MIAPでは知覚された性別表現...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)まとめ ・自動画像キャプションはアルゴリズムで画像の説明を作成するタスクで目覚ましい進歩を遂げた ・これにより視覚情報と言語情報を紐づける研究に利用...
モデル

ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(1/2)

1.ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(1/2) ・人間は二次元画像である写真から三次元環境に関する視覚情報を非常に簡単に取得できる ・自動運転などを実現するためには同様に平面画像から...
モデル

MaX-DeepLab:デュアルパストランスフォーマーを使ってパノプティックセグメンテーションを直接実行(1/2)

1.MaX-DeepLab:デュアルパストランスフォーマーを使ってパノプティックセグメンテーションを直接実行(1/2)まとめ ・パノプティックはセマンティックとインスタンスの両セグメンテーションを統合したもの ・従来の最高手法は画像から直接...
アプリケーション

iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(1/2)

1.iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(1/2)まとめ ・最近のコンピュータービジョン研究は動きのあるアクティブタスクの解決に取り組んでいる ・これらは知覚とアクションの両方を必要...
AI関連その他

独自データを使って物体検出モデルの精度を上げる方法(2020年版)

1.独自データを使って物体検出モデルの精度を上げる方法(2020年版)まとめ ・2020年に物体検出モデルを再トレーニングしようとした時に取りうる選択肢の概要紹介 ・物体検出用データのラベル付け、データ拡張、モデリングなどを具体的に紹介 ・...