ヘルスケア 目を正面から撮影した写真で病気の兆候を検出(1/3) 1.目を正面から撮影した写真で病気の兆候を検出(1/3)まとめ ・3年前ディープラーニングを用いて眼底写真(目の奥の写真)心血管リスク因子を予測した ・その後、慢性腎臓病や糖尿病、貧血検出値など眼底写真からさらなる兆候の発見があった ・今回... 2022.04.10 ヘルスケアモデル
モデル SPL:ゆるくラベル付けされた動画に疑似的なラベルを付与して動画認識を改善(3/3) 1.SPL:ゆるくラベル付けされた動画に疑似的なラベルを付与して動画認識を改善(3/3)まとめ ・SPLは様々な事前学習手法のいずれよりも優れておりどのようなデータセットにも適用可能 ・SPLは学習を複雑にせず教師-生徒ベースの学習フレーム... 2022.03.23 モデル学習手法
モデル CoVeR:画像と動画で協調学習を行い行動認識を改善(2/2) 1.CoVeR:画像と動画で協調学習を行い行動認識を改善(2/2)まとめ ・CoVeRで学習したモデルは追加微調整を行う事なく複数のデータセットに直接適用可能 ・複数のデータセットで協調学習したCoVeRは標準的な手法よりも良い結果を出す事... 2022.03.14 モデル学習手法
モデル V-MoEs:条件付き計算を使って視覚モデルの規模を拡大(1/2) 1.V-MoEs:条件付き計算を使って視覚モデルの規模を拡大(1/2)まとめ ・大規模なモデルやデータセットを使用するためには大量の計算が必要になり困難 ・計算に必要なリソースを抑える有望な手法のひとつに条件付き計算がある ・これは常にネッ... 2022.01.21 モデル学習手法
学習手法 TokenLearner:柔軟にトークン化する事でVision Transformerの効率と精度を向上(2/2) 1.TokenLearner:柔軟にトークン化する事でVision Transformerの効率と精度を向上(2/2)まとめ ・Vision Transformerはトークンの数が多くなってしまう事がボトルネックとなっていた ・本研究では多... 2021.12.28 学習手法
モデル CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(2/2) 1.CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(2/2)まとめ ・CNNよりTransformerモデルの方が大規模データセットに対応する能力が高い ・CoAtNetsは畳み込みと自己注意を組み合わせたハイブリッド... 2021.09.27 モデル
モデル CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(1/2) 1.CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(1/2)まとめ ・モデルとデータサイズが大きくなるにつれてトレーニング効率が重要な焦点になりつつある ・ニューラルアーキテクチャ探索を活用して画像認識用のモデルを2種... 2021.09.26 モデル
データセット 画像や動画関係の機械学習に使用できる大規模データセット一覧(2/2) 1.画像や動画関係の機械学習に使用できる大規模データセット一覧(2/2)まとめ ・動画や顔認証用、性別や年齢推定、ポーズ推定などの学習に使えるデータセットがある ・「モデルアーキテクチャ」「GPU」「データセット」の観点から性能を試算する必... 2021.08.28 データセット
ヘルスケア 機械学習を使って見落としやすい腫瘍の検出を支援(2/2) 1.機械学習を使って見落としやすい腫瘍の検出を支援(2/2)まとめ ・システムは検出が特に難しいelusive polypsの見逃しを防ぎ誤検知も少ない ・ポリープが視野内にある時間が短くとも従来システムより数倍の感度を達成 ・実証実験では... 2021.08.18 ヘルスケア
アプリケーション Polyblur:過去に撮影した写真からノイズとピンボケを除去(2/2) 1.Polyblur:過去に撮影した写真からノイズとピンボケを除去(2/2)まとめ ・プルプッシュ手法ではフィルターサイズが大きくなっても負荷が急劇に大きくなる事はない ・扱いやすく一貫した結果が得られるため比較的穏やかなぼかしを除去ターゲ... 2021.07.11 アプリケーション
データセット MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2) 1.MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)まとめ ・Open Imagesは「女の子」のラベルを「女性」に付与するかは作業者の感覚依存であった ・MIAPでは知覚された性別表現... 2021.06.22 データセット公平性
モデル ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3) 1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能 ・ALIGN embeddingsを使って演算するとパ... 2021.05.25 モデル