モデル

モデル

Panoptic-DeepLab:総括的に風景を理解する新手法(2/2)

1.Panoptic-DeepLab:総括的に風景を理解する新手法(2/2)まとめ ・Panoptic-DeepLabはエンコーダ、ASPP、デコーダ、予測ヘッドから構成される ・拡大畳み込みにより通常の畳み込みより物体の境界の詳細を保持す...
モデル

Panoptic-DeepLab:総括的に風景を理解する新手法(1/2)

1.Panoptic-DeepLab:総括的に風景を理解する新手法(1/2)まとめ ・自動運転車やロボットはインスタンスとセマンティックの2つのセグメンテーションを実施 ・インスタンスセグメンテーションは、画像内の個々の特定の物体を区別して...
モデル

YouTuber向けのSmartReply機能が実装(2/2)

1.YouTuber向けのSmartReply機能が実装(2/2)まとめ ・文字単位の処理は単語単位の処理よりも文字列の並びが長くなり推論速度が遅すぎた ・WaveNetが使った拡張手法を適用し計算量と品質の間で適切なトレードオフを実現 ・...
モデル

SpineNet:ニューラルアーキテクチャ探索で発見された新しい物体検出アーキテクチャ(2/2)

1.SpineNet:ニューラルアーキテクチャ探索で発見された新しい物体検出アーキテクチャ(2/2)まとめ ・ニューラルアーキテクチャ探索の出発点となるモデルにはResNet-50バックボーンを採用 ・発見されたスケール交換モデルは、物体検...
モデル

SpineNet:ニューラルアーキテクチャ探索で発見された新しい物体検出アーキテクチャ(1/2)

1.SpineNet:ニューラルアーキテクチャ探索で発見された新しい物体検出アーキテクチャ(1/2)まとめ ・畳み込みネットワークは段階的に入力画像のスケールを削減するためマルチスケールなタスクが苦手 ・スケール交換モデルはスケールを削減で...
モデル

Context R-CNN:過去に撮影された写真を参照して仕掛けカメラの物体検出能力を改善(1/2)

1.Context R-CNN:過去に撮影された写真を参照して仕掛けカメラの物体検出能力を改善(1/2)まとめ ・生態学的モニタリングは、地球規模の生態系の変遷や人類の活動の影響を測定するのに役立つ ・データ取得は固定カメラ可能だが固定カメ...
モデル

Pixel 4のタッチ操作を機械学習で改良(2/2)

1.Pixel 4のタッチ操作を機械学習で改良(2/2)まとめ ・「空間的特徴」に対応するCNNと「時間的進展」に対応するRNNを組み込んだネットワークを設計 ・意図的にシンプルな構成に保ち推論コストを最小限(1 MB未満のメモリ消費量)に...
モデル

RepNet:人工知能で動画内の反復行動を数える(2/2)

1.RepNet:人工知能で動画内の反復行動を数える(2/2) ・RepNetは反復行動動画を合成し、更に軸をずらしてカメラの動きを摸倣した合成データで学習した ・特定の反復行動にとらわれず多くの異なる領域で反復動作を数える事ができるモデル...
モデル

RepNet:人工知能で動画内の反復行動を数える(1/2)

1.RepNet:人工知能で動画内の反復行動を数える(1/2) ・月の満ち欠けや心拍や呼吸、製造ラインや交通パターンなどの反復行動は現実世界で一般的 ・反復行動を理解する事でより複雑な行動パターンを認識できたり様々な洞察を得る事ができる ・...
モデル

自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)

1.自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)まとめ ・同じ音声のembeddingは、別の音声のembeddingよりembedding空間内で近い場所に位置するはず ・これを利用しBERTと同様なデータ自体の構造にのみ依...
モデル

GPT-3がAPI経由で利用可能に

1.GPT-3がAPI経由で利用可能にまとめ ・GPT-2比で100倍近い性能を持つと推測されるGPT-3が発表されAPI経由で使用可能になる ・テキストを入力するとテキストを出力するという非常に汎用的なAPIで微調整も可能 ・現時点では限...
モデル

深層強化学習の力でロボットが俊敏で知的な移動を実現(3/3)

1.深層強化学習の力でロボットが俊敏で知的な移動を実現(3/3)まとめ ・階層強化学習では高レベルポリシーと低レベルポリシーは同時にトレーニングされる ・トレーニング目的はロボットの軌道から得られる総報酬を最大化する事 ・学習完了後は高レベ...