video

入門/解説

TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)

1.TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)まとめ ・TCCを使うとポーズ、照明、ボディ、オブジェクトの種類などの差異に関わらず同じ動作を特定できる ・そのため、ラベル付き画像が少数しかない状態でアクションの分類や様々...
入門/解説

TCC:繰り返し動作に着目して動画を理解する学習手法(1/2)

1.TCC:繰り返し動作に着目して動画を理解する学習手法(1/2)まとめ ・特定の順序で行われる動作はキーとなる動作が常に存在し、他の条件が異なっても共通である ・例えばワインでもお茶でも水でも注ぐと言う動作には入れ物を手で掴む動作が必ず存...
ビッグデータ

YouTube-8Mセグメントデータセットの発表

1.YouTube-8Mセグメントデータセットの発表まとめ ・従来のYouTube-8Mデータセットは機械的に付与したラベルと同程度の品質のビデオレベルラベルであった ・YouTube-8Mセグメントデータは人間が目で付与した時間的に特定さ...
学習手法

カメラとモデルが動いている状況で奥行情報を予測(2/2)

1.カメラとモデルが動いている状況で奥行情報を予測(2/2)まとめ ・深度予測ネットワークへの入力は元映像、人をマスクした情報、視差から得られた深度マップ ・人間は物理的に一貫した形状と寸法を持つため内部的に事前学習させる事ができる ・これ...
入門/解説

MuseNet:ショパン風のレディガガ、ビートルズ風のハリポッターのテーマ(2/4)

1.MuseNet:ショパン風のレディガガ、ビートルズ風のハリポッターのテーマ(2/4) ・2019年5月12日までの期間限定で公開されているAIによる作曲支援ツールMuseNetの使い方の解説 ・ベーシックモードでは6スタイル、6イントロ...
学習手法

TALNet:Google Photosで動画から特別な瞬間を切り出す(2/2)

1.TALNet:Google Photosで動画から特別な瞬間を切り出す(2/2) ・二次元データを扱うFaster R-CNNを一次元の時系列データに応用するためには3つの課題があった ・時間に変動が大きい事、前後の状況が重要な事、入力...
モデル

TALNet:Google Photosで動画から特別な瞬間を切り出す(1/2)

1.TALNet:Google Photosで動画から特別な瞬間を切り出す(1/2) ・Google Photosでアップされた動画から自動で印象的なシーンを切り出す事が可能になった ・これを実現しているTALNetは画像から物体を効率的に...
入門/解説

SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(2/2)

1.SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(2/2)まとめ ・SimPLeはモデルベース強化学習でありサンプル効率性が高い ・他のモデルフリー強化学習の2倍程度のサンプル効率性を達成 ・モデルフリー強化学習のパフォーマ...
モデル

SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(1/2)

1.SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(1/2)まとめ ・現在の強化学習の問題点の1つは人間に比べて学習に非常に時間がかかる事である ・人間が効率的に学習できる理由は世界モデルを持っているからと推測されている ・モ...
入門/解説

GPT-2が自動生成したその他の文章(1/3)

1.GPT-2が自動生成したその他の文章(1/3)まとめ ・GPT-2が出力したユニコーン以外の文章の紹介 ・プレスリリース、ニュース、芸能ニュース、の3種類 ・部署名等は実在の名称を入れてくるので流し読みしていると読めてしまう 2.GPT...
入門/解説

AI、データサイエンス、分析関連の2018年における主な発展と2019年の主な動向(2/2)

1.AI、データサイエンス、分析関連の2018年における主な発展と2019年の主な動向(2/2)まとめ ・専門家による2018年のデータサイエンスと統計関連であった出来事のまとめ ・AIのリスクは0を目指すのではなく現在の発生リスクと比較さ...
入門/解説

ヒントン教授のオンライン授業の動画が全て公開

1.ヒントン教授のオンライン授業の動画が全て公開まとめ ・Courseraのヒントン教授の講座の動画が教授のWebサイトで全部公開へ ・2012年の講座なので古くなりすぎたので取り下げを依頼したとの事 ・Courseraも元々無料だが1章か...