data set

モデル

RepNet:人工知能で動画内の反復行動を数える(2/2)

1.RepNet:人工知能で動画内の反復行動を数える(2/2) ・RepNetは反復行動動画を合成し、更に軸をずらしてカメラの動きを摸倣した合成データで学習した ・特定の反復行動にとらわれず多くの異なる領域で反復動作を数える事ができるモデル...
学習手法

自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)

1.自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)まとめ ・非セマンティックタスクとは、声の調子など、人間の音声の「意味以外の側面」に焦点を当てたタスク ・従来のベンチマークでは非セマンティックタスク用の特徴表現が有用か否かを比...
入門/解説

第7回きめ細かい視覚分類ワークショップの開催(2/2)

1.第7回きめ細かい視覚分類ワークショップの開催(2/2)まとめ ・FGVC7には6つの課題があり、そのうち4つは過去の課題の続き、2つは全く新しい課題 ・iWildCam、Herbarium、iMat Fashion、iMetは去年から続...
入門/解説

第7回きめ細かい視覚分類ワークショップの開催(1/2)

1.第7回きめ細かい視覚分類ワークショップの開催(1/2)まとめ ・きめ細かい視覚分類(FGVC)とは、密接に関連する実体、例えば擬態関係にある蝶同士を区別する問題 ・2011年に17%であった鳥に関するFGVCがディープラーニングにより2...
ビッグデータ

Meta-Dataset:少数ショット学習用のデータセットのためのデータセット(2/3)

1.Meta-Dataset:少数ショット学習用のデータセットのためのデータセット(2/3)まとめ ・Meta-Datasetは少数ショット画像分類用のこれまでで最大規模の複数データセットを交えたベンチマーク ・「事前トレーニング」と「メタ...
入門/解説

組成の一般化能力の測定(3/3)

1.組成の一般化能力の測定(3/3)まとめ ・compound divergenceという新しい指標によりデータセットの難度を数値で表す事ができた ・代表的な3つの標準的なMLアーキテクチャは難度があがるにつれて正確性が直線的にさがってしま...
入門/解説

組成の一般化能力の測定(1/3)

1.組成の一般化能力の測定(1/3)まとめ ・人間は新しい単語の意味を学習し、それを他の文脈に適用することができる ・機械学習ではこのスキルは「組成の一般化(compositional generalization)」と呼ぶ ・しかし「組成...
データセット

ストリートビュー画像を道案内用AIの研究者に提供(3/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(3/3)まとめ ・Retouchdownは、TouchdownをStreetLearnに統合し、より使いやすく利用申請を簡略化したもの ・TouchdownをStreetLearnデータ...
入門/解説

ストリートビュー画像を道案内用AIの研究者に提供(1/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(1/3)まとめ ・前方に進み線路そばの赤い消火栓の後で左折し3ブロック進む、などの指示はAIにとって難しい ・VLN(視覚と言語による案内)と、SDR(特定視点からの空間的記述の解決)が...
モデル

ClearGrasp:透明な物体を認識可能な機械学習アルゴリズム(3/3)

1.ClearGrasp:透明な物体を認識可能な機械学習アルゴリズム(3/3)まとめ ・合成データセットには地面に設置された透明な物体のみが含まれるという制限があった ・Matterport3DおよびScanNetデータセットのデータを利用...
AI関連その他

ClearGrasp:透明な物体を認識可能な機械学習アルゴリズム(1/3)

1.ClearGrasp:透明な物体を認識可能な機械学習アルゴリズム(1/3)まとめ ・現在の光学式3D距離センサーは透明な物体に対する距離を正確に測定する事が出来ない可能性がある ・これは物体の表面が全ての方向に均一に光を反射するという仮...
入門/解説

TyDi QA:多言語対応した質問回答ベンチマーク(1/2)

1.TyDi QA:多言語対応した質問回答ベンチマーク(1/2)まとめ ・日本語を含む11種類の多様な言語を網羅する質問回答用のデータセットであるTyDi QAが公開 ・TyDi QAは共通点の少ない言語を集めたため多様な言語に多様な対応可...