視覚

入門/解説

第三世代データサイエンティストに必要なスキルセット(2/2)

1.第三世代データサイエンティストに必要なスキルセット(2/2)まとめ ・AIが必要と言われるケースで本当にAIが必要なケースは多くない ・本当に必要とされているものが何かを掴む質問力が重要 ・社会人としてのスキルは技術的スキルと同じくらい...
入門/解説

第三世代データサイエンティストに必要なスキルセット(1/2)

1.第三世代データサイエンティストに必要なスキルセット(1/2)まとめ ・データサイエンティストに必要なスキルセットとされるものは元々多様なバリエーションが存在した ・2010年代の終わり頃から第三世代のデータサイエンティスト達が注目され始...
モデル

カメラとモデルが動いている状況で奥行情報を予測(1/2)

1.カメラとモデルが動いている状況で奥行情報を予測(1/2)まとめ ・従来の三角測量を使った手法ではカメラで奥行を予測するためにはカメラが静止している必要があった ・今回、カメラとカメラが写している人物が同時に移動していても奥行情報を推定可...
入門/解説

(2018年4月時点で)データサイエンス初学者が知っておくと便利な10のツール(1/2)

1.(2018年4月時点で)データサイエンス初学者が知っておくと便利な10のツール(1/2)まとめ ・2018年4月時点でアメリカでデータサイエンティストが知っておくべきと見なされたツールの紹介 ・2018年後半に一つのブレークスルーがあっ...
データセット

Open Images V5とICCV 2019 Open Images Challengeの発表(2/2)

1.Open Images V5とICCV 2019 Open Images Challengeの発表(2/2)まとめ ・Open Images V5の検証データセットとテストデータセットは完全に人力で作成されている ・従来のポリゴン型アノ...
ビッグデータ

第6回きめ細かい視覚分類ワークショップの開催(2/2)

1.第6回きめ細かい視覚分類ワークショップの開催(2/2)まとめ ・Herbariumチャレンジでは植物標本シート画像をもとにきめ細かい視覚分類を実施する ・植物標本シート画像を使うためのiNaturalistチャレンジとは区別される ・F...
入門/解説

第6回きめ細かい視覚分類ワークショップの開催(1/2)

1.第6回きめ細かい視覚分類ワークショップの開催(1/2)まとめ ・6月17日にカリフォルニアで開催されるCVPR 2019でFGVC6が開催 ・FGVC6では単なるカテゴリ分類を超えたきめ細かい分類に挑戦する ・今回からメトロポリタン美術...
入門/解説

MuseNet:ショパン風のレディガガ、ビートルズ風のハリポッターのテーマ(3/4)

1.MuseNet:ショパン風のレディガガ、ビートルズ風のハリポッターのテーマ(3/4)まとめ ・現在公開中のMuseNetは試作版のため楽器の指定は必須条件にならない等の制限がある ・MuseNetが抽出した作曲家間の特徴を図にする事で作...
入門/解説

教師なし学習による特徴表現解きほぐし手法の評価(2/2)

1.教師なし学習による特徴表現解きほぐし手法の評価(2/2)まとめ ・帰納的バイアスがなければ解きほぐした特徴表現の教師なし学習は不可能である ・解きほぐしが下流タスクに有用であるという仮定は検証できなかった ・将来の研究を促進するためにd...
入門/解説

教師なし学習による特徴表現解きほぐし手法の評価(1/2)

1.教師なし学習による特徴表現解きほぐし手法の評価(1/2)まとめ ・抽出した特徴量をもっと細かく具体的な単位に解きほぐすdisentangledな手法が注目されている ・「猫の特徴」ではなく耳と目と輪郭と毛色から猫を特定できれば一部が写っ...
入門/解説

SpecAugment:音声認識のために学習データを水増しする(1/2)

1.SpecAugment:音声認識のために学習データを水増しする(1/2)まとめ ・SpecAugmentは学習用の音声データを水増しする手法で従来手法より効率的な水増しが可能 ・音声データのままではなく音声データを画像データに変換してか...
学習手法

Photobooth:Pixel 3で最高の自撮りを自動で撮影する(2/2)

1.Photobooth:Pixel 3で最高の自撮りを自動で撮影する(2/2)まとめ ・表情検出モデルのスコアとキス検出モデルのスコアの両方からフレーム品質を計算 ・機械学習アルゴリズムの判断指標をわかりやすくする知的インジケータを工夫 ...