deep learning

入門/解説

ディープニューラルネットワークにおける一般化ギャップの予測(2/2)

1.ディープニューラルネットワークにおける一般化ギャップの予測(2/2)まとめ・一般化ギャップと対数変換したマージン分布の統計的情報はほぼ完全に線形回帰式で表現可能・マージン分布にモデルの一般化度合いに関する重要な情報が含まれている可能性が...
入門/解説

ディープニューラルネットワークにおける一般化ギャップの予測(1/2)

1.ディープニューラルネットワークにおける一般化ギャップの予測(1/2)まとめ・トレーニング時に出てこなかった初見のデータに対応する能力を一般化と言う・一般化ギャップとは「トレーニングデータ」と「初見データ」に対するパフォーマンスのギャップ...
学習手法

カメラとモデルが動いている状況で奥行情報を予測(2/2)

1.カメラとモデルが動いている状況で奥行情報を予測(2/2)まとめ・深度予測ネットワークへの入力は元映像、人をマスクした情報、視差から得られた深度マップ・人間は物理的に一貫した形状と寸法を持つため内部的に事前学習させる事ができる・これにより...
モデル

カメラとモデルが動いている状況で奥行情報を予測(1/2)

1.カメラとモデルが動いている状況で奥行情報を予測(1/2)まとめ・従来の三角測量を使った手法ではカメラで奥行を予測するためにはカメラが静止している必要があった・今回、カメラとカメラが写している人物が同時に移動していても奥行情報を推定可能な...
モデル

MuseNet:ショパン風のレディガガ、ビートルズ風のハリポッターのテーマ(1/4)

1.MuseNet:ショパン風のレディガガ、ビートルズ風のハリポッターのテーマ(1/4)まとめ・MuseNetは楽曲のスタイルを他の楽曲にコピーできる人工知能・大きな違和感を感じないような自然な形で異なったスタイルを融合可能・従来の同等機能...
入門/解説

SpecAugment:音声認識のために学習データを水増しする(1/2)

1.SpecAugment:音声認識のために学習データを水増しする(1/2)まとめ・SpecAugmentは学習用の音声データを水増しする手法で従来手法より効率的な水増しが可能・音声データのままではなく音声データを画像データに変換してから水...
入門/解説

ディープラーニングを利用してスマホのユーザインタフェースを改善(2/2)

1.ディープラーニングを利用してスマホのユーザインタフェースを改善(2/2)・2つめのデータセットでは人間に判断がわかれるケースを集めた・2000のパーツのうち40%程度が人間が矛盾した判断を下した・AIは人間が矛盾した判断をくだすケースで...
入門/解説

ディープラーニングを利用してスマホのユーザインタフェースを改善(1/2)

1.ディープラーニングを利用してスマホのユーザインタフェースを改善(1/2)まとめ・スマホ画面のユーザインタフェースは進化やトレンドが早く変わるので人間が混乱しやすい・人間がスマホ画面のどのようなパーツをクリック可能と判断するかをクラウドソ...
AI関連その他

TossingBot:物理学と深層学習の統合(2/2)

1.TossingBot:物理学と深層学習の統合(2/2)まとめ・TossingBotは物理学と深層学習、及び残差物理学を組み合わせて高性能を実現・残差物理学とは物理学が提供する理論値と現実世界のズレをニューラルネットワークで埋める作業・ロ...
ロボット

TossingBot:物理学と深層学習の統合(1/2)

1.TossingBot:物理学と深層学習の統合(1/2)まとめ・非構造化環境でロボットを安全に動作させる事は依然として困難・TossingBotは乱雑な状況で稼働可能なピッキングロボット・投げたオブジェクトが何処に着地したかを観察して学習...
学習手法

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)まとめ・AutoMLの強化学習版であるAutoRLを使ってロボットを遠く離れた場所までお使いに行かせる研究・現在のロボットは近距離を安全に移動するためのローカル...
学習手法

PlaNet:画像入力から世界モデルを学ぶ強化学習(3/3)

1.PlaNet:画像入力から世界モデルを学ぶ強化学習(3/3)まとめ・PlaNetは一つのエージェントで6つの異なるタスクを行うように訓練する事ができた・比較的単純なタスクに対する学習は遅かったが複雑なタスクは素早く学習し高いレベルに達し...