image processing

AI関連その他

Mesh-TensorFlowによる超高解像度画像解析(2/2)

1.Mesh-TensorFlowによる超高解像度画像解析(2/2)まとめ ・畳み込み演算では各フレームの端部分を超えてフィルターが適用されることがよくある ・ヘィロー交換と呼ばれるデータ通信ステップを実装し畳み込みの前に隣接する部分と通信...
モデル

AutoFlip:機械学習を用いてビデオの最適な箇所を切り抜く(3/3)

1.AutoFlip:機械学習を用いてビデオの最適な箇所を切り抜く(3/3)まとめ ・なるべく全ての顔を画面に収めるモードと全ての顔を必ず画面に収めるモードの2つのモードを提供 ・今後の研究としてはテキストやロゴを新しいアスペクト比によりよ...
モデル

ClearGrasp:透明な物体を認識可能な機械学習アルゴリズム(2/3)

1.ClearGrasp:透明な物体を認識可能な機械学習アルゴリズム(2/3)まとめ ・透明な表面は鏡面反射をするため、これを視覚的な手がかりとして深度推定を行っている ・ClearGraspは面法線推定、オクルージョン境界推定、透明な物体...
入門/解説

Pixel 4のNight Sightで撮影した天体写真(3/3)

1.Pixel 4のNight Sightで撮影した天体写真(3/3)まとめ ・人々は夜間は空が暗くなっている事を当然と思っているため空が明るく見えると撮影時刻を誤解する ・Night Sightでは撮影部分に空が含まれるとわざと空の部分を...
入門/解説

Google LensのGoogle Goバージョン(1/2)

1.Google LensのGoogle Goバージョン(1/2)まとめ ・Google Lensは読み書きに困難を感じている世界の8億人の人々を手助けできる潜在能力がある ・しかし、従来のGoogle Lensはある程度機能が高いスマート...
学習手法

集積カプセルオートエンコーダー(6/6)

1.集積カプセルオートエンコーダー(6/6)まとめ ・SCAE、集積カプセルオートエンコーダーはPCAEとそれに続くOCAEで構成されています ・PCAEエンコーダ、OCAEエンコーダ、OCAEデコーダ、PCAEデコーダの機能から構成される...
学習手法

カメラとモデルが動いている状況で奥行情報を予測(2/2)

1.カメラとモデルが動いている状況で奥行情報を予測(2/2)まとめ ・深度予測ネットワークへの入力は元映像、人をマスクした情報、視差から得られた深度マップ ・人間は物理的に一貫した形状と寸法を持つため内部的に事前学習させる事ができる ・これ...
モデル

カメラとモデルが動いている状況で奥行情報を予測(1/2)

1.カメラとモデルが動いている状況で奥行情報を予測(1/2)まとめ ・従来の三角測量を使った手法ではカメラで奥行を予測するためにはカメラが静止している必要があった ・今回、カメラとカメラが写している人物が同時に移動していても奥行情報を推定可...
モデル

MorphNet:学習済みニューラルネットワークをより速くより小さく改良(2/2)

1.MorphNet:学習済みニューラルネットワークをより速くより小さく改良(2/2)まとめ ・MorphNetは圧縮対象をサイズや計算量などから選べる事に加えて3つの重要な特徴がある ・ネットワークの構造そのものを変更する事がある、大規模...
学習手法

Photobooth:Pixel 3で最高の自撮りを自動で撮影する(2/2)

1.Photobooth:Pixel 3で最高の自撮りを自動で撮影する(2/2)まとめ ・表情検出モデルのスコアとキス検出モデルのスコアの両方からフレーム品質を計算 ・機械学習アルゴリズムの判断指標をわかりやすくする知的インジケータを工夫 ...
AI関連その他

機械学習で自撮りにリアルタイムに拡張現実を適用(1/3)

1.機械学習で自撮りにリアルタイムに拡張現実を適用(1/3)まとめ ・拡張現実(AR)は、デジタルコンテンツや情報を現実世界に重ね合わせる技術 ・ARを現実に重ね合わせるためには現実世界の動きを正確に補足する必要がある ・2つのディープニュ...
入門/解説

DeepDreamで最初期に作成された画像が見つかる(3/3)

1.DeepDreamで最初期に作成された画像が見つかる(3/3)まとめ ・DeepDreamが犬の画像に偏るのは元のニューラルネットがImageNetであるため ・ImageNetはfine-grained classification用...