Pixel

学習手法

カメラとモデルが動いている状況で奥行情報を予測(2/2)

1.カメラとモデルが動いている状況で奥行情報を予測(2/2)まとめ ・深度予測ネットワークへの入力は元映像、人をマスクした情報、視差から得られた深度マップ ・人間は物理的に一貫した形状と寸法を持つため内部的に事前学習させる事ができる ・これ...
学習手法

Photobooth:Pixel 3で最高の自撮りを自動で撮影する(2/2)

1.Photobooth:Pixel 3で最高の自撮りを自動で撮影する(2/2)まとめ ・表情検出モデルのスコアとキス検出モデルのスコアの両方からフレーム品質を計算 ・機械学習アルゴリズムの判断指標をわかりやすくする知的インジケータを工夫 ...
その他の分野

Photobooth:Pixel 3で最高の自撮りを自動で撮影する(1/2)

1.Photobooth:Pixel 3で最高の自撮りを自動で撮影する(1/2)まとめ ・Pixel3搭載カメラアプリPhotoboothを使うと最適な集合写真を自撮りできる ・被写体全員が笑顔でカメラを見ている瞬間やキスの瞬間を自動撮影 ...
モデル

TALNet:Google Photosで動画から特別な瞬間を切り出す(1/2)

1.TALNet:Google Photosで動画から特別な瞬間を切り出す(1/2) ・Google Photosでアップされた動画から自動で印象的なシーンを切り出す事が可能になった ・これを実現しているTALNetは画像から物体を効率的に...
入門/解説

責任を持ってオープンデータを共有する

1.責任を持ってオープンデータを共有するまとめ ・2019年3月2日はOpen Data Dayと云うお祭りで世界でイベントが開催された ・日本でも57ものイベントが開催され中には毎年開催している地域もある ・GoogleはDataSet検...
その他の分野

Pixel3のPlaygroundとGoogle Lensで世界を違う側面から見る(2/2)

1.Pixel3のPlaygroundとGoogle Lensで世界を違う側面から見る(2/2)まとめ ・Google LensはPixel 3のカメラとより深く統合された ・カメラに映った電話番号やURL、住所を認識し、関連アプリケーショ...
その他の分野

Pixel3のPlaygroundとGoogle Lensで世界を違う側面から見る(1/2)

1.Pixel3のPlaygroundとGoogle Lensで世界を違う側面から見る(1/2)まとめ ・GoogleのAR研究がPixel 3搭載アプリで実装された結果の紹介 ・PlaygroundはシーンにマッチするARコンテンツをAI...
モデル

SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(1/2)

1.SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(1/2)まとめ ・現在の強化学習の問題点の1つは人間に比べて学習に非常に時間がかかる事である ・人間が効率的に学習できる理由は世界モデルを持っているからと推測されている ・モ...
モデル

RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(2/2)

1.RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(2/2)まとめ ・RNN-Tモデルは従来モデルに比べて1/5のサイズ圧縮に成功 ・更にTensorFlow Liteのモデル最適化ツールキットで1/4にサイズ...
AI関連その他

機械学習で自撮りにリアルタイムに拡張現実を適用(1/3)

1.機械学習で自撮りにリアルタイムに拡張現実を適用(1/3)まとめ ・拡張現実(AR)は、デジタルコンテンツや情報を現実世界に重ね合わせる技術 ・ARを現実に重ね合わせるためには現実世界の動きを正確に補足する必要がある ・2つのディープニュ...
学習手法

PlaNet:画像入力から世界モデルを学ぶ強化学習(2/3)

1.PlaNet:画像入力から世界モデルを学ぶ強化学習(2/3)まとめ ・エージェントは特定の操作によってボールの位置やゴールまでの距離がどのように変化するか想像出来る ・大量の計算が必要な画像作成を省略し将来の報酬を予測するだけでよいので...
入門/解説

Live TranscribeとSound Amplifierで音声をより身近にする

1.Live TranscribeとSound Amplifierで音声をより身近にするまとめ ・Live Transcribeは音声を携帯電話のマイクで受信し、リアルタイムで字幕に変換して表示すアプリ ・Sound Amplifierは雑...