業界/分野

アプリケーション

Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(2/2)

1.Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(2/2)まとめ ・Pr-VIPEを使用して異なった視点から撮影された動画から同じポーズを検索する事が可能 ・カメラパラメータを使用せずに異なる視点から同じポーズを取...
アプリケーション

Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(1/2)

1.Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(1/2)まとめ ・人間の姿勢を画像や動画などで2次元として撮影するとカメラの視点によって見え方が異なる ・二次元情報のみを使用して三次元ポーズの類似性を認識できると...
アプリケーション

Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(2/2)

1.Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(2/2)まとめ ・Jukeboxは局所的には一貫性のある音楽を作成できるが曲全体で見るとまだ構造把握が甘い ・ダウンサンプリングとアップサンプリングを行っているためノ...
アプリケーション

Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(1/2)

1.Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(1/2)まとめ ・音楽におけるスタイル転送が歌声を含む生の音声データで可能なOpen AIのJukeboxの紹介 ・CD品質の音楽は1,000万を超えるタイムステップ...
アプリケーション

Portrait Light:機械学習を使ってポートレートモードの照明を強化(2/2)

1.Portrait Light:機械学習を使ってポートレートモードの照明を強化(2/2)まとめ ・照明方向とポートレートを指定する照明を元の写真に追加するモデルを学習させた ・トレーニングには多数のポートレートが必要でLight Stag...
アプリケーション

Portrait Light:機械学習を使ってポートレートモードの照明を強化(1/2)

1.Portrait Light:機械学習を使ってポートレートモードの照明を強化(1/2)まとめ ・ポートレート写真撮影時にプロはカメラから離した位置で照明器具を使用している ・これをシミュレートするためPixelカメラ及びGoogleフォ...
アプリケーション

MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(2/2)

1.MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(2/2)まとめ ・MediaPipe Holisticは2017年モデルや中価格帯のスマホほぼリアルタイムで実行可能 ・モデルがほとんど独立しているため、速...
アプリケーション

MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2)

1.MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2)まとめ ・MediaPipeはスマホで人間のポーズ、顔、手をリアルタイムで認識するフレームワーク ・従来のMediaPipeシリーズは各モデルで個々...
アプリケーション

時系列予測にAutoMLを使用する(2/2)

1.時系列予測にAutoMLを使用する(2/2)まとめ ・最新コンペであるM5予測コンペでAutoMLは銀メダルゾーンにあたる成績を収めた ・人間の参加者が数か月かかったモデル設計を2時間と人的介入なしでAutoMLは達成 ・他のデータセッ...
アプリケーション

時系列予測にAutoMLを使用する(1/2)

1.時系列予測にAutoMLを使用する(1/2)まとめ ・時系列予測は重要だがモデルの作成に専門知識が必要で現実世界では利用に制限がある ・AutoMLはMLモデルの作成プロセスを自動化することでMLをより広く利用可能にする ・現実世界のコ...
アプリケーション

Smart Scroll:録音データから探している音声を捜しやすくする(2/2)

1.Smart Scroll:録音データから探している音声を捜しやすくする(2/2)まとめ ・どのセクションを有益でユニークなものか決定するために2つのモデルを組み合わせた ・高評価のキーワードを持つ最高スコアのセクションを重要なセクション...
アプリケーション

Smart Scroll:録音データから探している音声を捜しやすくする(1/2)

1.Smart Scroll:録音データから探している音声を捜しやすくする(1/2)まとめ ・昨年、音声録音をより便利にする新しい録音アプリであるRecorderをリリース ・Recorderは最大18時間を転記できるため特定のセクションを...