WebBigData

VideoBERT：ビデオ内の画像と音声を組み合わせて学習(3/3)

１．VideoBERT：ビデオ内の画像と音声を組み合わせて学習(3/3)まとめ・VideoBERTはベースラインとした完全教師付き学習のtop-5 accuracyに匹敵する精度を達成・VideoBERTはヴィジュアルトークン作成時に細かい...

2019.09.20

学習手法

１．VideoBERT：ビデオ内の画像と音声を組み合わせて学習(2/3)まとめ・ビデオ内の画像とテキストを組み合わせたクロスモーダルな文章を元にVideoBERTを学習させた・VideoBERTを、料理、ガーデニング、車両修理など、100万...

2019.09.19

モデル

１．VideoBERT：ビデオ内の画像と音声を組み合わせて学習(1/3)まとめ・機械学習で動画内でどのような活動が行われているのかを認識させるのは困難・従来手法では細かくラベル付けされた大量の動画が必要になるがこれは高価・動画内の音声は画像...

2019.09.18

学習手法

１．モジュラーディープラーニング用の再帰的スケッチ(2/2)まとめ・モジュラーディープネットワークは複数の独立したニューラルネットワークから構成される・モジュラーディープネットワークに対応するスケッチは、再帰的なメカニズムで対処する・スケッ...

2019.09.17

モデル

１．モジュラーディープラーニング用の再帰的スケッチ(1/2)まとめ・スケッチとはディープニューラルネットワークが入力をどのように処理しているかを要約する試み・スケッチはニューラルネットワークに記憶を元にした回答や要約機能を持たせる事に繋がる...

2019.09.16

入門／解説

１．長文を読みあげる合成音声の品質を評価する(2/2)まとめ・複数の文が含まれる長文を評価する事は人間の音声を評価対象にしても評価がぶれる・長文を読みあげる合成音声の評価は簡単ではなく、人間の行動真理などが関係している可能性がある・段落全体...

2019.09.15

その他の調査

１．長文を読みあげる合成音声の品質を評価する(1/2)まとめ・合成音声の品質評価は従来１文ごとに行われており、文脈の中で評価する統一基準は存在しない・しかし評価対象の文を長い文章の一部として評価すると従来と来なる評価基準が採用されている・人...

2019.09.14

入門／解説

１．自然言語による対話を訓練するための２つの新しいデータセットまとめ・デジタルアシスタントの対話能力向上に利用できるデータセットが公開・人間同士の対話に基づいているため現実世界の対話により近いデータ・好みに関する対話のCCPEと特定タスクに...

2019.09.13

その他

１．2019 Google PhDフェローシップサミットのハイライトまとめ・ 2018 Google PhD Fellowship Summitがマウンテンビューで開催・PhDフェローシッププログラムの受賞者はGoogleから様々なバックア...

2019.09.12

入門／解説

１．Google LensのGoogle Goバージョン(2/2)まとめ・OCRエンジンの誤読に備えて、文脈やナレッジグラフから手がかりを得て精度を上げている・翻訳した文章が元の文章のどの部分に該当するかわかるように着色を行う・カラオケのよ...

2019.09.11

AI関連その他

１．Google LensのGoogle Goバージョン(1/2)まとめ・Google Lensは読み書きに困難を感じている世界の8億人の人々を手助けできる潜在能力がある・しかし、従来のGoogle Lensはある程度機能が高いスマートフォ...

2019.09.10

入門／解説

１．気候変動に対してAIは何が出来るのか？(5/4)まとめ・貴方のスキルがどのように役立つかを特定する事・共同作業者を見つけ意見を聞き、作業が望ましい影響を与えるように考案・インパクトを実現できる場所に作業を展開２．気候変動に対してMLの力...

2019.09.09

入門／解説