データセット XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(1/2) 1.XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(1/2)まとめ ・画像キャプショニングは画像に対する説明文を自動的に生成する機械学習タスク ・視覚情報と言語情報を同時に扱うためマルチモーダル研究の中... 2022.10.14 データセット
モデル AudioLM:スピーチの続きもピアノの続きも生成可能なオーディオ言語モデル(2/2) 1.AudioLM:スピーチの続きもピアノの続きも生成可能なオーディオ言語モデル(2/2)まとめ ・AudioLMの学習データは生のオーディオのみで文書化されたデータは未使用 ・人間の評価者は人間の音声とAudioLMの生成音声の見分けがつ... 2022.10.12 モデル
モデル AudioLM:スピーチの続きもピアノの続きも生成可能なオーディオ言語モデル(1/2) 1.AudioLM:スピーチの続きもピアノの続きも生成可能なオーディオ言語モデル(1/2)まとめ ・オーディオ言語モデルは文章ではなくオーディオを使って学習した言語モデル ・GPT-3のような言語モデルが出来る事がオーディオを使ってできるモ... 2022.10.11 モデル
学習手法 QuaRL:強化学習を量子化して高速化と環境負荷を低減(2/2) 1.QuaRL:強化学習を量子化して高速化と環境負荷を低減(2/2)まとめ ・ActorQでトレーニングの大幅な高速化と性能の維持が可能な事が確認された ・ポリシーの量子化で1.9倍から3.76倍まで炭素排出量の削減も確認された ・今後は他... 2022.10.07 学習手法
学習手法 QuaRL:強化学習を量子化して高速化と環境負荷を低減(1/2) 1.QuaRL:強化学習を量子化して高速化と環境負荷を低減(1/2)まとめ ・深層強化学習は逐次意思決定問題大きな進展を続けているが学習時間が長い ・計算負荷が高い事により温室効果ガスの総排出量も多くなってしまう ・量子化を適用する事で性能... 2022.10.06 学習手法
基礎理論 TensorStore:ペタサイズの高次元データを柔軟に効率的に処理する(1/2) 1.TensorStore:ペタサイズの高次元データを柔軟に効率的に処理する(1/2)まとめ ・最近の機械学習はペタ規模の巨大多次元データセットを操作する事も多い ・データは順番に読まれるわけではなく複数マシンに分散される事もある ・Ten... 2022.10.03 基礎理論
モデル LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(2/2) 1.LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(2/2)まとめ ・LFNRの制限の1つは狭い範囲から情報を取得しているため汎化できない事 ・GPNRでは同じ深度のポイント間で情報を交換するtransformerを追加... 2022.10.01 モデル基礎理論
モデル LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(1/2) 1.LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(1/2)まとめ ・ある風景の複数の写真から新しい視点を合成する視点合成タスクは長年の課題 ・LFNRではCDの光彩のような視点に依存する効果を再現する課題に取り組んだ ... 2022.09.30 モデル基礎理論
モデル FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(2/2) 1.FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(2/2)まとめ ・3つのタスク全てを同じ入力を取るように適応させ学習の効率化を行った ・全てのタスクに対して標準的な物体検出損失を使ったが驚くほ... 2022.09.28 モデル基礎理論
モデル FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(1/2) 1.FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(1/2)まとめ ・物体レベルの識別タスクは3種類あるが別々に研究される事が多い ・3種のタスクに柔軟に対応できるFindItと呼ばれる統一視覚モ... 2022.09.27 モデル基礎理論
学会 INTERSPEECH 2022におけるGoogleの存在感 1.INTERSPEECH 2022におけるGoogleの存在感まとめ ・9/18から9/22の間、韓国の仁川とヴァーチャルブースでINTERSPEECH 2022が開催 ・Google社員も多数参加し47の論文や8のワークショップ・チュー... 2022.09.24 学会
基礎理論 Dual Mirror Descent:どのタイミングでどのくらい売るのが最も儲かるかを予測する(2/2) 1.Dual Mirror Descent:どのタイミングでどのくらい売るのが最も儲かるかを予測する(2/2)まとめ ・資源の制約を扱う際のシンプルで強力なアイデアは「価格」の概念を導入する事 ・ミラーディセントは時間の経過とともに一様に資... 2022.09.23 基礎理論