データセット Open Images V7:新たに疎らなラベルであるポイントラベルを採用(2/2) 1.Open Images V7:新たに疎らなラベルであるポイントラベルを採用(2/2)まとめ ・Open Images v7は注釈データを視覚化する仕組みも従来より充実している ・ポイントレベル注釈を含む全ての注釈を確認できるオールインワ... 2022.11.01 データセット
データセット Open Images V7:新たに疎らなラベルであるポイントラベルを採用(1/2) 1.Open Images V7:新たに疎らなラベルであるポイントラベルを採用(1/2)まとめ ・Open Imagesは約900万枚の画像に様々なラベルを付与した大規模データセット ・この度、ポイントレベルラベルという新しい疎らな注釈を追... 2022.10.31 データセット
学会 ECCV 2022におけるGoogleの存在感 1.ECCV 2022におけるGoogleの存在感まとめ ・10月23日から27日の間、イスラエルとヴァーチャル空間でECCV 2022が開催 ・Google社員も多数参加し60を超える論文の発表やワークショップを開催 ・本サイトで概要を翻... 2022.10.30 学会
学習手法 PI-ARS:視覚移動タスクに進化型の学習を採用して高速移動を実現(2/2) 1.PI-ARS:視覚移動タスクに進化型の学習を採用して高速移動を実現(2/2)まとめ ・PI-ARSは予測情報(PI)を使用して拡張ランダム探索(ARS)を改良した手法 ・高次元の入力情報の次元を削減して扱いやすくするためARSの性能が向... 2022.10.28 学習手法
学習手法 PI-ARS:視覚移動タスクに進化型の学習を採用して高速移動を実現(1/2) 1.PI-ARS:視覚移動タスクに進化型の学習を採用して高速移動を実現(1/2)まとめ ・進化戦略は自然界の仕組みに発想を得た最適化技術で強化学習に勝る点もある ・しかし高次元の感覚入力を必要とする問題への適用が困難な事が弱点であった ・P... 2022.10.27 学習手法
画像生成 MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(2/2) 1.MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(2/2)まとめ ・MUSIQは入力のエンコーディングを変更するだけなので互換性が高い ・MUSIQは従来手法と比較して画像品質評価で最先端のスコアを出せる ・MUSIQは画像品... 2022.10.26 画像生成基礎理論
画像生成 MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(1/2) 1.MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(1/2)まとめ ・画像の品質を自動で評価するモデルは従来はCNNベースのものが主流であった ・CNN手法では入力画像を固定サイズにリサイズする制約を持つ場合が多い ・MUSIQ... 2022.10.25 画像生成基礎理論
基礎理論 分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(2/2) 1.分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(2/2)まとめ ・知覚スコアを向上させる戦略はモデルの規模を縮小して精度を下げる事になる ・ユークリッド距離ではなく2つの知覚関数を用いて知覚的類似度を計算した ・スキップ結... 2022.10.24 基礎理論
基礎理論 分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(1/2) 1.分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(1/2)まとめ ・画素の違いから画像の類似性を推定する方法は人の知覚とあまり一致しない ・画像分類器内の中間特徴表現を使うと知覚的類似性に近い分類が出来る ・どのような画像分... 2022.10.23 基礎理論
データセット UL2 20B:オープンソースとして公開された200億パラメータを持つ統一言語モデル(2/2) 1.UL2 20B:オープンソースとして公開された200億パラメータを持つ統一言語モデル(2/2)まとめ ・UL2は異なる事前学習から得られる能力と帰納的バイアスをモデルに付与可能 ・従来モデルは微調整タスクとプロンプトベースの1ショットタ... 2022.10.18 データセット
データセット UL2 20B:オープンソースとして公開された200億パラメータを持つ統一言語モデル(1/2) 1.UL2 20B:オープンソースとして公開された200億パラメータを持つ統一言語モデル(1/2)まとめ ・言語モデルは事前学習のやり方により得意なタスクと不得意タスクが分かれる ・事前学習用の効果的な統一フレームワークを作成があればより効... 2022.10.17 データセット
データセット XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(2/2) 1.XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(2/2)まとめ ・36言語のほとんどで適切な地域から100枚の画像を収集する事に成功した ・注釈付け作業も画像の内容のみに基づいてキャプションを生成す... 2022.10.15 データセット