基礎理論

画像生成

MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(2/2)

1.MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(2/2)まとめ ・MUSIQは入力のエンコーディングを変更するだけなので互換性が高い ・MUSIQは従来手法と比較して画像品質評価で最先端のスコアを出せる ・MUSIQは画像品...
画像生成

MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(1/2)

1.MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(1/2)まとめ ・画像の品質を自動で評価するモデルは従来はCNNベースのものが主流であった ・CNN手法では入力画像を固定サイズにリサイズする制約を持つ場合が多い ・MUSIQ...
基礎理論

分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(2/2)

1.分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(2/2)まとめ ・知覚スコアを向上させる戦略はモデルの規模を縮小して精度を下げる事になる ・ユークリッド距離ではなく2つの知覚関数を用いて知覚的類似度を計算した ・スキップ結...
基礎理論

分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(1/2)

1.分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(1/2)まとめ ・画素の違いから画像の類似性を推定する方法は人の知覚とあまり一致しない ・画像分類器内の中間特徴表現を使うと知覚的類似性に近い分類が出来る ・どのような画像分...
基礎理論

TensorStore:ペタサイズの高次元データを柔軟に効率的に処理する(1/2)

1.TensorStore:ペタサイズの高次元データを柔軟に効率的に処理する(1/2)まとめ ・最近の機械学習はペタ規模の巨大多次元データセットを操作する事も多い ・データは順番に読まれるわけではなく複数マシンに分散される事もある ・Ten...
モデル

LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(2/2)

1.LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(2/2)まとめ ・LFNRの制限の1つは狭い範囲から情報を取得しているため汎化できない事 ・GPNRでは同じ深度のポイント間で情報を交換するtransformerを追加...
モデル

LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(1/2)

1.LFNRとGPNR:反射するCDを含む場面の視線合成が可能な新手法(1/2)まとめ ・ある風景の複数の写真から新しい視点を合成する視点合成タスクは長年の課題 ・LFNRではCDの光彩のような視点に依存する効果を再現する課題に取り組んだ ...
モデル

FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(2/2)

1.FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(2/2)まとめ ・3つのタスク全てを同じ入力を取るように適応させ学習の効率化を行った ・全てのタスクに対して標準的な物体検出損失を使ったが驚くほ...
モデル

FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(1/2)

1.FindIt:テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(1/2)まとめ ・物体レベルの識別タスクは3種類あるが別々に研究される事が多い ・3種のタスクに柔軟に対応できるFindItと呼ばれる統一視覚モ...
基礎理論

Dual Mirror Descent:どのタイミングでどのくらい売るのが最も儲かるかを予測する(2/2)

1.Dual Mirror Descent:どのタイミングでどのくらい売るのが最も儲かるかを予測する(2/2)まとめ ・資源の制約を扱う際のシンプルで強力なアイデアは「価格」の概念を導入する事 ・ミラーディセントは時間の経過とともに一様に資...
基礎理論

Dual Mirror Descent:どのタイミングでどのくらい売るのが最も儲かるかを予測する(1/2)

1.Dual Mirror Descent:どのタイミングでどのくらい売るのが最も儲かるかを予測する(1/2)まとめ ・デジタル化によりリアルタイムで意思決定を行う事が重要な市場が増えている ・限られた資源を効率的に割り当てるオンライン割り...
画像生成

スマホ写真で学習した人工知能はStable Diffusionの画像をどう評価するか?

1.スマホ写真で学習した人工知能はStable Diffusionの画像をどう評価するか?まとめ ・写真に写っている人とイラストに描かれている人は人工知能にとって異なる ・スマホ撮影写真の評価を行う人工知能にstable diffusion...