基礎理論

基礎理論

弱いヒントを使って多腕バンディット問題を改善(2/2)

1.弱いヒントを使って多腕バンディット問題を改善(2/2)まとめ ・従来のUCBアルゴリズムをアームの組に対して実行し、最高のスコアを出したペアのどちらが良いかを弱いヒントから得る ・弱いヒントの概念を利用すると、時間軸に対する後悔の依...
基礎理論

弱いヒントを使って多腕バンディット問題を改善(1/2)

1.弱いヒントを使って多腕バンディット問題を改善(1/2)まとめ ・カジノに設置されているレバーが一本付いているスロットマシンを「one‐armed bandit(隻腕の悪党)」と呼称する ・レバーが複数ついているスロットマシンでどのレ...
基礎理論

機械学習が学習時に抜け道を見つけてズルをしてしまう事を防止(2/2)

1.機械学習が学習時に抜け道を見つけてズルをしてしまう事を防止(2/2)まとめ ・最も単純な顕著性評価法Gradient L2がBERTベースのモデルに対して良い結果 ・あるモデルでうまくいく方法が、他のモデルでうまくいかないこともある...
基礎理論

機械学習が学習時に抜け道を見つけてズルをしてしまう事を防止(1/2)

1.機械学習が学習時に抜け道を見つけてズルをしてしまう事を防止(1/2)まとめ ・最新の機械学習モデルは誤った推論を行って正しい予測をする事がある ・例えば画像内に含まれる透かしや背景を元に画像分類を行う事などがある ・これを防止する...
基礎理論

人工知能はサイズを大きくすると今までできなかった事が突然できるようになる(2/2)

1.人工知能はサイズを大きくすると今までできなかった事が突然できるようになる(2/2)まとめ ・創発的なプロンプトは小さなモデルで失敗し十分に大きなモデルで成功する ・思考連鎖のプロンプトは創発的であり小さいモデルでは標準プロンプトに劣...
基礎理論

人工知能はサイズを大きくすると今までできなかった事が突然できるようになる(1/2)

1.人工知能はサイズを大きくすると今までできなかった事が突然できるようになる(1/2)まとめ ・大きな人工知能の性能は小さな人工知能の性能傾向を元に予測可能な事が多い ・ある種のタスクは人工知能が特定のサイズを超えると突然性能が向上し始...
モデル

ReAct:わからなかったらググって、ググった情報を元にもう一度ググって必要な情報を探せる人工知能(2/2)

1.ReAct:わからなかったらググって、ググった情報を元にもう一度ググって必要な情報を探せる人工知能(2/2)まとめ ・ReActの軌跡を用いてより小さな言語モデルの微調整を行うことも検討中 ・ReActが推論を誤った際、人間が道筋を...
モデル

ReAct:わからなかったらググって、ググった情報を元にもう一度ググって必要な情報を探せる人工知能(1/2)

1.ReAct:わからなかったらググって、ググった情報を元にもう一度ググって必要な情報を探せる人工知能(1/2)まとめ ・言語モデルは様々なタスクに応用されているが学習済の知識しか利用できない ・また、長期的な視点にたって行動するための...
画像生成

MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(2/2)

1.MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(2/2)まとめ ・MUSIQは入力のエンコーディングを変更するだけなので互換性が高い ・MUSIQは従来手法と比較して画像品質評価で最先端のスコアを出せる ・MUSIQは...
画像生成

MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(1/2)

1.MUSIQ:フルサイズ画像で美観評価と技術的品質評価を行う(1/2)まとめ ・画像の品質を自動で評価するモデルは従来はCNNベースのものが主流であった ・CNN手法では入力画像を固定サイズにリサイズする制約を持つ場合が多い ・MU...
基礎理論

分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(2/2)

1.分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(2/2)まとめ ・知覚スコアを向上させる戦略はモデルの規模を縮小して精度を下げる事になる ・ユークリッド距離ではなく2つの知覚関数を用いて知覚的類似度を計算した ・スキ...
基礎理論

分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(1/2)

1.分類精度が高すぎるモデルは知覚的類似度を予測する用途に不向き(1/2)まとめ ・画素の違いから画像の類似性を推定する方法は人の知覚とあまり一致しない ・画像分類器内の中間特徴表現を使うと知覚的類似性に近い分類が出来る ・どのような...
タイトルとURLをコピーしました