その他の調査

Stable Diffusionは写真とイラストのどちらが得意なのか?

1.Stable Diffusionは写真とイラストのどちらが得意なのか?まとめ ・18000枚の画像をStable Diffusionで生成し、スコア付けして傾向を分析した ・今回の実験では写真系よりイラスト系画像の方が相対的によい品質と...
モデル

MaxViTとMAXIM:ViTの効率を更に高めた視覚タスク用新モデル(2/2)

1.MaxViTとMAXIM:ViTの効率を更に高めた視覚タスク用新モデル(2/2)まとめ ・MAXIMは低レベルの画像間予測タスクのために調整されたUNetに似たアーキテクチャ ・画像サイズが大きくなっても計算量は線形に増えるだけなので高...
モデル

MaxViTとMAXIM:ViTの効率を更に高めた視覚タスク用新モデル(1/2)

1.MaxViTとMAXIM:ViTの効率を更に高めた視覚タスク用新モデル(1/2)まとめ ・視覚領域では畳み込みやAttentionを取り入れた手法が主流だがMLPという手法もある ・ViTとMLPは計算量が画像サイズに対して二次関数的に...
その他の分野

POM:色地図のように使える匂いの地図を作成(2/2)

1.POM:色地図のように使える匂いの地図を作成(2/2)まとめ ・嗅覚は食物の状態を知るために様々な種で使われている共通感覚の可能性がある ・匂いマップで離れている2つの匂い分子は代謝状態の変化にも時間がかかる ・匂いは虫除けにも応用が可...
その他の分野

POM:色地図のように使える匂いの地図を作成(1/2)

1.POM:色地図のように使える匂いの地図を作成(1/2)まとめ ・匂いは色に似ているが色より多様であり感覚に頼って観測するため分類が困難 ・色における色地図のように匂いをデジタル化して匂い地図が出来ないか考えた ・グラフニューラルネットワ...
その他の調査

人工知能に描いて貰ったイラストを人工知能に採点してもらう

1.人工知能に描いて貰ったイラストを人工知能に採点してもらうまとめ ・Stable Diffusionの学習データはドイツのLAIONという団体が収集した ・自イラストの除外を申請する事まだできないが将来的には対応予定 ・LAIONデータセ...
入門/解説

Stable Diffusion本家サイトに掲載されているプロンプトガイド

1.Stable Diffusion本家サイトに掲載されているプロンプトガイドまとめ ・人工知能に良い絵を描いて貰うためには入力プロンプトを工夫する必要がある ・初心者は生のプロンプトを使いがちだがスタイルやアーティスト指定が有効 ・プロン...
データセット

特許フレーズ類似性データセットの発表(2/2)

1.特許フレーズ類似性データセットの発表(2/2)まとめ ・特許フレーズ類似性データセットの有用性はKaggle競技会の結果で確認できた ・既存のNLPモデルと比較して大幅な改善を達成できる事が実証された ・Kaggleの設問は人間の専門家...
データセット

特許フレーズ類似性データセットの発表(1/2)

1.特許フレーズ類似性データセットの発表(1/2)まとめ ・特許文書では文脈に依存する用語が口語的な意味と全く異なる事がある ・これにより特許文書を従来の方法(キーワード検索など)で検索するのは困難 ・この課題に挑戦する次世代モデルのために...
画像生成

Stable Diffusionを使ってシシ神様をトトロに差し替える

1.Stable Diffusionを使ってシシ神様をトトロに差し替えるまとめ ・人工知能に絵の中の指定する一部分だけを差し替えて貰う機能がin-painting ・絵の範囲外の部分を補完して描いてくれるout-paintingと言う機能も...
その他の調査

絵画コンテストで人工知能が描いた絵が優勝!?

1.絵画コンテストで人工知能が描いた絵が優勝!?まとめ ・画像生成人工知能のMidjourneyで生成した画像が絵画コンペで優勝してしまった ・イラストやデジタルアート界隈では非常に騒がれているが規模は大きくない ・主催者とも合意が取れてお...
アプリケーション

使える時はGPUを使ってビデオ会議の背景置き換えを精緻化(2/2)

1.使える時はGPUを使ってビデオ会議の背景置き換えを精緻化(2/2)まとめ ・WebベースのGPUを使った推論はOpenGLの性能の約25%しか達成できない ・これはWebGLがML作業ではなく主に画像レンダリング用にに設計されたため ・...