画像生成

学習手法

DALL-E 2がセンシティブな画像を生成しないようにするための工夫(1/3)

1.DALL-E 2がセンシティブな画像を生成しないようにするための工夫(1/3)まとめ ・DALL-E 2は強力な画像生成モデルだがOpenAIのポリシーに違反しない工夫をしている ・工夫の一部にDALL-E 2の学習データを直接変更する...
画像生成

Latent Diffusion Modelsを使ってテキストから画像を生成

1.Latent Diffusion Modelsを使ってテキストから画像を生成まとめ ・Latent DiffusionはDALL·E Flowが内部で呼んでいるモデルのベースとなったモデル ・DALL·E同様にテキストから画像の生成だけ...
アプリケーション

DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(1/2)

1.DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(1/2)まとめ ・DALL·E Flowは幾つかのモデルを連携させてDALL·Eの性能や表現力を底上げする試み ・DALL·E と拡散モデルとSwinIR...
学習手法

30億のパラメータを持つ巨大モデルを学習させた際の知見

1.30億のパラメータを持つ巨大モデルを学習させた際の知見まとめ ・非常に巨大なモデルを学習させる際は混合精度と全精度で違いが出る可能性がある ・通常の学習では問題は発生しないが学習の収束が見込めるトレーニングの後半に出る ・DALL·E ...
アプリケーション

DALL·E 2:言葉による指示を理解してリアルな画像や芸術作品を作り出す人工知能

1.DALL·E 2:言葉による指示を理解してリアルな画像や芸術作品を作り出す人工知能まとめ ・昨年発表されたDALL·E言語解釈能力と生成画像の品質を更に高めたDALL·E 2が発表された ・DALL·Eの画像は少し稚拙な画像もあったがD...
入門/解説

Image GPTの画像補完の実例

1.Image GPTの画像補完の実例まとめ ・対称形なデザインはかなりの精度で補完されるが非対称デザインは凄い事になる場合がある ・S、M、Lの順にオリジナル画像を補完して再現する能力が上がっているようにみえる ・自然画像をそれっぽい物体...
モデル

Image GPT:自然言語処理用の人工知能で画像を生成(3/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(3/3)まとめ ・iGPTが強力な画像特徴表現を学習可能で教師有り、半教師モデルと匹敵する事が示された ・しかしGPUにV100を使って延べ2500日が必要で画像専用モデルの約3...
モデル

Image GPT:自然言語処理用の人工知能で画像を生成(2/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(2/3)まとめ ・モデルは画像生成を学んだ際に物体のカテゴリについても学習している可能性がある ・本研究で、より良い生成モデルがより強力な分類パフォーマンスを達成する事が示された...
モデル

Image GPT:自然言語処理用の人工知能で画像を生成(1/3)

1.Image GPT:自然言語処理用の人工知能で画像を生成(1/3)まとめ ・文章生成で有名になった人工知能を画像でトレーニングすると品質の高い画像を生成できた ・iGPTと名付けられたこのモデルは物体の外観など画像の特性を理解しているよ...
画像生成

DermGAN:機械学習トレーニング用に多様な皮膚状態の医療用画像を合成(1/2)

1.DermGAN:機械学習トレーニング用に多様な皮膚状態の医療用画像を合成(1/2)まとめ ・機械学習モデルを様々なケースで使用できるようするために肌の違いを含む多様な学習データが必要 ・肌画像の多様性を改善するためDermGANと呼ばれ...
画像生成

AutoFlip:機械学習を用いてビデオの最適な箇所を切り抜く(1/3)

1.AutoFlip:機械学習を用いてビデオの最適な箇所を切り抜く(1/3)まとめ ・テレビやデスクトップパソコン用のビデオはアスペクト比が違うのでモバイルデバイスでの再生に不適 ・従来のアスペクト比を修正する手法は固定箇所を切り抜くため重...
画像生成

動画のコラージュとディープラーニング

アイコラ(アイドルコラージュ)、つまりセクシーな静止画像の顔の部分をアイドルや女優さんに差し替えるイタズラは1990年代くらいに流行した。当時は静止画像が中心で、高い画像編集技術を持つ人が丁寧に時間をかけてつなぎ目に違和感のないように顔部を...