WebBigData

Waifu Diffusion 1.5 Beta 3を使ってLoRAとReference-only ControlNetを比較

１．Waifu Diffusion 1.5 Beta 3を使ってLoRAとReference-only ControlNetを比較まとめ・Waifu Diffusion 1.5 Beta3としてBase, Radiance, Ink, M...

2023.05.17

入門／解説画像生成

１．Reference-only ControlNet：ついに前処理さえ不要になったコントロールネットまとめ・ControlNetがアップデートにより「前処理せずとも参照画像と似た画像を作れるようになった！」というニュースが昨日あった・...

2023.05.16

入門／解説画像生成

１．GoogleはAI開発競争における防壁を持っていません！OpenAIもです！まとめ・Google社内から流出したとされる文章がGoogleはOpen Sourceの取り組みからもっと学ぶべきという趣旨を主張していた・Googleが巨...

2023.05.06

AI関連その他

１．Googleを辞めたヒントン先生の想いまとめ・ディープラーニングの父とも言われるヒントン先生が5/1にGoogleを退社していた事が報道される・AI開発競争が制御不能になっていく危険性について自由に発言するために退社されたとの事・...

2023.05.02

AI関連その他

１．AI関連の資料を作る際に使えるフリー素材集まとめ・chatGPTはあれほど賢いのに、何故、幻覚を見てしまうのか？・幻覚は幻覚と見抜けないと・話題のボット、入っています！２．チャットボットが幻覚を見てしまう理由を説明するフリー素材...

2023.05.01

AI関連その他

１．ゴールデンウィークは生成AIを楽しもう！オンライン無料体験講座開講のお知らせまとめ・何かを始めるのに演技の良い日といわれる一粒万倍日にWebbigdata e-learningという新サービスをスタート・情報や知識、ノウハウがAIに...

2023.04.27

入門／解説画像生成

１．スマートフォンで目を撮影して9種の病気の兆候を検出する(1/2)まとめ・昨年の研究ではディープラーニングを使って眼球写真を解析し糖尿病網膜疾患の状態や糖化ヘモグロビンの上昇を予測できることを示す結果を発表した・今年は更に研究を推し進...

2023.04.26

ヘルスケア

１．VLMaps：ロボットナビゲーションのための視覚-言語マップ(2/2)まとめ・VLMapsは、自然言語による記述で目印の地図座標を返すことが可能なためCode as Policiesで使う事ができる・追加のトレーニングや微調整なしに...

2023.04.25

ロボット

１．VLMaps：ロボットナビゲーションのための視覚-言語マップ(1/2)まとめ・人が物理的な世界でロボットより優れたナビゲーションが出来るのは周辺環境を認知する地図を構築する能力を持つため・視覚と言語の共同モデルを学習する事が増えてき...

2023.04.24

ロボット

１．新たに6モデルを追加したControlNet1.1が公開まとめ・一週間くらい前に従来の8モデルの改良版＋6モデルを追加したControlNet1.1がリリースされた・線画を自在に色塗りする事ができるLineart系の機能も追加された...

2023.04.23

入門／解説画像生成

１．Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(2/2)まとめ・Vid2Seqアーキテクチャにはビデオフレーム用のエンコーダー音声入力用のエンコーダーが含まれる・Vid2Seqモデル幅広い領域をカバーする...

2023.04.22

モデル

１．Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(1/2)まとめ・数分レベルの長さのビデオの中のすべてのイベントを説明するタスクを「高密度ビデオキャプション」という・標準的なビデオキャプションと比べて高度に...

2023.04.21

モデル