データセット XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(1/2) 1.XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(1/2)まとめ ・画像キャプショニングは画像に対する説明文を自動的に生成する機械学習タスク ・視覚情報と言語情報を同時に扱うためマルチモーダル研究の中... 2022.10.14 データセット
画像生成 Stable Diffusionを微調整するために必要な条件の調査 1.Stable Diffusionを微調整するために必要な条件の調査まとめ ・Stable Diffusionを独自データで微調整してイラストを改良している人達がいる ・Stable Diffusionを微調整するにはどの程度のデータと予... 2022.10.13 画像生成
画像生成 スマホ写真で学習した人工知能はStable Diffusionの画像をどう評価するか? 1.スマホ写真で学習した人工知能はStable Diffusionの画像をどう評価するか?まとめ ・写真に写っている人とイラストに描かれている人は人工知能にとって異なる ・スマホ撮影写真の評価を行う人工知能にstable diffusion... 2022.09.16 画像生成基礎理論
その他の調査 人工知能に描いて貰ったイラストを人工知能に採点してもらう 1.人工知能に描いて貰ったイラストを人工知能に採点してもらうまとめ ・Stable Diffusionの学習データはドイツのLAIONという団体が収集した ・自イラストの除外を申請する事まだできないが将来的には対応予定 ・LAIONデータセ... 2022.09.08 その他の調査画像生成
データセット 特許フレーズ類似性データセットの発表(2/2) 1.特許フレーズ類似性データセットの発表(2/2)まとめ ・特許フレーズ類似性データセットの有用性はKaggle競技会の結果で確認できた ・既存のNLPモデルと比較して大幅な改善を達成できる事が実証された ・Kaggleの設問は人間の専門家... 2022.09.06 データセット
データセット Google Universal Image Embeddingチャレンジの紹介(2/2) 1.Google Universal Image Embeddingチャレンジの紹介(2/2)まとめ ・同じ実体レベルの認識でもランドマークとアパレルでは実体にばらつきがあり性質が異なる ・従来の実体レベル認識を競うコンペでは対象とする領域... 2022.08.09 データセットAI関連その他
データセット Google Universal Image Embeddingチャレンジの紹介(1/2) 1.Google Universal Image Embeddingチャレンジの紹介(1/2)まとめ ・物体の属しているクラスではなく特定の実体まで認識する事を実体レベルの認識タスクと言う ・世界に一つしかない物体と多くの複製品を持つ可能性... 2022.08.08 データセットAI関連その他
データセット Auto Arborist Dataset:都市部に存在する樹木の分布を調査(2/2) 1.Auto Arborist Dataset:都市部に存在する樹木の分布を調査(2/2)まとめ ・森林モニタリングでは都市によって樹木分布が異なる分布シフトに対処が必要 ・属の分布は地理的にも都市の規模でも異なりロングテールになる事が困難... 2022.06.24 データセット
データセット Auto Arborist Dataset:都市部に存在する樹木の分布を調査(1/2) 1.Auto Arborist Dataset:都市部に存在する樹木の分布を調査(1/2)まとめ ・都市部の樹木は人々の健康と福祉に貢献し、都市の気候変動への適応に不可欠であり重要 ・多くの都市ではコストがかかるので樹木の位置や種類に関する... 2022.06.23 データセット
画像生成 Latent Diffusion Modelsを使ってテキストから画像を生成 1.Latent Diffusion Modelsを使ってテキストから画像を生成まとめ ・Latent DiffusionはDALL·E Flowが内部で呼んでいるモデルのベースとなったモデル ・DALL·E同様にテキストから画像の生成だけ... 2022.06.21 画像生成
データセット CVSS:大規模多言語音声間翻訳データセット(2/2) 1.CVSS:大規模多言語音声間翻訳データセット(2/2)まとめ ・CVSSは翻訳音声の他に、翻訳音声の発音に合わせた正規化された翻訳文も提供 ・CVSSはCreative Commons Attribution 4.0 Internati... 2022.04.14 データセット
データセット CVSS:大規模多言語音声間翻訳データセット(1/2) 1.CVSS:大規模多言語音声間翻訳データセット(1/2)まとめ ・ある言語の音声を別の言語の音声に自動翻訳する事を音声合成翻訳(S2ST)という ・S2STは直接翻訳するタイプと複数システムを連結して実現する2種が存在する ・直接型のS2... 2022.04.13 データセット