image-text

モデル

DALL·E:文章から画像を作成(2/3)

1.DALL·E:文章から画像を作成(2/3)まとめ・DALL·Eでは、画像に対する視点や3Dスタイル、光学的歪みも制御できる・「極端に拡大した視点」や「X線」スタイルで断面図や接写構図の画像も可能・入力文に指定されていない撮影状況の詳細を...
モデル

DALL·E:文章から画像を作成(1/3)

1.DALL·E:文章から画像を作成(1/3)まとめ・自然言語で記述した様々な概念を参考にして画像を作成する事ができるDALL·EをOpenAIが発表・DALL·Eは、テキストと画像のペアを使用して訓練されたGPT-3の120億パラメータ版...
入門/解説

ストリートビュー画像を道案内用AIの研究者に提供(1/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(1/3)まとめ・前方に進み線路そばの赤い消火栓の後で左折し3ブロック進む、などの指示はAIにとって難しい・VLN(視覚と言語による案内)と、SDR(特定視点からの空間的記述の解決)が必要...
学習手法

Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2)

1.Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2)まとめ・録音音声をリアルタイムで書き起こしてタグ付けし、検索しやすくするPixel用アプリが公開・Recorderと名付けられたこのアプリはオンデバイスで動作す...
学習手法

Live Caption:オンデバイスで音声コンテンツに字幕を付与(1/2)

1.Live Caption:オンデバイスで音声コンテンツに字幕を付与(1/2)まとめ・音声コンテンツに字幕を付ける新しいAndroidの機能、Live Captionが発表された・現在Pixel 4およびPixel 4 XLで利用可能、今...
入門/解説

Conceptual Captions:自動収集された新しい画像データセット

1.Conceptual Captions:自動収集された新しい画像データセットまとめ・人工知能を使ってネット上のIMGタグのALT属性からキャプションと画像を収取する試みが発表・Conceptual Captionsと名付けられたこの手法...