ai model

アプリケーション

Mood Board Search:「平穏な」などの主観的な概念を使った画像検索を可能にする(2/2)

1.Mood Board Search:「平穏な」などの主観的な概念を使った画像検索を可能にする(2/2)まとめ ・ユーザが作成したムードボードに対するモデルの感度を見つけるためにCAVを使用 ・各ムードボードがCAVを作り、ツールが画像デ...
モデル

VDTTS:視覚駆動型の音声合成モデル(1/2)

1.VDTTS:視覚駆動型の音声合成モデル(1/2)まとめ ・ノイズの多い環境で録音されたオリジナルの音声をスタジオで再録音し品質を高める時がある ・新たに録音した音声と映像の同期を取る必要がありこの作業は難しく、面倒な作業となる ・VDT...
ヘルスケア

目を正面から撮影した写真で病気の兆候を検出(2/3)

1.目を正面から撮影した写真で病気の兆候を検出(2/3)まとめ ・モデルの性能をAUCで測定したところ、HbA1c の上昇を 67 ~ 70% で測定できた ・リストの上位5%を見ると69%はHbA1c測定値が9以上でこれは有意に高かった ...
ヘルスケア

機械学習を使って人工呼吸器の制御を改善(1/3)

1.機械学習を使って人工呼吸器の制御を改善(1/3)まとめ ・人工呼吸器は患者からの呼吸測定値に基づき、臨床医が処方した呼吸波形に合わせる ・患者の肺の違いや変化に対応可能な堅牢性と望ましい波形に追従する機能の両方が必要 ・機械学習により手...
ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)まとめ ・XIRLは実演者と学習者が異なる形状である際の模倣問題に取り組む手法 ・時間的サイクル整合性を用いて実施形態に依存しない報酬関数を学習 ・サンプル効率が高...
その他の調査

AI、機械学習、データサイエンス、ディープラーニングの2021年の進展と2022年の予測リサーチ編(2/2)

1.AI、機械学習、データサイエンス、ディープラーニングの2021年の進展と2022年の予測リサーチ編(2/2)まとめ ・OpenAIのCLIPは文章と画像をつなぐ、とてもエキサイティングな可能性を提示した ・文章から画像を作成するテクノロ...
モデル

GPT-3の約2倍の性能で算数の文章問題を解く人工知能

1.GPT-3の約2倍の性能で算数の文章問題を解く人工知能まとめ ・小学校の算数の問題を微調整したGPT-3モデルの約2倍の精度で解くシステムを開発 ・このシステムは、実際の子供たちが出した正答率の約90%の正答率で問題を解くことが可能 ・...
モデル

Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2)

1.Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2)まとめ ・音声間翻訳システムは通常、音声認識や機械翻訳、音声合成を順番に適用して実現 ・2019年には2言語間で翻訳元音声を翻訳先音声に直接翻訳できるTr...
アプリケーション

発声に困難を抱える人を自分自身の声で話せるようにする試み(1/2)

1.発声に困難を抱える人を自分自身の声で話せるようにする試み(1/2)まとめ ・ルー・ゲーリッグはALSで亡くなった野球選手で最も幸運な男というスピーチを行った ・ALSを発症して発声が困難になった元NFL選手がゲーリッグのスピーチを自声で...
データセット

C4_200M:文法エラー訂正用の合成データセット(2/2)

1.C4_200M:文法エラー訂正用の合成データセット(2/2)まとめ ・タグ付き破損モデルは再現したいエラーの種類をエラータイプタグで入力できる ・そのため現実世界で実際に見られる書き込みエラーの分布を再現する事ができる ・英語を母国語と...
データセット

KYD:データセット探索用の新ツール(2/2)

1.KYD:データセット探索用の新ツール(2/2)まとめ ・画像説明文内の「男性のまなざし」について調査し従来の研究結果を裏付ける事ができた ・高齢者は現実世界の集団内での存在に比べてデータセット内で過小評価されている事も判明 ・KYDを使...
ヘルスケア

機械学習を使って見落としやすい腫瘍の検出を支援(2/2)

1.機械学習を使って見落としやすい腫瘍の検出を支援(2/2)まとめ ・システムは検出が特に難しいelusive polypsの見逃しを防ぎ誤検知も少ない ・ポリープが視野内にある時間が短くとも従来システムより数倍の感度を達成 ・実証実験では...