人工知能/機械学習

AI関連の資料を作る際に使えるフリー素材集

１．AI関連の資料を作る際に使えるフリー素材集まとめ・chatGPTはあれほど賢いのに、何故、幻覚を見てしまうのか？・幻覚は幻覚と見抜けないと・話題のボット、入っています！２．チャットボットが幻覚を見てしまう理由を説明するフリー素材...

2023.05.01

AI関連その他

１．Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(2/2)まとめ・Vid2Seqアーキテクチャにはビデオフレーム用のエンコーダー音声入力用のエンコーダーが含まれる・Vid2Seqモデル幅広い領域をカバーする...

2023.04.22

モデル

１．Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(1/2)まとめ・数分レベルの長さのビデオの中のすべてのイベントを説明するタスクを「高密度ビデオキャプション」という・標準的なビデオキャプションと比べて高度に...

2023.04.21

モデル

１．The Impact Lab:Googleの責任あるAI(2/2)まとめ・EARRはAI技術に関連する公平性や脆弱性をどのように概念化するかについて重要な視点とフィードバックを提供してきた・データ分析をする際は属性間の相関や関係が原...

2023.04.20

公平性

１．The Impact Lab:Googleの責任あるAI(1/2)まとめ・グローバル化したテクノロジーは大規模な社会的インパクトを生み出す可能性があり、責任あるAI開発を保証するために根拠ある研究アプローチは重要・Impact La...

2023.04.19

公平性

１．PaLM-E:ロボットは邪魔をされても引き出しからポテチを取り出すくらいはできるようになっている(2/2)まとめ・PaLM-Eはロボット操作タスクと視覚・言語タスクを共通の特徴表現で括ることで、汎化モデルを学習する新しいパラダイムを提...

2023.04.16

モデルロボット

１．PaLM-E:ロボットは邪魔をされても引き出しからポテチを取り出すくらいはできるようになっている(1/2)まとめ・ロボットモデルの規模拡大は一定の成功を収めているが、テキストや画像に匹敵する規模のデータセットがないので遅れをとっている...

2023.04.15

モデルロボット

１．The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(2/2)まとめ・従来はF1スコアのような指標を使用していたが良いモデルであっても悪い閾値戦略をとると、パフォーマン...

2023.04.13

AI関連その他

１．The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(1/2)まとめ・機械学習のおかげで鳥類研究者は、現地調査の代わりに、鳥の鳴き声を録音して遠隔で生態系を分析可能にな...

2023.04.12

AI関連その他

１．ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(2/2)まとめ・HierTextデータセットは画像領域、テキストレイアウトが多様であり、既存データセットと比較して多くのテキストが含まれている・HierTextは...

2023.04.10

学会

１．ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(1/2)まとめ・文書画像よりも複雑な背景を持つ自然画像にOCRを適応させる研究は場面内テキスト検出・認識や場面内テキスト位置決定と呼ぶ・場面内テキスト検出・認識と...

2023.04.09

学会

１．FollowYourPose:画像生成モデルとポーズ動画と文章からキャラクターの動画を生成まとめ・FollowYourPoseは棒人間形式にした動画とプロンプトを与えるとプロンプトと動画に基づいたキャラクター動画を簡単に作れる新モデル...

2023.04.08

モデル