dahara1

AI関連その他

The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(2/2)

1.The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(2/2)まとめ ・従来はF1スコアのような指標を使用していたが良いモデルであっても悪い閾値戦略をとると、パフォーマン...
AI関連その他

The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(1/2)

1.The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(1/2)まとめ ・機械学習のおかげで鳥類研究者は、現地調査の代わりに、鳥の鳴き声を録音して遠隔で生態系を分析可能にな...
入門/解説

思わずクリックしたくなるようなアイキャッチ画像はイラスト生成AIで自動生成できるのか?

1.思わずクリックしたくなるようなアイキャッチ画像はイラスト生成AIで自動生成できるのか? ・人目を惹くアイキャッチ画像を集めてイラスト生成AIをカスタマイズし、クリックを誘う画像をAIで生成しようとする試みを見かけた ・カスタムモデルを使...
学会

ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(2/2)

1.ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(2/2)まとめ ・HierTextデータセットは画像領域、テキストレイアウトが多様であり、既存データセットと比較して多くのテキストが含まれている ・HierTextは...
学会

ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(1/2)

1.ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(1/2)まとめ ・文書画像よりも複雑な背景を持つ自然画像にOCRを適応させる研究は場面内テキスト検出・認識や場面内テキスト位置決定と呼ぶ ・場面内テキスト検出・認識と...
モデル

FollowYourPose:画像生成モデルとポーズ動画と文章からキャラクターの動画を生成

1.FollowYourPose:画像生成モデルとポーズ動画と文章からキャラクターの動画を生成まとめ ・FollowYourPoseは棒人間形式にした動画とプロンプトを与えるとプロンプトと動画に基づいたキャラクター動画を簡単に作れる新モデル...
アプリケーション

segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデル

1.segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデルまとめ ・画像内にある物体を自動で認識して、切り出せるようにセグメンテーションマスクを作ってくれるSegment-Anything M...
モデル

USM:100以上の言語に対応した最先端の音声AI(2/2)

1.USM:100以上の言語に対応した最先端の音声AI(2/2)まとめ ・事前学習で得た知識によりUSMは下流タスクからのわずかな量の教師ありデータで良好な品質を達成することができる ・YouTubeデータを使った検証では73言語の平均で3...
モデル

USM:100以上の言語に対応した最先端の音声AI(1/2)

1.USM:100以上の言語に対応した最先端の音声AI(1/2)まとめ ・昨年の11月、Googleは世界で最も話されている1,000の言語をサポートする機械学習モデルの構築を目標に掲げた ・ユニバーサルスピーチモデルはその実現に向けた重要...
ロボット

Performer-MPC:Transformerをロボットに適用して機敏に自律走行させる(2/2)

1.Performer-MPC:Transformerをロボットに適用して機敏に自律走行させる(2/2)まとめ ・Performer-MPCはロボットに搭載可能で8msで応答し、830万のPerformerパラメータを備えておりリアルタイム...
ロボット

Performer-MPC:Transformerをロボットに適用して機敏に自律走行させる(1/2)

1.Performer-MPC:Transformerをロボットに適用して機敏に自律走行させる(1/2)まとめ ・人間中心の環境では狭い空間を安全かつ効率的に走行する事や適度な距離を保つ事など複雑なルールがロボットに要求される ・Trans...
入門/解説

言語モデル用のプロンプトエンジニアリングの経験則と実例

1.言語モデル用のプロンプトエンジニアリングの経験則と実例まとめ ・プロンプトの先頭に指示を入れ、##または"""で指示と文脈を区切る事で区切りを明確に伝える事ができる ・否定形でやってはいけないことだけを言うのではなく、代わりに何をすれば...