learning method

AI関連その他

The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(2/2)

1.The BirdCLEF 2023 Challenge:鳥の鳴き声を分類して生態系保存活動に役立てるkaggleコンペ(2/2)まとめ ・従来はF1スコアのような指標を使用していたが良いモデルであっても悪い閾値戦略をとると、パフォーマン...
データセット

Flan Collection:指示調整用のデータセットを更に充実(1/2)

1.Flan Collection:指示調整用のデータセットを更に充実(1/2)まとめ ・自然言語処理が新しいタスクに適応する能力は「指示調整」と呼ばれる多様な指示でモデルを訓練する事に起因する ・Flan Collectionは以前のFL...
ヘルスケア

プライバシーに配慮しながら医療現場の略語を解読可能な機械学習を実現(2/2)

1.プライバシーに配慮しながら医療現場の略語を解読可能な機械学習を実現(2/2)まとめ ・略語展開タスクは構造化されていないため性能計測が困難であったが新規にアルゴリズムを開発した ・医療用略語に対する理解は一般人で30%未満、医師で90%...
その他の調査

ChatGPTにPyTorchの使い方を手鳥足取り教えてもらう方法

1.ChatGPTにPyTorchの使い方を手鳥足取り教えてもらう方法まとめ ・Stable DiffusionやChatGPTはアイディアやたたき台を迅速に作るのに適したツールとの認識を持っていた ・しかし直近で探求が進んでいるChatG...
モデル

RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(2/2)

1.RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(2/2)まとめ ・RT-1は他のロボットの経験を観察する事で新しいスキルを身につける事が可能 ・SayCanとRT-1を組み合わせる事によって初見のキ...
ロボット

Interactive Language:ロボットとリアルタイムに会話で指示を行う(1/2)

1.Interactive Language:ロボットとリアルタイムに会話で指示を行う(1/2)まとめ ・ロボット学習のビジョンの一つは言語による命令に従う役に立つロボットの実現 ・従来のロボット学習システムに欠けているのは人間とのリアルタ...
データセット

Google Universal Image Embeddingチャレンジの紹介(2/2)

1.Google Universal Image Embeddingチャレンジの紹介(2/2)まとめ ・同じ実体レベルの認識でもランドマークとアパレルでは実体にばらつきがあり性質が異なる ・従来の実体レベル認識を競うコンペでは対象とする領域...
データセット

Auto Arborist Dataset:都市部に存在する樹木の分布を調査(2/2)

1.Auto Arborist Dataset:都市部に存在する樹木の分布を調査(2/2)まとめ ・森林モニタリングでは都市によって樹木分布が異なる分布シフトに対処が必要 ・属の分布は地理的にも都市の規模でも異なりロングテールになる事が困難...
ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)まとめ ・XIRLは実演者と学習者が異なる形状である際の模倣問題に取り組む手法 ・時間的サイクル整合性を用いて実施形態に依存しない報酬関数を学習 ・サンプル効率が高...
モデル

MURAL:ヒンディー語で野菜を入れない麺が入った丼を検索されても対応画像を探せる人工知能(1/2)

1.MURAL:ヒンディー語で野菜を入れない素の麺が入った丼を検索されても対応画像を探せる人工知能(1/2)まとめ ・概念の多くは、ある言語から別の言語への直接的に一対一に翻訳する事ができない ・連想するものが異なるためだが概念のイメージを...
データセット

C4_200M:文法エラー訂正用の合成データセット(2/2)

1.C4_200M:文法エラー訂正用の合成データセット(2/2)まとめ ・タグ付き破損モデルは再現したいエラーの種類をエラータイプタグで入力できる ・そのため現実世界で実際に見られる書き込みエラーの分布を再現する事ができる ・英語を母国語と...
データセット

Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)

1.Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)まとめ ・機械学習ではモデル構築が優先されデータ関連作業の優先度が低くなる事はよくある ・データ整備を軽視すると時間経過とともに技術的負債が発生し...