データセット

データセット

XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(2/2)

1.XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(2/2)まとめ ・36言語のほとんどで適切な地域から100枚の画像を収集する事に成功した ・注釈付け作業も画像の内容のみに基づいてキャプションを生成す...
データセット

XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(1/2)

1.XM3600:人が翻訳した説明文が付いた地理的に多様な多言語キャプションデータセット(1/2)まとめ ・画像キャプショニングは画像に対する説明文を自動的に生成する機械学習タスク ・視覚情報と言語情報を同時に扱うためマルチモーダル研究の中...
データセット

特許フレーズ類似性データセットの発表(2/2)

1.特許フレーズ類似性データセットの発表(2/2)まとめ ・特許フレーズ類似性データセットの有用性はKaggle競技会の結果で確認できた ・既存のNLPモデルと比較して大幅な改善を達成できる事が実証された ・Kaggleの設問は人間の専門家...
データセット

特許フレーズ類似性データセットの発表(1/2)

1.特許フレーズ類似性データセットの発表(1/2)まとめ ・特許文書では文脈に依存する用語が口語的な意味と全く異なる事がある ・これにより特許文書を従来の方法(キーワード検索など)で検索するのは困難 ・この課題に挑戦する次世代モデルのために...
データセット

Google Universal Image Embeddingチャレンジの紹介(2/2)

1.Google Universal Image Embeddingチャレンジの紹介(2/2)まとめ ・同じ実体レベルの認識でもランドマークとアパレルでは実体にばらつきがあり性質が異なる ・従来の実体レベル認識を競うコンペでは対象とする領域...
データセット

Google Universal Image Embeddingチャレンジの紹介(1/2)

1.Google Universal Image Embeddingチャレンジの紹介(1/2)まとめ ・物体の属しているクラスではなく特定の実体まで認識する事を実体レベルの認識タスクと言う ・世界に一つしかない物体と多くの複製品を持つ可能性...
データセット

画像の説明文を利用して視覚的質問回答データを作成(2/2)

1.画像の説明文を利用して視覚的質問回答データを作成(2/2)まとめ ・質問回答モデルと質問生成モデルの両方を使用して一貫性をチェックした ・既存データセットから生成したサンプルの66%~87%が妥当と評価された ・従来データに存在しなかっ...
データセット

画像の説明文を利用して視覚的質問回答データを作成(1/2)

1.画像の説明文を利用して視覚的質問回答データを作成(1/2)まとめ ・視覚的質問回答(VQA)は画像から視覚的に読み取れる質問に回答するシステム ・視覚と自然言語を同時に扱う必要がありマルチタスクで質問範囲が限定されていない ・VQAシス...
データセット

Auto Arborist Dataset:都市部に存在する樹木の分布を調査(2/2)

1.Auto Arborist Dataset:都市部に存在する樹木の分布を調査(2/2)まとめ ・森林モニタリングでは都市によって樹木分布が異なる分布シフトに対処が必要 ・属の分布は地理的にも都市の規模でも異なりロングテールになる事が困難...
データセット

Auto Arborist Dataset:都市部に存在する樹木の分布を調査(1/2)

1.Auto Arborist Dataset:都市部に存在する樹木の分布を調査(1/2)まとめ ・都市部の樹木は人々の健康と福祉に貢献し、都市の気候変動への適応に不可欠であり重要 ・多くの都市ではコストがかかるので樹木の位置や種類に関する...
データセット

Scanned Objects dataset:日用品を3Dスキャンしたデータセット(2/2)

1.Scanned Objects dataset:日用品を3Dスキャンしたデータセット(2/2)まとめ ・初期のスキャンモデルで摩擦や変形などの表面特性がなくシミュレーションに不適だった ・スキャンモデルをシミュレーションで利用できるよう...
データセット

Scanned Objects dataset:日用品を3Dスキャンしたデータセット(1/2)

1.Scanned Objects dataset:日用品を3Dスキャンしたデータセット(1/2)まとめ ・コンピュータビジョンとロボット工学の進歩は多種多様なデータによって可能に必要となる ・データセットの作成には多大な労力が必要だがそれ...