dataset

データセット

KYD:データセット探索用の新ツール(1/2)

1.KYD:データセット探索用の新ツール(1/2)まとめ ・Know Your Data(KYD)はデータ内の性別と年齢に関する偏見を見つける事ができるツール ・例えば画像の説明文が「男性」や「女性」で性別による偏りを見つける事ができる ・...
データセット

TimeDialとDisfl-QA:時の概念と流暢でない口語表現に対応するためのNLPデータセット(1/2)

1.TimeDialとDisfl-QA:時の概念と流暢でない口語表現に対応するためのNLPデータセット(1/2)まとめ ・自然な会話の中には、流暢でない発話の中断、感嘆、繰り返し、再開、訂正などが含まれる ・また会話を理解するには、イベント...
データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)まとめ ・Wikipedia Biographiesによって機械翻訳の性別バイアス削減度合を評価する事が可能になった ・文脈を意識するモデル(contex...
データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)まとめ ・ニューラル機械翻訳は学習データ内の偏見やステレオタイプを翻訳に反映してしまう事がある ・文を個々に翻訳しており、性別情報は必ずしも個々の文内に明...
データセット

PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(2/2)

1.PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(2/2)まとめ ・デリケートなトピックと望ましい行動の概要を決定し価値観をターゲットにしたデータを作成 ・価値観をターゲットにしたデータセットは80のサンプルを含みサ...
データセット

PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(1/2)

1.PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(1/2)まとめ ・GPT-3に質問をすると非常に偏った価値観をベースに回答をしてくる場合がある ・少量の厳選したデータセットで価値観を微調整する事でこの偏った動作を是...
データセット

MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)

1.MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(2/2)まとめ ・Open Imagesは「女の子」のラベルを「女性」に付与するかは作業者の感覚依存であった ・MIAPでは知覚された性別表現...
データセット

MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(1/2)

1.MIAP:Open Images Datasetの人間に付与された境界ボックスをより包含的に(1/2)まとめ ・Open Images ExtendedコレクションにMIAPデータセットを追加する事を発表 ・MIAPデータセットは元のO...
学習手法

SupCon:対照学習を教師有り学習に拡張(2/2)

1.SupCon:対照学習を教師有り学習に拡張(2/2)まとめ ・SupConは他の手法と比較して様々なデータセットでtop1精度を一貫して向上させる ・SupConはAutoAugment、RandAugment、およびCutMixを一貫...
学習手法

XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(2/2)

1.XMC-GAN:クロスモーダルな対照学習でテキストから画像を生成(2/2)まとめ ・XMC-GAN は各データセットで最先端のスコアを実現し他の手法より評価者に好まれた ・特により複雑なOpenImagesでもXMC-GAN は高品質の...
学習手法

KELM:ナレッジグラフを言語モデルの事前トレーニング資料に統合

1.KELM:ナレッジグラフを言語モデルの事前トレーニング資料に統合まとめ ・大規模な自然言語処理モデルは、インターネットから取得した自然言語の資料を活用する ・自然言語のテキストだけでは、知識の範囲が限られるため他の情報源もある事が望まし...
アプリケーション

Project Guideline:視力の弱い人が一人で走れるようにする(2/2)

1.Project Guideline:視力の弱い人が一人で走れるようにする(2/2)まとめ ・既存のデータセットは自動運転車用でランニング用途の学習に使う事が難しかった ・自動運転車用データ、合成データ、本当のランニングデータの3段階で転...