dahara1

データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)まとめ ・Wikipedia Biographiesによって機械翻訳の性別バイアス削減度合を評価する事が可能になった ・文脈を意識するモデル(contex...
データセット

ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)

1.ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)まとめ ・ニューラル機械翻訳は学習データ内の偏見やステレオタイプを翻訳に反映してしまう事がある ・文を個々に翻訳しており、性別情報は必ずしも個々の文内に明...
その他の調査

機械学習のトレーニングに失敗したしくじり事例

1.機械学習のトレーニングに失敗したしくじり事例まとめ ・データの収集とデータの品質向上は本質的に矛盾するので別作業として考える ・指標がないと感覚だけで是非を判断しなければならない状況に陥り難度が上がる ・自由に色々な事を試すためには経済...
アプリケーション

機械学習を使ってゲノムの発見を改善(2/2)

1.機械学習を使ってゲノムの発見を改善(2/2)まとめ ・機械学習を使った手法と人間の専門家が手動で全画像を診断した手法を比較した ・機械学習は専門家が見つけた65の関連のうち62を見付け更に93の新規関連を発見 ・機械学習が発見した新しい...
アプリケーション

機械学習を使ってゲノムの発見を改善(1/2)

1.機械学習を使ってゲノムの発見を改善(1/2)まとめ ・人が持つゲノムは、30億文字を超えるDNAで構成されているがごく一部が個人によって異なる ・個人固有のゲノムは健康状態に影響を与えるのでその関連性を調べる研究がGWAS ・従来は専門...
ビッグデータ

データサイエンティストは10年以内に絶滅する!?

1.データサイエンティストは10年以内に絶滅する!?まとめ ・AIの進歩につれてデータサイエンスの利用しやすさはどんどん向上している ・データサイエンスの「適用」ではなく「実行」に重点が置かれるようになった ・データサイエンスはビジネス領域...
量子コンピュータ

データの力で古典的機械学習が量子機械学習を凌駕(2/2)

1.データの力で古典的機械学習が量子機械学習を凌駕(2/2)まとめ ・量子カーネルは暗記を促進してしまうため古典的手法で簡単に扱える形状に苦しむことが多い ・量子embeddingを古典的な表現に投影する投影量子カーネル法を開発した ・十分...
量子コンピュータ

データの力で古典的機械学習が量子機械学習を凌駕(1/2)

1.データの力で古典的機械学習が量子機械学習を凌駕(1/2)まとめ ・量子コンピューターの優位性は通常、計算速度の速さとして語られる事が多い ・量子機械学習では利用できるデータの量も優位性の有無に影響を与える ・機械学習における量子優位性の...
学会

CVPR 2021におけるGoogleの存在感

1.CVPR 2021におけるGoogleの存在感まとめ ・6/19 - 6/25の間インターネット上のヴァーチャルイベントとしてCVPR 2021が開催 ・Google社員も多数参加し70を超える受理された出版物やワークショップを開催 ・...
データセット

PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(2/2)

1.PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(2/2)まとめ ・デリケートなトピックと望ましい行動の概要を決定し価値観をターゲットにしたデータを作成 ・価値観をターゲットにしたデータセットは80のサンプルを含みサ...
データセット

PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(1/2)

1.PALMS:厳選した少量のデータセットを使ってGPT-3の動作を制御(1/2)まとめ ・GPT-3に質問をすると非常に偏った価値観をベースに回答をしてくる場合がある ・少量の厳選したデータセットで価値観を微調整する事でこの偏った動作を是...
学習手法

SimGAN:敵対的強化学習を使い正確な物理シミュレータを構築(2/2)

1.SimGAN:敵対的強化学習を使い正確な物理シミュレータを構築(2/2)まとめ ・GANは現実世界の軌道と区別できない合成軌道を生成するためにも使用できる ・これによりシステム同定を手動ではなくGANを使用して実行する事ができる ・Si...