人工知能/機械学習

Apollo：コンピュータアーキテクチャのために機械学習を活用(2/3)

１．Apollo：コンピュータアーキテクチャのために機械学習を活用(2/3)まとめ・本調査ではアーキテクチャ探索を4つの最適化戦略で実施して結果を比較した・ランダム探索はランダムに、Vizierはベイズ最適化を用いて探索と開拓のバランス...

2021.02.17

モデル学習手法

１．Apollo：コンピュータアーキテクチャのために機械学習を活用(1/3)まとめ・最近の機械学習の進歩の要因の1つにTPUなどのカスタムアクセラレータの開発がある・急速に進化するMLモデルに順応するためにアーキテクチャの革新を続ける必...

2021.02.16

モデル学習手法

１．World Models Library：強化学習で将来の画像を予測する事に意味はあるのか？(2/2)まとめ・エージェントが予測する画像の画素数が増えるとパフォーマンスは一般的に向上・報酬予測の精度とエージェントのパフォーマンスの間...

2021.02.15

学習手法基礎理論

１．World Models Library：強化学習で将来の画像を予測する事に意味はあるのか？(1/2)まとめ・原則として強化学習で計画立案に厳密に必要なのは、将来の報酬を予測することだけ・しかし、最近の多くの強化学習手法で将来の画像...

2021.02.14

学習手法基礎理論

１．より少ないデータから表形式データを推論することを学習(2/2)まとめ・パフォーマンスを向上させるために反事実条件と合成の2つの新しい事前トレーニングを導入・経験則を用いてデータの一部分のみを使って計算効率を最適化出来ないかを調査・...

2021.02.13

アプリケーション学習手法

１．より少ないデータから表形式データを推論することを学習(1/2)まとめ・自然言語推論は通常の文章を対象にした研究は多いが構造化データに適用する研究は少ない・EMNLP 2020で表形式データ解析用にカスタマイズされた初の事前トレーニン...

2021.02.12

アプリケーション学習手法

１．GCP上で大きなモデルを動かした際のGPUの性能比較まとめ・Colabで動かせないモデルをGCP上で実行するとColabの凄みを改めて実感する事になる・GPUはベンチマークではなく実際のタスクやモデルで動かさないと性能差はわからない...

2021.02.11

インフラ

１．RxR：多言語の案内指示に対応する能力を測るベンチマーク(2/2)まとめ・RxRには約1,000万語が含まれており既存のデータセットの約10倍の規模・RxRを使い現在の最良のモデルであっても人間の半分程度のスコアである事が判明・R...

2021.01.31

基礎理論

１．RxR：多言語の案内指示に対応する能力を測るベンチマーク(1/2)まとめ・話し言葉や書き言葉を使った指示に応じて複雑な環境を案内できるAIの開発は大きな課題・視覚と言語のナビゲーション(VLN)と呼ばれるこの課題には、空間言語の高度...

2021.01.30

基礎理論

１．ETLの未来がELTではなくEL(T)である理由まとめ・ETLは柔軟性、視認性、及びデータ追加時にコストがかかる事が問題点である・ELTは、データを取り込んだ後に変換するのでデータ要件が変更されても追加コストが不要・最終的にExt...

2021.01.29

インフラ

１．ToTTo：表から文を抽出する能力を測るためのデータセット(2/2)まとめ・最もパフォーマンスの高いモデルであっても約20%の確率で情報を幻覚化するように見える・最先端のモデルでも幻覚、数値的推論、および稀なトピックに苦労している事...

2021.01.28

データセット

１．ToTTo：表から文を抽出する能力を測るためのデータセット(1/2)まとめ・自然言語生成は元の文章に存在しない幻覚のような文章を生成してしまう事がまだある・既存のデータセットでは幻覚の原因がデータノイズなのかモデルの欠点なのか特定が...

2021.01.27

データセット