openAI

学習手法

Meena:どんな会話にも対応できるチャットボット(2/3)

1.Meena:どんな会話にも対応できるチャットボット(2/3)まとめ ・MeenaはOpenAI GPT-2と比較してモデル容量が1.7倍で8.5倍以上多いデータでトレーニングされている ・チャットボットの品質を評価する従来の評価基準はバ...
入門/解説

人工知能とデータサイエンスの2019年の主な進展と2020年の予測research編(3/3)

1.人工知能とデータサイエンスの2019年の主な進展と2020年の予測research編(3/3)まとめ ・ビジネスにAIを採用させる事を成功するためにはビジネス固有のカスタムソリューションが必要 ・より複雑なデータサイエンスの問題には、特...
入門/解説

人工知能とデータサイエンスの2019年の主な進展と2020年の予測research編(1/3)

1.人工知能とデータサイエンスの2019年の主な進展と2020年の予測research編(1/3)まとめ ・AIが現実世界で益々使われるようになり拡張現実を組み合わせることで顧客体験が変わっていく可能性 ・2020年も言語モデルの分野で目覚...
入門/解説

Deep Double Descent:ディープラーニングは二度、パフォーマンスが向上する(2/2)

1.Deep Double Descent:ディープラーニングは二度、パフォーマンスが向上する(2/2)まとめ ・4.5倍以上のサンプルを使ってトレーニングをしているのにパフォーマンスが低下してしまう事もある ・逆により多くの学習をさせる事...
入門/解説

Deep Double Descent:ディープラーニングは二度、パフォーマンスが向上する(1/2)

1.Deep Double Descent:ディープラーニングは二度、パフォーマンスが向上する(1/2)まとめ ・モデルサイズ、データサイズ、トレーニング時間を増加させるとパフォーマンスは向上し悪化し向上する ・この現象はCNN、ResNe...
ロボット

ROBEL:3Dプリンタで作成可能な強化学習用ロボット(1/3)

1.ROBEL:3Dプリンタで作成可能な強化学習用ロボット(1/3)まとめ ・シミュレーション環境でロボットを強化学習させると微妙な誤差や遅延により現実世界への展開が困難 ・しかし、物理的なロボットは高価で工業用途向けに作られているために強...
入門/解説

GPT-2のリリースから六か月後の振り返り(2/2)

1.GPT-2のリリースから六か月後の振り返り(2/2)まとめ ・この度公開された774Mモデルに関する研究や使用方法が今後の公開方法に影響する ・GPT-2は近い将来出現が予想される強力な生成モデルの取り扱いに関するテストケースとなる ・...
入門/解説

GPT-2のリリースから六か月後の振り返り(1/2)

1.GPT-2のリリースから六か月後の振り返り(1/2)まとめ ・六カ月前に公開された小型モデルの6倍のパラメータを持つ大規模GPT-2が公開された ・偽ニュースの検出の研究は進んでいるが決定的な手法はまだない ・7割の人がGPT-2が作成...
モデル

Off-Policy Classification:強化学習モデルを選別する新手法(2/2)

1.Off-Policy Classification:強化学習モデルを選別する新手法(2/2)まとめ ・OPCはSim-to-Realテクニックによって訓練されたモデルの評価に対しても有効であった ・OPCのスコアと現実世界のタスクの成功...
入門/解説

Google Research Football:新しい強化学習環境(2/2)

1.Google Research Football:新しい強化学習環境(2/2)まとめ ・Football Academyでは様々なレベルの難易度を持つ多様なシナリオのセットが提供されている ・Football Academyを使えばFo...
学習手法

Google Research Football:新しい強化学習環境(1/2)

1.Google Research Football:新しい強化学習環境(1/2)まとめ ・Google Research Footballは強化学習エージェントにサッカーをプレイさせる事ができる強化学習環境 ・短期視点、長期視点、ボールの...
入門/解説

Snorkel MeTaLを用いた大規模マルチタスク学習(1/4)

1.Snorkel MeTaLを用いた大規模マルチタスク学習(1/4)まとめ ・教師あり学習問題に取り組む際に必要な要素はモデル、ハードウェアおよび訓練データの3つ ・モデルはオープンソース文化、ハードウェアはクラウドにより最新の物が比較的...