WebBigData

RCE：報酬関数が不要な強化学習(2/2)

１．RCE：報酬関数が不要な強化学習(2/2)まとめ・自律エージェントに成功事例を提供する事でタスクを実行するように教える方法を提案・本手法では報酬関数の設計もエキスパートがデモして成功操作を見せる必要がなくなる・ユーザーの能力の違い...

2021.04.17

学習手法

１．RCE：報酬関数が不要な強化学習(1/2)まとめ・ロボット工学で使われる強化学習は望ましい行動を促すために報酬関数が必要になる・しかし報酬関数の設定は非常に面倒で手間がかかり追加の設備が必要になるケースがある・RCEは成功事例を示...

2021.04.16

学習手法

１．GPT-3を使った次世代アプリの紹介まとめ・GPT-3の発表から9か月だが既に300を超えるアプリケーションがAPI経由で使用している・顧客からの意見の要約、仮想存在との対話、超高速セマンティック検索などで実用化・プラットフォーム...

2021.04.15

アプリケーション

１．幅広い内容の質問に長文で回答可能な質問回答システムの進歩と課題(2/2)まとめ・Routing TransformersとREALMに基づいた質問応答システムは従来のスコアを更新・しかし既存のベンチマークには進歩を妨げるいくつかの問...

2021.04.14

モデル学習手法

１．幅広い内容の質問に長文で回答可能な質問回答システムの進歩と課題(1/2)まとめ・事実に基づく質問回答タスクに比べると長文形式の質問回答タスクの研究は非常に少ない・長文形式の質問回答をRouting Transformerと検索ベース...

2021.04.13

モデル学習手法

１．ゲーム開発に機械学習を活用(2/2)まとめ・人間がプレイ可能なゲーム数より多い何百万回ものシミュレーションが機械学習で可能・結果を分析し、ゲームを面白くするための工夫やデッキ間のバランスを取る事ができた・比較的単純なニューラルネッ...

2021.04.12

アプリケーション

１．ゲーム開発に機械学習を活用(1/2)まとめ・オンラインーゲームの人気は爆発的に高まっているがバランス調整は手間がかかる・機械学習を使って何百万回ものシミュレーションを実行してバランスを取る事が可能・ゲーム状態を画像をエンコーディン...

2021.04.11

アプリケーション

１．独自データを使って物体検出モデルの精度を上げる方法(2020年版)まとめ・2020年に物体検出モデルを再トレーニングしようとした時に取りうる選択肢の概要紹介・物体検出用データのラベル付け、データ拡張、モデリングなどを具体的に紹介・...

2021.04.10

AI関連その他モデル

１．超並列グラフ計算：理論から実践へ(2/2)まとめ・AMPCモデルを使用して、実用的で効率的な実装に触発された理論的フレームワークを構築・優れた実証的パフォーマンスと障害耐性を維持する新しい理論的アルゴリズム・グラフのサイズに関係な...

2021.04.09

モデル

１．超並列グラフ計算：理論から実践へ(1/2)まとめ・大規模なグラフは数千億の頂点を含むため一台のコンピュータでは処理しきれない・複数のコンピューターで分散処理を行う事で兆単位のグラフを処理できるが課題も発生・分散ハッシュテーブルを使...

2021.04.08

モデル

１．文字情報と画像情報を同じ概念として認識できる人工知能の出現(2/2)まとめ・ニューロンレベルでの単純な分析ではモデルの動作を完全に説明する事は出来ない・高度な抽象化は人工知能に対する新しい攻撃手法に繋がる可能性がある・個人やグルー...

2021.04.07

モデル基礎理論

１．文字情報と画像情報を同じ概念として認識できる人工知能の出現(1/2)まとめ・特定の女優さんの画像や名前に反応するニューロンが人間の脳内で見つかった事がある・ネットワークで機能するので特定のニューロンが反応するのはおかしいと反論があっ...

2021.04.06

モデル基礎理論