ロボット

入門/解説

ROBEL:3Dプリンタで作成可能な強化学習用ロボット(2/3)

1.ROBEL:3Dプリンタで作成可能な強化学習用ロボット(2/3)まとめ ・ROBELにはD'Clawを用いた操作タスクとD'Kittyを用いた歩行タスクが用意されている ・2つの機関でドキュメントと指示書のみを用いてROBELの構築と再...
ロボット

ROBEL:3Dプリンタで作成可能な強化学習用ロボット(1/3)

1.ROBEL:3Dプリンタで作成可能な強化学習用ロボット(1/3)まとめ ・シミュレーション環境でロボットを強化学習させると微妙な誤差や遅延により現実世界への展開が困難 ・しかし、物理的なロボットは高価で工業用途向けに作られているために強...
その他

気候変動に対してAIは何が出来るのか?(4/4)

1.気候変動に対してAIは何が出来るのか?(4/4)まとめ ・機械学習にできる作業の多くは測定や警報に関連している作業 ・機械学習は可能性を示したり物事を安価にする事で意思決定を支援可能 ・しかし集団として気候変動に立ち向かう最終的な意思決...
入門/解説

TCC:繰り返し動作に着目して動画を理解する学習手法(1/2)

1.TCC:繰り返し動作に着目して動画を理解する学習手法(1/2)まとめ ・特定の順序で行われる動作はキーとなる動作が常に存在し、他の条件が異なっても共通である ・例えばワインでもお茶でも水でも注ぐと言う動作には入れ物を手で掴む動作が必ず存...
入門/解説

Gen:新しいAI用プログラミング言語はディープラーニングを超える(2/2)

1.Gen:新しいAI用プログラミング言語はディープラーニングを超える(2/2)まとめ ・確率的プログラミングは、AIの新たなフロンティアとして有望視されている分野の1つ ・Genは確率的プラグラムの使用を容易にするため、問題に対して原理的...
入門/解説

Gen:新しいAI用プログラミング言語はディープラーニングを超える(1/2)

1.Gen:新しいAI用プログラミング言語はディープラーニングを超える(1/2)まとめ ・Genと言うjuliaベースの新しいプログラミング言語をMITが新たに開発 ・ディープラーニング以外の各種AIテクノロジーも部品として利用可能で効率的...
モデル

Off-Policy Classification:強化学習モデルを選別する新手法(2/2)

1.Off-Policy Classification:強化学習モデルを選別する新手法(2/2)まとめ ・OPCはSim-to-Realテクニックによって訓練されたモデルの評価に対しても有効であった ・OPCのスコアと現実世界のタスクの成功...
モデル

Off-Policy Classification:強化学習モデルを選別する新手法(1/2)

1.Off-Policy Classification:強化学習モデルを選別する新手法(1/2)まとめ ・完全ポリシー外強化学習は過去に収集されたデータのみを使って学習するタイプの強化学習 ・物理的なロボットがなくてもモデルをトレーニングが...
学習手法

Google Research Football:新しい強化学習環境(1/2)

1.Google Research Football:新しい強化学習環境(1/2)まとめ ・Google Research Footballは強化学習エージェントにサッカーをプレイさせる事ができる強化学習環境 ・短期視点、長期視点、ボールの...
入門/解説

教師なし学習による特徴表現解きほぐし手法の評価(2/2)

1.教師なし学習による特徴表現解きほぐし手法の評価(2/2)まとめ ・帰納的バイアスがなければ解きほぐした特徴表現の教師なし学習は不可能である ・解きほぐしが下流タスクに有用であるという仮定は検証できなかった ・将来の研究を促進するためにd...
入門/解説

教師なし学習による特徴表現解きほぐし手法の評価(1/2)

1.教師なし学習による特徴表現解きほぐし手法の評価(1/2)まとめ ・抽出した特徴量をもっと細かく具体的な単位に解きほぐすdisentangledな手法が注目されている ・「猫の特徴」ではなく耳と目と輪郭と毛色から猫を特定できれば一部が写っ...
入門/解説

3人のAIのパイオニアがチューリング賞を受賞

1.3人のAIのパイオニアがチューリング賞を受賞まとめ ・ノーベルコンピューティング賞ともいわれるチューリング賞をAIのパイオニア3名が共同受賞 ・ヨシュア・ベンジオ、ジェフリー・ヒントン、ヤン・ルカンの3博士は2004年にAIを共同研究 ...