1.予想外の事をしでかす人工知能の例まとめ
・人工知能はルールや報酬を正しく設定しないと予想外の行動をとる事がある
・そういった予想外の行動の一覧をスプレッドシートで公開してくれている人がいる
・その予想外行動の中からわかりやすい事例を抜粋
2.ある意味人知を超えた人工知能の挙動
以下、元ネタは研究者のVictoria Krakovnaさんが収集してGoogleスプレッドシートとして発表している予想外の事をしでかした人工知能の一覧の意訳です。ある特定のゲームをプレイさせた時の挙動など元のゲームに詳しくないと理解できない事例などはばっさり削除した抜粋版です。もっと見たい方はオリジナルをご覧ください。Bertとか人類の優位性が揺らぐような重いお話が続いたのでほのぼの系で。パンケーキとサッカーロボがお気に入りです。
分類 | 内容 | 著者 |
Aircraft landing | 飛行機の着陸を行う進化型アルゴリズムは、物理シミュレータのオーバーフローエラーを利用しました。つまり、物理シミュレータの不具合を利用して現実世界であれば出力が0になるような行動から大きな出力を得て、その結果、パーフェクトスコアを取得しました。 | Feldt, 1998 |
Bicycle | サイクリングゲームで、ゴールに向かって「前進する事」と「転ばない事」が報酬と見なされる場合(しかし、ゴールから遠ざかる事にペナルティはない)、人工知能はゴールの周りを安定的にグルグルと回り続けるようなりました。 | Randlov & Alstrom, 1998 |
Block moving | テーブル上の目標位置にブロックをスライドさせるように訓練されたロボットアームは、ブロックではなくテーブル自体をスライドさせる事によって目標を達成しました。 | Chopra, 2018 |
Data order patterns | ニューラルネットに食用キノコと毒キノコの画像を分類させる学習をさせたのですが、食用キノコと毒キノコが交互に提示されるデータであったため、人工知能は入力データの順番のみに着目し、毒キノコの特徴を学習しませんでした。 | Ellefsen et al, 2015 |
Evolved creatures – falling | 速度を追及するように設計された仮想生物は、背が高くなり、自ら転倒することによって高速度を生み出しました。 | Sims, 1994 |
Evolved creatures – pole vaulting | ジャンプ力を追及するように設計された仮想生物は、本来地面に接していた部分がどれだけ高いかで評価されました。すると、その仮想生物は垂直方向にどんどん身長を伸ばし、ジャンプする代わりにひっくり返りました。 | Krcah, 2008 |
Gripper | 意図的に無効にされたグリッパ(ロボットアームの物体を掴む手の部分)を備えたロボットアームは、ボックスを叩いてグリッパを強引に開く方法を見つけた | Ecarlat et al, 2015 |
Indolent Cannibals | 生存にはエネルギーの確保が必要だが出産にはエネルギーがかからない人工生命シミュレーションで、ある種の仮想生物は、食用に子供を産む事やより沢山の子供を産むための仲間として子どもを扱うように生活様式を進化させました。 | Yaeger, 1994 |
Lego stacking | ブロックを持ち上げると、ブロックの底面のz座標(つまり高さ)に基づいて報酬を与えられた人工知能は、ブロックを持ち上げるのではなく反転させる事で報酬を得る事を学びました。 | Popov et al, 2017 |
Long legs | 自身の体を修正することを許されている強化学習エージェントは、歩いてゴールに向かうのではなく、前方に倒れるだけでゴールに達することを可能にするくらい非常に長い足を作り出しました。 | Ha, 2018 |
Minitaur | 背中でボールを運ぶように訓練された4足歩行の進化的アルゴリズムは、ボールを脚の関節に落として挟めば、ボールを落とさずに床を横切る事ができることを発見しました。 | Otoro, 2017 |
Pancake | パンケーキ作成ロボットはパンケーキをひっくり返す事により報酬を与えられたが、報酬はフライパンにパンケーキが触れていない時間の長さに基づいて与えられたため、その時間を最大にするためにパンケーキを可能な限り高く空中に放り投げることを学びました。 | Unity, 2018 |
Road Runner | エージェントはレベル2で負ける事を防ぐためにレベル1で自殺しました。 | Saunders et al, 2017 |
Soccer | ボールに触わる事によって報酬が与えられるように設計されたサッカーロボットは可能な限り振動しながらボールに触れる事を学びました。 | Ng et al, 1999 |
Tetris | 人工知能は負ける事を防ぐためにゲームをポーズしました。 | Murphy, 2013 |
3.予想外の事をしでかす人工知能の例関連リンク
1)docs.google.com
Specification gaming examples in AI – master list
2)jp.techcrunch.com
機械学習のシステムはときどき人間をびっくりさせる…学習内容に忠実なだけで
コメント