遂に機械は文脈を理解し始めました(1/2)

１．遂に機械は文脈を理解し始めました(1/2)まとめ

・人間同様に文章から自然言語の構造を学び応用できるAIが出現
・一般常識や文書から感情を読み取る必要があるような作業にも対応できる
・学習用データではなく文章をそのまま学習し様々な作業に応用できる事が革新的

２．AIは自然言語の仕組みを理解し始めています

以下、www.nytimes.comより「Finally, a Machine That Can Finish Your Sentence」の意訳です。元記事は2018年11月18日、Cade Metzさんによる投稿です。例によってJeff Deanが褒めていた文章で、BERTの出現の衝撃についてわかりやすく書かれた良文章です。後編はこちら。

他の人の考えを文章から読みとる事はAIにとって簡単な事ではありません。しかし、新しいシステムは自然言語の仕組みを理解し始めています。

今年の8月、シアトルに本拠地を置くアレン人工知能研究所の研究者がAIに対して英語の試験を実施しました。機械が文脈を理解して以下のような文を完成させることができるかどうかを調べたのです。

ステージでは、女性がピアノのシートに座っています。彼女は、

a）ベンチに座って彼女の妹が人形で遊べるようにしました。

b）音楽を演奏している誰かに微笑みかけました。

c）群衆の中にいて、ダンサーを見ています。

d）緊張した面持ちで鍵盤に指をかけました。

人間のあなたにとっては、これは簡単な問題でしょう。しかし、コンピュータにとってはかなり難しい問題でした。人間はテスト問題の88％以上を正確に答える事ができましたが、研究所のAIシステムは約60％しか回答できませんでした。しかし、自然言語を理解するAIシステムを構築することがどれほど難しいかを知っている専門家の間では、この正答率は素晴らしい成果と見なされました。

その2ヵ月後、Googleの研究チームがBertと呼ばれるシステムを発表しました。この改良されたシステムは、上記のような問題を人間同等に答える事ができました。更に、Bertはこの試験のために特別な学習や準備をしていませんでした。

Bertの出現は人工知能研究の重要な節目となります。ここ数カ月の間、研究者達はコンピュータシステムが自然言語を人間同様に一般的な方法で学び、そこから学習したことを様々な特定の作業に応用できることを証明しました。

これらのシステムはGoogleやアレン人工知能研究所などのいくつかの独立した研究機関によって迅速に開発されており、AlexaやGoogle Homeのようなデジタルアシスタントや法律事務所、病院、銀行などの多様な文書を自動的に分析するAIの改良に繋がります。

「AIが何かの作業を人間と同等のレベルで行う新しい方法が確立するたびに、人間が行う労働を自動化または効率化することができます」と、サンフランシスコに本拠を置き最先端のAI関連研究を行っている独立系の研究所、Fast.aiの創設者、Jeremy Howard氏は述べています。「これは弁護士やパラリーガル(弁護士の監督の下でアシスタント的な業務を手伝う人)の人生を楽にすることができます。そして、また医療の現場にも役立ちます」

この技術を応用すればAIが人間とまともな会話を続けることができるようになるかもしれません。

しかし、負の側面もあります。Twitterなどのソーシャルメディアサービスでは、この新しい研究によって、人間らしく行動して扇動を行うチャットボットの出現につながる可能性もあると、Howard氏は指摘します。研究者らは、AIを用いれば用意に画像を偽造するできる事を示しています。Howard氏は、この種の技術が自然言語分野にも広まるにつれて、インターネット上で見聞きしたことについてこれまで以上に懐疑的になる必要があると述べています。

自然言語を理解する新しいAIシステムは、従来のAIシステムが学習用に作られたデータを用いて学習するのに対して、人間によって書かれた数百万の文章をそのまま分析することによって学習を進めます。サンフランシスコにある研究所のOpenAIが構築したシステムでは、ロマンス小説やSFなどを含む数千の自己出版書籍を分析しました。GoogleのBertは、同じ書籍に加えてWikipediaの文章を分析しています。

それぞれの研究所が開発したシステムは、文章全体を分析することによって特定のスキルを習得しました。OpenAIはAIに文章内で次に使われる単語が何かを推測する事を学習させました。GoogleはBertに、文章のどの位置であってもそこに不足している単語が何であるか推測することを学習させました。しかし、これらの特定のタスクを習得しつつ、AIは言語がどのようにつながっているのかについても学んでいたのです。

「Bertが何百万という文章の中から、例えば「the man walked into a store and bought a ____ of milk」と言う文章の中で欠けている単語を推測できると言う事は、英語の単語間の基本的な関係の多くを理解していると見なす事ができます。」Bertの開発を主導したGoogleの研究者であるJacob Devlin氏はこう話します。(Bertは、Bidirectional Encoder Representations from Transformersの略です)

AIシステムは、この知識を他の作業に応用することができます。研究者がBertに質問とその回答のセットを提供すると、Bertは他の質問をされた際に自分自身で答える事ができるようになります。次に、同じイベントについて書かれたニュースの見出しを与えると、Bertは2つの文が似ている事も認識することができます。通常、コンピューターは完全に一致する文章だけを同一の文章と認識できます。

Bertはアレン研究所の一般常識を問うテストにも対応できます。また、百科事典の記事に関する質問に答えるテストにも対応する事ができます。酸素とは何ですか？降水量とは何ですか？更に別のテストでは、映画のレビューを書いた人の感情、つまりレビューが肯定的な内容なのか否定的な内容なのかを判断することもできます。

ニューヨーク大学で自然言語研究を専門とするSam Bowman教授は言います。「この種の技術はAIによる実現がまだ難しい多くの目標の達成に向けての重大な一歩です。このような技術が発展すれば、巨大で扱いにくい大量の情報の集まりを要約し、合成し、人々が重要な意思決定をする際に支援する事ができるようになります。」

OpenAIのシステムがリリースされてから数週間後、社外の研究者グループがチャットボットでの会話にそれを応用しました。独立した研究者のグループは、OpenAIの技術を使って最高のチャットボットを構築するシステムを作成しました。そして今月、GoogleはBertシステムを「オープンソース化」しているので、誰もがBertを使う事ができます。Devlin氏と彼の同僚は既に102の言語でのBertの学習を開始しています。

(遂に機械は文脈を理解し始めました(2/2)に続きます)