natural language processing

アプリケーション

発声に困難を抱える人を自分自身の声で話せるようにする試み(1/2)

1.発声に困難を抱える人を自分自身の声で話せるようにする試み(1/2)まとめ ・ルー・ゲーリッグはALSで亡くなった野球選手で最も幸運な男というスピーチを行った ・ALSを発症して発声が困難になった元NFL選手がゲーリッグのスピーチを自声で...
学会

ACL 2021におけるGoogleの存在感

1.ACL 2021におけるGoogleの存在感まとめ ・8/1 - 8/6の間にインターネット上のヴァーチャルイベントとしてACL 2021が開催 ・Google社員も多数参加し35近くの出版物の公開やワークショップを開催 ・本サイトで概...
アプリケーション

OpenAI Codex:プログラミングを知らなくてもゲーム開発やプログラミング言語変換を可能にする人工知能

1.OpenAI Codex:プログラミングを知らなくてもゲーム開発やプログラミング言語変換を可能にする人工知能まとめ ・自然言語を使った指示をプログラムに変換するOpenAI CodexのAPIが本日からベータ受付開始 ・Codexは12...
アプリケーション

MicrosoftがGPT-3を利用した最初の製品を発表

1.MicrosoftがGPT-3を利用した最初の製品を発表まとめ ・ローコード開発ツールのMicrosoft Power Apps内でGPT-3の一部機能が使用可能に ・話言葉を計算式に変換可能になり6 月末までに北米全域で試用できるよう...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(2/3)まとめ ・類似性が高いと予想される新しいペアを抽出し、そのペアを人が評価する事にした ・キャプションの類似性が高い画像同士は類似性が高い可能性がある...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(1/3)まとめ ・自動画像キャプションはアルゴリズムで画像の説明を作成するタスクで目覚ましい進歩を遂げた ・これにより視覚情報と言語情報を紐づける研究に利用...
モデル

2021年時点の各分野における最先端の機械学習モデルの紹介

1.2021年時点の各分野における最先端の機械学習モデルの紹介まとめ ・未知の分野で作業を始める時、現時点の最先端モデルを調べるのは時間がかかる ・各MLタスクに最適なモデルをリスト化してまとめておくと手間がかなり省ける ・Kaggleのコ...
アプリケーション

GPT-3を使った次世代アプリの紹介

1.GPT-3を使った次世代アプリの紹介まとめ ・GPT-3の発表から9か月だが既に300を超えるアプリケーションがAPI経由で使用している ・顧客からの意見の要約、仮想存在との対話、超高速セマンティック検索などで実用化 ・プラットフォーム...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(3/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(3/3)まとめ ・CLIPは一般的な物体認識には優れているが抽象的または体系的なタスクには苦戦 ・CLIPは、言葉遣いや言い回しに過敏で機能させるために試行錯誤も必要 ・分類対...
入門/解説

ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版

1.ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版まとめ ・ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ30選 ・一般的なデータサイエンス用ツールは対象外とし、ニ...
モデル

REALM:言語特徴表現モデルに検索機能を持たせる(2/2)

1.REALM:言語特徴表現モデルに検索機能を持たせる(2/2)まとめ ・REALMでは、最適なドキュメントの選択は、最大内積検索を使っている ・REALMはOpen-QAタスクで30倍以上のパラメータを持つT5を約4ポイント上回った ・画...
学習手法

REALM:言語特徴表現モデルに検索機能を持たせる(1/2)

1.REALM:言語特徴表現モデルに検索機能を持たせる(1/2)まとめ ・事前トレーニング済みモデルは世界に関する知識を事前トレーニングで取得する ・モデルの重みの中に抽象化された概念として取り込まれるため取り扱いが困難 ・REALMは学習...