入門/解説

組成の一般化能力の測定(1/3)

1.組成の一般化能力の測定(1/3)まとめ ・人間は新しい単語の意味を学習し、それを他の文脈に適用することができる ・機械学習ではこのスキルは「組成の一般化(compositional generalization)」と呼ぶ ・しかし「組成...
その他の調査

人間中心の使いやすい機械学習フレームワークの設計(2/2)

1.人間中心の使いやすい機械学習フレームワークの設計(2/2)まとめ ・共通の欲求は新しいテンプレートを最初から作成するのではなく既存のテンプレートを変更する事 ・モデルを設計またはデバッグするときに使用できる実用的なヒント提供される事も望...
入門/解説

人間中心の使いやすい機械学習フレームワークの設計(1/2)

1.人間中心の使いやすい機械学習フレームワークの設計(1/2)まとめ ・モデルの振る舞いをAPIに抽象化することで機械学習を学びやすくする多くの努力が行われている ・非MLソフトウェア開発者がMLを日常業務に使うために必要なものについては調...
AI関連その他

Mesh-TensorFlowによる超高解像度画像解析(2/2)

1.Mesh-TensorFlowによる超高解像度画像解析(2/2)まとめ ・畳み込み演算では各フレームの端部分を超えてフィルターが適用されることがよくある ・ヘィロー交換と呼ばれるデータ通信ステップを実装し畳み込みの前に隣接する部分と通信...
モデル

Mesh-TensorFlowによる超高解像度画像解析(1/2)

1.Mesh-TensorFlowによる超高解像度画像解析(1/2)まとめ ・学習手法の進歩によりCNNモデルは数分で数百万の画像のデータセットを使って学習可能になった ・しかしCTスキャンなどの三次元画像は二次元画像に比べて画素数が非常に...
データセット

Open Images V6:新しいタイプの注釈localized narrativesが特徴(2/2)

1.Open Images V6:新しいタイプの注釈localized narrativesが特徴(2/2)まとめ ・Open Images V6では、視覚的関係の注釈の種類を1桁(約1.4k)増やした ・個々のアクションを実行する人間を含...
データセット

Open Images V6:新しいタイプの注釈localized narrativesが特徴(1/2)

1.Open Images V6:新しいタイプの注釈localized narrativesが特徴(1/2)まとめ ・多くの点で世界最大の画像データセットであるOpen Imagesのバージョン6が公開 ・バージョン6では新しいタイプの注釈...
データセット

ストリートビュー画像を道案内用AIの研究者に提供(3/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(3/3)まとめ ・Retouchdownは、TouchdownをStreetLearnに統合し、より使いやすく利用申請を簡略化したもの ・TouchdownをStreetLearnデータ...
入門/解説

ストリートビュー画像を道案内用AIの研究者に提供(2/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(2/3)まとめ ・研究コミュニティがTouchdownタスクを使用できるようにストリートビュー画像が利用しやすくなった ・Googleの利用規約と個人情報保護のために大量ダウンロードや無...
入門/解説

ストリートビュー画像を道案内用AIの研究者に提供(1/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(1/3)まとめ ・前方に進み線路そばの赤い消火栓の後で左折し3ブロック進む、などの指示はAIにとって難しい ・VLN(視覚と言語による案内)と、SDR(特定視点からの空間的記述の解決)が...
入門/解説

T5:Text-To-Text Transfer Transformerと転移学習の探索(3/3)

1.T5:Text-To-Text Transfer Transformerと転移学習の探索(3/3)まとめ ・T5はクローズドブック質問回答タスクで驚くほど優れており、人間がかなわない程の性能を見せる ・またGPT-2のように人間が読んで...
入門/解説

T5:Text-To-Text Transfer Transformerと転移学習の探索(2/3)

1.T5:Text-To-Text Transfer Transformerと転移学習の探索(2/3)まとめ ・NLP用の転移学習に導入されたアイデアと手法を広範囲にわたって調査して有用な知見を多く得た ・体系的な研究から得た最良の方法を組...