basic theory

入門/解説

組成の一般化能力の測定(3/3)

1.組成の一般化能力の測定(3/3)まとめ ・compound divergenceという新しい指標によりデータセットの難度を数値で表す事ができた ・代表的な3つの標準的なMLアーキテクチャは難度があがるにつれて正確性が直線的にさがってしま...
データセット

ストリートビュー画像を道案内用AIの研究者に提供(3/3)

1.ストリートビュー画像を道案内用AIの研究者に提供(3/3)まとめ ・Retouchdownは、TouchdownをStreetLearnに統合し、より使いやすく利用申請を簡略化したもの ・TouchdownをStreetLearnデータ...
ヘルスケア

Google Research:2019年の振り返りと2020年以降に向けて(3/8)

1.Google Research:2019年の振り返りと2020年以降に向けて(3/8)まとめ ・機械学習をクラウド上ではなくスマートフォン上で実行する事に注力し音声、視覚、文字の認識が可能に ・これによりプライバシー保護と応答速度向上、...
ヘルスケア

医療向けMLの開発から学んだ教訓(2/2)

1.医療向けMLの開発から学んだ教訓(2/2)まとめ ・機械学習を評価する際には不適切なチューニングでパフォーマンスが過大評価されてないか留意が必要 ・特に医療分野と機械学習分野では用語の意味が異なる「検証セット」が誤解を招く恐れがある ・...
データセット

SGD:スキーマガイド付き対話学習用データセット(1/2)

1.SGD:スキーマガイド付き対話学習用データセット(1/2)まとめ ・バーチャルアシスタントの保守運用や機能追加の難しさは適切なデータセットがない事が一因 ・Schema-Guided Dialogueデータセット(SGD)はこの問題に対...
入門/解説

PAWS:自然言語の言い換えの理解を促進する新しいデータセット(2/3)

1.PAWS:自然言語の言い換えの理解を促進する新しいデータセット(2/3)まとめ ・PAWSの作成には「言い換えペアになるかはわからないが意味ある文章を作成する単語交換モデル」を使用 ・単語変換モデルの出力結果を人間の評価者が目で言い換え...
入門/解説

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(3/6)

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(3/6)まとめ ・GWASkbは十分に高い精度を維持しながら、既存の文書からかなりの数の関連性を抽出 ・人間がキュレーションしたデータベースとは採用基準が異なるが他に掲載されてい...
入門/解説

Googleを巨大にした友情(6/9)

1.Googleを巨大にした友情(6/9)まとめ ・JeffとSanjayも朝型で9時前から働き始めている ・エスプレッソマシンからの朝の一杯のカプチーノは重要 ・Sanjayが使っているエディタはEmacsで手書きのノートも愛用 2.Je...
入門/解説

Googleを巨大にした友情(4/9)

1.Googleを巨大にした友情(4/9)まとめ ・芸術や科学の世界でもペアが偉大なアイディアの基礎となった例は多い ・二つの脳が同時に袋小路に陥ってしまう事は滅多になくお互いを補う ・過去35年間のノーベル生理学・医学賞の約半分が科学者の...
モデル

Snorkel Drybell:既存知識を活用して機械学習用ラベル付きデータを自動作成(3/3)

1.Snorkel Drybell:既存知識を活用して機械学習用ラベル付きデータを自動作成(3/3)まとめ ・実製品として利用しにくい機能や知識もSnorkel DryBellでラベル付きデータを出力可能 ・転移したラベル付きデータを利用す...
入門/解説

Natural Questions:質問回答システムのための新しいコーパス

1.Natural Questions:質問回答システムのための新しいコーパスまとめ ・自然言語で表現された質問と回答のセットであるNatural Questionsが公開 ・長文を読むことによって回答を見つける事ができるかに焦点を当てたデ...
入門/解説

人工知能を創造するために生物の知能の仕組みを探求する試み(6/6)

1.人工知能を創造するために生物の知能の仕組みを探求する試み(6/6)まとめ ・スタンフォードでは「知性の出現に関する潜在的な法則」を解明するプロジェクトが立ち上がった ・そのために異なる分野を横断し、自由にアイデアを交換する新しい研究コミ...