data set

Google Research：2019年の振り返りと2020年以降に向けて(8/8)

１．Google Research：2019年の振り返りと2020年以降に向けて(8/8)まとめ・機械学習研究を促進するためにデータセットを公開しGoogle Dataset Searchで探しやすくした・数百万のタスクを処理しつつ新し...

2020.01.20

入門／解説

１．医療向けMLの開発から学んだ教訓(1/2)まとめ・医療用MLモデルを開発する際には医療現場でのワークフローに組み込む方法を知る必要がある・機械学習の実践者向けに医療用のMLソリューションを開発する方法を解説する文書を公開・医療従事...

2019.12.14

ヘルスケア

１．胸部X線画像を用いた深層学習モデルの開発(2/2)まとめ・モデルは放射線科医が一貫して見逃した病巣をしばしば特定する事があった・また、逆にモデルが見逃した病巣を放射線科医が発見する事もあった・ディープラーニングと人間のスキルを組み...

2019.12.07

AI関連その他

１．RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(2/3)まとめ・ほとんどの推薦システムは静的データセットを使用しておりユーザと実際に対話しているわけではい・また推薦ポリシーそのものがユーザーの行動に...

2019.11.26

入門／解説

１．SGD:スキーマガイド付き対話学習用データセット(1/2)まとめ・バーチャルアシスタントの保守運用や機能追加の難しさは適切なデータセットがない事が一因・Schema-Guided Dialogueデータセット(SGD)はこの問題に対...

2019.11.05

データセット

１．Google at ICCV 2019まとめ・ICCVが今週韓国で開催され、Googleは200名以上の社員と40以上のプレゼンを実施・MediaPipeや新しいOpen Images V5データセット、Google Lensの新し...

2019.11.02

入門／解説

１．PAWS：自然言語の言い換えの理解を促進する新しいデータセット(3/3)まとめ・BERTなどの強力なモデルはPAWSでトレーニングすると大幅に性能が向上・BOWなどの文脈情報を学習できないモデルではPAWSを使っても性能向上せず・...

2019.10.06

入門／解説

１．PAWS：自然言語の言い換えの理解を促進する新しいデータセット(2/3)まとめ・PAWSの作成には「言い換えペアになるかはわからないが意味ある文章を作成する単語交換モデル」を使用・単語変換モデルの出力結果を人間の評価者が目で言い換え...

2019.10.05

入門／解説

１．PAWS：自然言語の言い換えの理解を促進する新しいデータセット(1/3)まとめ・語順が変わっても意味が変わらないフレーズを言い換えペア、意味が変わるペアを非言い換えペアと言う・言い換えペアと非言い換えペアの識別は最先端のモデルでも苦...

2019.10.04

ビッグデータ

１．FaceForensics：ディープフェイク検出研究用のベンチマークまとめ・ディープラーニングは数年前には実現不可能と思われていた技術を実現させた・悪用の危険性が高い偽動画、すなわちディープフェイクも広まってしまった・ディープフェ...

2019.10.01

入門／解説

１．GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(3/6)まとめ・GWASkbは十分に高い精度を維持しながら、既存の文書からかなりの数の関連性を抽出・人間がキュレーションしたデータベースとは採用基準が異なるが他に掲載されてい...

2019.08.15

入門／解説

１．ディープニューラルネットワークにおける一般化ギャップの予測(2/2)まとめ・一般化ギャップと対数変換したマージン分布の統計的情報はほぼ完全に線形回帰式で表現可能・マージン分布にモデルの一般化度合いに関する重要な情報が含まれている可能...

2019.07.12

入門／解説