data extraction

トレーニングデータ抽出攻撃：大規模言語モデルが記憶してしまうプライバシー情報(2/2)

１．トレーニングデータ抽出攻撃：大規模言語モデルが記憶してしまうプライバシー情報(2/2)まとめ・トレーニングデータ抽出攻撃の目標は言語モデルが何を記憶しているかを予測する事・ニュースヘッドライン、ログ、コード、個人情報などの幅広いコンテン...

2020.12.19

AI関連その他基礎理論

１．トレーニングデータ抽出攻撃：大規模言語モデルが記憶してしまうプライバシー情報(1/2)まとめ・言語モデルがトレーニング時に使用したデータの詳細を漏洩してしまう危険性が指摘された・大規模言語モデルを非公開データを使って公開している際に害を...

2020.12.18

AI関連その他基礎理論

１．定型書式から必要な情報を自動で抽出(2/2)まとめ・モデルはほとんどの項目でうまく機能したがdelivery_date(配達日)には改善の余地があった・これは今回使用した学習データにはdelivery_dateが余り含まれていなかったた...

2020.06.24

学習手法

１．GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(6/6)まとめ・GWASkbの作成に使用されたシステムは、Snorkel IEフレームワークの上にPythonで実装されている・本システムは少数の誤検出を発生させるため、全て自動...

2019.08.18

入門／解説

１．GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(2/6)まとめ・GWASkbは遺伝的多様体、表現型、およびp値を自動的に収集する・構文解析、候補生成、候補分類の３段階を経て文書から関係性を抽出・スタンフォードCoreNLPパイ...

2019.08.14

入門／解説