基礎理論

プライバシー

実用的な差分プライベートクラスタリング(1/2)

1.実用的な差分プライベートクラスタリング(1/2)まとめ ・k-meansクラスタリングは機密性の高いデータセットを処理する際は問題がある ・データポイントが他と大幅に離れていると単一のクラスタを構成してしまうため ・差分プライバシー方式...
基礎理論

Underspecification:検証データで測定した精度のみに頼る事の落とし穴(3/3)

1.Underspecification:検証データで測定した精度のみに頼る事の落とし穴(2/3)まとめ ・標準的な検証データセットを使ったテストだけでは医療用モデルの動作を保証できていない ・自然言語処理など他のタスクでも性別に相関する挙...
基礎理論

Underspecification:検証データで測定した精度のみに頼る事の落とし穴(2/3)

1.Underspecification:検証データで測定した精度のみに頼る事の落とし穴(2/3)まとめ ・ImageNetで良好に機能する画像分類モデルは破損画像では不十分な性能しか出せない ・ImageNetで同等パフォーマンスを達成す...
基礎理論

Underspecification:検証データで測定した精度のみに頼る事の落とし穴(1/3)

1.Underspecification:検証データで測定した精度のみに頼る事の落とし穴(1/3)まとめ ・機械学習モデルは現実世界で使用すると予期していなかった動作をする事がある ・検証を行ったモデルであっても製品展開後に一貫性がなくなる...
基礎理論

ディープラーニング比較用のベースラインを利用しやすくする(2/2)

1.ディープラーニング比較用のベースラインを利用しやすくする(2/2)まとめ ・不確実性ベースラインでは、モデル、データセット、評価指標を選択可能 ・各ベースラインのトレーニング/評価パイプラインはPythonファイルに含まれる ・ベースラ...
基礎理論

ディープラーニング比較用のベースラインを利用しやすくする(1/2)

1.ディープラーニング比較用のベースラインを利用しやすくする(1/2)まとめ ・MLモデルのパフォーマンスは「基準となるモデル(ベースライン)」と比較して測定される ・ベースラインモデルを説明している論文からベースラインモデルを完全再現する...
基礎理論

道路網を効率的に分割して最短経路探索を高速化(2/2)

1.道路網を効率的に分割して最短経路探索を高速化(2/2)まとめ ・最初に緊密に接続されたノード同士をグループ化してグラフを小さくする ・これを実現するためにランダムウォークを使用して閉じた領域を捜している ・閉じた領域群をグループ化してシ...
基礎理論

道路網を効率的に分割して最短経路探索を高速化(1/2)

1.道路網を効率的に分割して最短経路探索を高速化(1/2)まとめ ・古典的なアルゴリズムは現在も大規模問題の解決に役立つことが良くある ・ランダムウォークを使用して北米大陸の道路網全体を高品質に分割できた ・同様の出力品質を持つ他の分割アル...
基礎理論

評価が難しい作業を実行するAIを人間が評価しやすくする工夫

1.評価が難しい作業を実行するAIを人間が評価しやすくする工夫まとめ ・AIが意図しなかった動作をしてしまう事は合致問題(alignment problem)として知られる ・合致問題は「モデルの出力を人間が評価する事が困難または時間がかか...
基礎理論

教師あり学習を使って外れ値を発見する(3/3)

1.教師あり学習を使って外れ値を発見する(3/3)まとめ ・異常検出は必ずしも完全に異なるか否かではなく一部に欠陥があるか否かで定義される ・回転予測と分布増強対照学習はテクスチャ異常検出では高い性能を発揮できない ・テクスチャ異常検出用に...
基礎理論

教師あり学習を使って外れ値を発見する(2/3)

1.教師あり学習を使って外れ値を発見する(2/3)まとめ ・通常の対照学習は、異常値ではない通常のサンプルの特徴表現が球上に均一に分散される ・1クラス対照学習では支障が出るため分布増強(DA:Distribution Augmentati...
基礎理論

教師あり学習を使って外れ値を発見する(1/3)

1.教師あり学習を使って外れ値を発見する(1/3)まとめ ・アノマリー検出、外れ値検出、分布外検出は欠陥品検出や不正取引検出など応用範囲が広い ・1クラスサポートベクターマシンは異常検出に良く使われるが最近の進歩の恩恵を受けていない ・自己...