machine learning

入門/解説

ディープラーニング学習用途に最適なLinuxディストリビューションとは?

1.ディープラーニング学習用途に最適なLinuxディストリビューションとは?まとめ ・ディープラーニング開発用途に使われている一番ユーザが多いLinuxはUbuntu ・Ubuntuが好まれる理由はユーザの多さとAI用ツール群の公式サポート...
入門/解説

暗記は学習ではありません!機械学習で過学習を防ぐための6つの手法

1.暗記は学習ではありません!機械学習で過学習を防ぐための6つの手法まとめ ・過剰適合とはモデルが学習に使ったトレーニング用データに特化しすぎる事 ・過剰適合は、トレーニングエラーとテストエラーの違いから検出可能 ・過剰適合の防止はデータ、...
AI関連その他

CATS4ML:機械学習の未知の不明を明らかにするコンペ

1.CATS4ML:機械学習の未知の不明を明らかにするコンペまとめ ・機械学習モデルのパフォーマンスは学習アルゴリズムとデータ品質の両方に依存 ・機械学習の評価に使用されるデータセットの品質はアルゴリズム程探求されていない ・CATS4ML...
データセット

TracIn:トレーニング事例の影響を推定する簡単な方法(2/2)

1.TracIn:トレーニング事例の影響を推定する簡単な方法(2/2)まとめ ・TracInはクラスタリングアルゴリズム内の類似性関数として使用可能 ・TracInは「SGD(またはSGDの亜種)を使用してトレーニングしている事」以外に条件...
データセット

TracIn:トレーニング事例の影響を推定する簡単な方法(1/2)

1.TracIn:トレーニング事例の影響を推定する簡単な方法(1/2)まとめ ・トレーニングデータの品質はモデルのパフォーマンスに大きな影響を与える可能性がある ・様々な手法が提案されているが追加リソースやトレーニングが必要であり採用が困難...
モデル

Apollo:コンピュータアーキテクチャのために機械学習を活用(3/3)

1.Apollo:コンピュータアーキテクチャのために機械学習を活用(3/3)まとめ ・アーキテクチャ探索のための最高の最適化戦略は進化的戦略とP3BO戦略であった ・設計上の制約を厳しくするとP3BO最適化戦略がパフォーマンスの高い解決策を...
モデル

Apollo:コンピュータアーキテクチャのために機械学習を活用(1/3)

1.Apollo:コンピュータアーキテクチャのために機械学習を活用(1/3)まとめ ・最近の機械学習の進歩の要因の1つにTPUなどのカスタムアクセラレータの開発がある ・急速に進化するMLモデルに順応するためにアーキテクチャの革新を続ける必...
インフラ

GCP上で大きなモデルを動かした際のGPUの性能比較

1.GCP上で大きなモデルを動かした際のGPUの性能比較まとめ ・Colabで動かせないモデルをGCP上で実行するとColabの凄みを改めて実感する事になる ・GPUはベンチマークではなく実際のタスクやモデルで動かさないと性能差はわからない...
アプリケーション

Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2)

1.Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2)まとめ ・ストリーミング翻訳モデルはライブ翻訳専用にモデルを再構築する手間がかかる ・マスキングとバイアスを組み合わせた独自の再翻訳アプローチで全体的に性能を向上 ...
アプリケーション

Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(1/2)

1.Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(1/2)まとめ ・Google翻訳アプリの文字起こし機能を使うリアルタイムに翻訳済み文書に文字起こし可能 ・しかし、このアプリの初期バージョンは翻訳文が後から改訂される事が...
基礎理論

RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2)

1.RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2)まとめ ・話し言葉や書き言葉を使った指示に応じて複雑な環境を案内できるAIの開発は大きな課題 ・視覚と言語のナビゲーション(VLN)と呼ばれるこの課題には、空間言語の高度...
アプリケーション

Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(2/2)

1.Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(2/2)まとめ ・Pr-VIPEを使用して異なった視点から撮影された動画から同じポーズを検索する事が可能 ・カメラパラメータを使用せずに異なる視点から同じポーズを取...