AI

MPNAS:写真も絵画も扱えるモデルを自動生成可能なニューラルアーキテクチャ探索(2/2)

1.MPNAS:写真も絵画も扱えるモデルを自動生成可能なニューラルアーキテクチャ探索(2/2)まとめ ・高度に関連したドメイン間ではネットワーク内のパスと構成要素の大部分が重複する ・MPNASから得られたモデルは従来モデルと比較して効...
AI

MPNAS:写真も絵画も扱えるモデルを自動生成可能なニューラルアーキテクチャ探索(1/2)

1.MPNAS:写真も絵画も扱えるモデルを自動生成可能なニューラルアーキテクチャ探索(1/2)まとめ ・視覚タスクではデータ領域が写真や絵画などで異なる場合は別々にモデルを学習させる事が多い ・異なる領域を共同で学習させる試みはマルチド...
AI

ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(2/2)

1.ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(2/2)まとめ ・ByteQRNNはマージAttentionサブレイヤーと量子化ビーム探索で計算を効率化している ・事前学習済みのByteQRNNの性能は...
AI

ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(1/2)

1.ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(1/2)まとめ ・トークンフリーモデルは文字列をバイト列として扱うのでモデルサイズを小さくできる ・サイズは小さくできるが推論の待ち時間や計算コストが増加...
AI

LocoProp:レイヤー毎に最適化を行いバックプロパゲーションを効率化(2/2)

1.LocoProp:レイヤー毎に最適化を行いバックプロパゲーションを効率化(2/2)まとめ ・LocoProp はレイヤー単位に正則化、出力目標、損失関数を使用してネットワークを分解 ・重み更新はシンプルなオプティマイザーを使用するが...
タイトルとURLをコピーしました