efficientnet

モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(3/3)まとめ ・ALIGNは風景の詳細な説明や固有地形や芸術作品などのきめ細かいレベル画像検索が可能 ・ALIGN embeddingsを使って演算する...
モデル

ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)

1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現 ・微調整を行うとALIGNはBiTやViTなど...
データセット

Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)

1.Crisscrossed Captions:画像とテキストの意味的類似性の探求(3/3)まとめ ・文対文タスクと画像対文タスクでトレーニングされたマルチタスクモデルが最も優秀だった ・文対文のトレーニングを追加すると画像対文、文対画...
基礎理論

ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(1/2)

1.ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(1/2)まとめ ・ニューラルネットワークの性能を調整する際はネットワークの深さや幅が調整される ・しかし精度以外にこれらの違いがどのように影響するかについての...
モデル

2021年時点の各分野における最先端の機械学習モデルの紹介

1.2021年時点の各分野における最先端の機械学習モデルの紹介まとめ ・未知の分野で作業を始める時、現時点の最先端モデルを調べるのは時間がかかる ・各MLタスクに最適なモデルをリスト化してまとめておくと手間がかなり省ける ・Kaggl...
モデル

文字情報と画像情報を同じ概念として認識できる人工知能の出現(1/2)

1.文字情報と画像情報を同じ概念として認識できる人工知能の出現(1/2)まとめ ・特定の女優さんの画像や名前に反応するニューロンが人間の脳内で見つかった事がある ・ネットワークで機能するので特定のニューロンが反応するのはおかしいと反論が...
モデル

LEAF:人間の聴覚用の設定を学習システムに置き換えてオーディオ分類の性能を向上(2/2)

1.LEAF:人間の聴覚用の設定を学習システムに置き換えてオーディオ分類の性能を向上(2/2)まとめ ・LEAFは小さな分類器と組み合わせた場合でもパラメーター全体の0.01%しか占有しない ・LEAFは話者識別、音響シーン認識、楽器の...
学習手法

ニューラルネットワークを疎にして推論を高速化(2/2)

1.ニューラルネットワークを疎にして推論を高速化(2/2)まとめ ・密なバージョンから重みの一部を徐々にゼロにしていく事がスパース化のコツ ・トレーニング時間の増加で品質を低下させることなく深層学習モデルをスパース化可能 ・スパースネ...
学習手法

ニューラルネットワークを疎にして推論を高速化(1/2)

1.ニューラルネットワークを疎にして推論を高速化(1/2)まとめ ・モデル最適化には大部分の重みが0に設定されているスパースニューラルネットワークが有効 ・しかし良く使われる畳み込みスパース化するツールとサポートするツールがなかった ...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(3/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(3/5)まとめ ・機械学習アルゴリズムや基礎理論の研究により効率的な手法の探求が前進 ・強化学習は履歴データの利用やサンプル効率の向上、適用分野の拡大 ...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(3/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(3/3)まとめ ・CLIPは一般的な物体認識には優れているが抽象的または体系的なタスクには苦戦 ・CLIPは、言葉遣いや言い回しに過敏で機能させるために試行錯誤も必要 ・...
アプリケーション

時系列予測にAutoMLを使用する(1/2)

1.時系列予測にAutoMLを使用する(1/2)まとめ ・時系列予測は重要だがモデルの作成に専門知識が必要で現実世界では利用に制限がある ・AutoMLはMLモデルの作成プロセスを自動化することでMLをより広く利用可能にする ・現実世...
タイトルとURLをコピーしました