人工知能/機械学習

AI関連その他

独自データを使って物体検出モデルの精度を上げる方法(2020年版)

1.独自データを使って物体検出モデルの精度を上げる方法(2020年版)まとめ ・2020年に物体検出モデルを再トレーニングしようとした時に取りうる選択肢の概要紹介 ・物体検出用データのラベル付け、データ拡張、モデリングなどを具体的に紹介 ・...
モデル

超並列グラフ計算:理論から実践へ(2/2)

1.超並列グラフ計算:理論から実践へ(2/2)まとめ ・AMPCモデルを使用して、実用的で効率的な実装に触発された理論的フレームワークを構築 ・優れた実証的パフォーマンスと障害耐性を維持する新しい理論的アルゴリズム ・グラフのサイズに関係な...
モデル

超並列グラフ計算:理論から実践へ(1/2)

1.超並列グラフ計算:理論から実践へ(1/2)まとめ ・大規模なグラフは数千億の頂点を含むため一台のコンピュータでは処理しきれない ・複数のコンピューターで分散処理を行う事で兆単位のグラフを処理できるが課題も発生 ・分散ハッシュテーブルを使...
モデル

文字情報と画像情報を同じ概念として認識できる人工知能の出現(2/2)

1.文字情報と画像情報を同じ概念として認識できる人工知能の出現(2/2)まとめ ・ニューロンレベルでの単純な分析ではモデルの動作を完全に説明する事は出来ない ・高度な抽象化は人工知能に対する新しい攻撃手法に繋がる可能性がある ・個人やグルー...
モデル

文字情報と画像情報を同じ概念として認識できる人工知能の出現(1/2)

1.文字情報と画像情報を同じ概念として認識できる人工知能の出現(1/2)まとめ ・特定の女優さんの画像や名前に反応するニューロンが人間の脳内で見つかった事がある ・ネットワークで機能するので特定のニューロンが反応するのはおかしいと反論があっ...
インフラ

Google Colab Proが日本から利用可能に

1.Google Colab Proが日本から利用可能にまとめ ・Colab Pro版がオススメかどうかというと「その人の使い方次第」 ・Colab Free版で支障を感じていない人は無理にColab Pro版にする必要はない ・Colab...
インフラ

Kubernetesのノード数を7500に拡張(2/2)

1.Kubernetesのノード数を7500に拡張(2/2)まとめ ・私達は誤動作しているノードを検出してクラスターから削除する処理は自動化 ・GPUは既存ツールでは捕捉できないエラーがあるため内製の仕組みを利用 ・Prometheusによ...
インフラ

Kubernetesのノード数を7500に拡張(1/2)

1.Kubernetesのノード数を7500に拡張(1/2)まとめ ・GPT-3やCLIPやDALL·Eなどで有名なOpen AIの背後にあるインフラシステムの紹介 ・Kubernetesを7500ノードに規模拡大し大規模モデルから小規模研...
モデル

LEAF:人間の聴覚用の設定を学習システムに置き換えてオーディオ分類の性能を向上(2/2)

1.LEAF:人間の聴覚用の設定を学習システムに置き換えてオーディオ分類の性能を向上(2/2)まとめ ・LEAFは小さな分類器と組み合わせた場合でもパラメーター全体の0.01%しか占有しない ・LEAFは話者識別、音響シーン認識、楽器の識別...
モデル

LEAF:人間の聴覚用の設定を学習システムに置き換えてオーディオ分類の性能を向上(1/2)

1.LEAF:人間の聴覚用の設定を学習システムに置き換えてオーディオ分類の性能を向上(1/2)まとめ ・音声分類用のモデルは生音声ではなく前処理されたデータを扱う事が多い ・メルフィルターバンクは人間の聴覚反応を再現するように設計されたフィ...
基礎理論

Deep Bootstrap Framework:データが無限に存在する世界ではディープラーニングはどうなるか?(2/2)

1.Deep Bootstrap Framework:データが無限に存在する世界ではディープラーニングはどうなるか?(2/2)まとめ ・優れたモデルとトレーニングとは、理想世界で迅速で現実世界では迅速すぎない事 ・事前トレーニングの主な効果...
基礎理論

Deep Bootstrap Framework:データが無限に存在する世界ではディープラーニングはどうなるか?(1/2)

1.Deep Bootstrap Framework:データが無限に存在する世界ではディープラーニングはどうなるか?(1/2)まとめ ・通常、モデルは有限のサンプルを使ってトレーニングをされるのでデータは再利用される ・データが無限に存在す...