dahara1

入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(3/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(3/3)まとめ ・複数の方法/ツール、アウトソース先を組み合わせて最適なやり方を探る事が重要 ・反復的なアプローチを採用し、量より質を優先した多様性のあるラ...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(2/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(2/3)まとめ ・データに注釈/ラベルを付ける作業は労力がかかるが第三者にアウトソーシングするのも困難 ・会ったことのない完全に見知らぬ人に作業内容を一から...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(1/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(1/3)まとめ ・変化への対応を是とするアジャイル型開発手法はソフトウェア開発に生産性革命をもたらした ・MLプロジェクトにとってデータ整備は重要だが生産性...
基礎理論

SoundStream:ビットレート可変なニューラルオーディオコーデック(2/2)

1.SoundStream:ビットレート可変なニューラルオーディオコーデック(2/2)まとめ ・理想的なコーデックはネットワーク状態に応じてビットレートを変更できる能力が必要 ・SoundStreamは「量子化器ドロップアウト」と呼ばれる新...
基礎理論

SoundStream:ビットレート可変なニューラルオーディオコーデック(1/2)

1.SoundStream:ビットレート可変なニューラルオーディオコーデック(1/2)まとめ ・SoundStreamはスマートフォンのCPUでリアルタイムに実行可能で音声と音楽を処理できる ・単一モデルで可変ビットレートで高品質を実現する...
データセット

画像や動画関係の機械学習に使用できる大規模データセット一覧(2/2)

1.画像や動画関係の機械学習に使用できる大規模データセット一覧(2/2)まとめ ・動画や顔認証用、性別や年齢推定、ポーズ推定などの学習に使えるデータセットがある ・「モデルアーキテクチャ」「GPU」「データセット」の観点から性能を試算する必...
データセット

画像や動画関係の機械学習に使用できる大規模データセット一覧(1/2)

1.画像や動画関係の機械学習に使用できる大規模データセット一覧(1/2)まとめ ・画像関連のニューラルネットワークをトレーニングするには大規模画像データセットが必要 ・ImageNetは最もよく知られている画像データセットで画像研究のゴール...
量子コンピュータ

量子コンピューターで誤り訂正機能を実現(2/2)

1.量子コンピューターで誤り訂正機能を実現(2/2)まとめ ・Sycamoreデバイスはリセットプロトコルのおかげでエラーを蓄積せずにエラー修正を実行可能 ・反復コードを使用してエラーの指数関数的抑制も達成出来る事が検証できた ・本実験は、...
量子コンピュータ

量子コンピューターで誤り訂正機能を実現(1/2)

1.量子コンピューターで誤り訂正機能を実現(1/2)まとめ ・現世代の量子プロセッサは1操作あたりのエラー率が非常に高く、このままでは使用に耐えない ・将来の量子コンピューターは、量子エラー訂正機能を実装してエラー率を下げる必要がある ・量...
入門/解説

データサイエンティストと機械学習エンジニアの違い

1.データサイエンティストと機械学習エンジニアの違いまとめ ・データサイエンティストと機械学習エンジニアの違いは明確になっていない事が多い ・データサイエンティストはデータをよりよく理解し、モデルのプロトタイプを作成する ・機械学習エンジニ...
データセット

C4_200M:文法エラー訂正用の合成データセット(2/2)

1.C4_200M:文法エラー訂正用の合成データセット(2/2)まとめ ・タグ付き破損モデルは再現したいエラーの種類をエラータイプタグで入力できる ・そのため現実世界で実際に見られる書き込みエラーの分布を再現する事ができる ・英語を母国語と...
データセット

C4_200M:文法エラー訂正用の合成データセット(1/2)

1.C4_200M:文法エラー訂正用の合成データセット(1/2)まとめ ・文法エラー修正とは、正しい文法やスペルを提案するため書き込みエラーをモデル化する試み ・近年GECの品質は大幅に向上したがこれは「翻訳」タスクを真似たアプローチをした...