人工知能/機械学習

学習手法

取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(3/3)

1.取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(3/3)まとめ ・時間的順序をモデル化して行動可逆性を予測し探索と制御を効率化出来る事を示した ・自己教師型であるため行動の可逆性に関する事前知識を必要とせず様々な環境に...
学習手法

取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(2/3)

1.取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(2/3)まとめ ・強化学習に可逆性を統合する手法として探索のRAEと制御のRACを提案した ・RAEとRACの重要な違いはRAEは可逆的な動作を推奨するだけで禁止していな...
学習手法

取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(1/3)

1.取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(1/3)まとめ ・強化学習エージェントは試行錯誤を繰り返するで元に戻せない行動をしてしまう事がある ・現実のロボットが部品破損につながる可能性のあるアクションを実行するこ...
データセット

GoEmotions:きめ細かい感情分類を行うためのデータセット(2/2)

1.GoEmotions:きめ細かい感情分類を行うためのデータセット(2/2)まとめ ・クラスタリングすると曖昧な感情はポジティブな感情に関係している事が判明 ・喜びと興奮、緊張と恐怖、悲しみと嘆き、苛立ちと怒りなども密接な相関関係 ・絵文...
データセット

GoEmotions:きめ細かい感情分類を行うためのデータセット(1/2)

1.GoEmotions:きめ細かい感情分類を行うためのデータセット(1/2)まとめ ・感情分類は1992年に提案された6つの基本的な感情を対象とする場合が多い ・GoEmotionsは12ポジティブ、11ネガティブ、4あいまい、1中立の感...
アプリケーション

GCE:Pixel6の文字入力時の文法エラー修正モデル(2/2)

1.GCE:Pixel6の文字入力時の文法エラー修正モデル(2/2)まとめ ・大規模なクラウドベースのモデルを作りそこからオンデバイス用の学習データを作成 ・クラウドベースのモデルの学習用データをそのまま使うより良いモデルが出来た ・このモ...
アプリケーション

GCE:Pixel6の文字入力時の文法エラー修正モデル(1/2)

1.GCE:Pixel6の文字入力時の文法エラー修正モデル(1/2)まとめ ・スマートフォンを使用してより長い文章を作成することは、依然として非常に面倒 ・この問題に対処するためにPixel 6のGboardに直接組み込んだ文法修正機能をリ...
モデル

GPT-3の約2倍の性能で算数の文章問題を解く人工知能

1.GPT-3の約2倍の性能で算数の文章問題を解く人工知能まとめ ・小学校の算数の問題を微調整したGPT-3モデルの約2倍の精度で解くシステムを開発 ・このシステムは、実際の子供たちが出した正答率の約90%の正答率で問題を解くことが可能 ・...
学習手法

TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(2/2)

1.TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(2/2)まとめ ・TAGは1つのタスクに関してのみモデルのパラメータを更新してその影響を調べる ・ネットワーク内の各タスクが他のタスクとどのように相互作用するかについての情...
学習手法

TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(1/2)

1.TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(1/2)まとめ ・多くの機械学習モデルは、通常、一度に1つのタスクを学習する事に重点を置いている ・多数のタスクから同時に学習すると性能が向上する場合がありこれをマルチタス...
プライバシー

実用的な差分プライベートクラスタリング(2/2)

1.実用的な差分プライベートクラスタリング(2/2)まとめ ・プライベート・クラスタリング・アルゴリズムの前処理は通常と異なるので留意が必要 ・今回のアルゴリズムは全てのデータポイントが収まるような半径の入力が必要 ・半径が正確である必要は...
プライバシー

実用的な差分プライベートクラスタリング(1/2)

1.実用的な差分プライベートクラスタリング(1/2)まとめ ・k-meansクラスタリングは機密性の高いデータセットを処理する際は問題がある ・データポイントが他と大幅に離れていると単一のクラスタを構成してしまうため ・差分プライバシー方式...