データセット

GoEmotions:きめ細かい感情分類を行うためのデータセット(1/2)

1.GoEmotions:きめ細かい感情分類を行うためのデータセット(1/2)まとめ ・感情分類は1992年に提案された6つの基本的な感情を対象とする場合が多い ・GoEmotionsは12ポジティブ、11ネガティブ、4あいまい、1中立の感...
アプリケーション

GCE:Pixel6の文字入力時の文法エラー修正モデル(2/2)

1.GCE:Pixel6の文字入力時の文法エラー修正モデル(2/2)まとめ ・大規模なクラウドベースのモデルを作りそこからオンデバイス用の学習データを作成 ・クラウドベースのモデルの学習用データをそのまま使うより良いモデルが出来た ・このモ...
アプリケーション

GCE:Pixel6の文字入力時の文法エラー修正モデル(1/2)

1.GCE:Pixel6の文字入力時の文法エラー修正モデル(1/2)まとめ ・スマートフォンを使用してより長い文章を作成することは、依然として非常に面倒 ・この問題に対処するためにPixel 6のGboardに直接組み込んだ文法修正機能をリ...
モデル

GPT-3の約2倍の性能で算数の文章問題を解く人工知能

1.GPT-3の約2倍の性能で算数の文章問題を解く人工知能まとめ ・小学校の算数の問題を微調整したGPT-3モデルの約2倍の精度で解くシステムを開発 ・このシステムは、実際の子供たちが出した正答率の約90%の正答率で問題を解くことが可能 ・...
学習手法

TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(2/2)

1.TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(2/2)まとめ ・TAGは1つのタスクに関してのみモデルのパラメータを更新してその影響を調べる ・ネットワーク内の各タスクが他のタスクとどのように相互作用するかについての情...
学習手法

TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(1/2)

1.TAG:マルチタスク学習で一緒にトレーニングすべきタスクを知る(1/2)まとめ ・多くの機械学習モデルは、通常、一度に1つのタスクを学習する事に重点を置いている ・多数のタスクから同時に学習すると性能が向上する場合がありこれをマルチタス...
その他の調査

データサイエンスで収入を18か月で3倍にした方法

1.データサイエンスで収入を18か月で3倍にした方法まとめ ・データサイエンティストとして働きたい業界の業務知識の習得が大事 ・ビジネス分析とMLエンジニアリング、理論よりもコードの学習に時間を費やした ・本当の需要は、利用可能なデータの助...
プライバシー

実用的な差分プライベートクラスタリング(2/2)

1.実用的な差分プライベートクラスタリング(2/2)まとめ ・プライベート・クラスタリング・アルゴリズムの前処理は通常と異なるので留意が必要 ・今回のアルゴリズムは全てのデータポイントが収まるような半径の入力が必要 ・半径が正確である必要は...
プライバシー

実用的な差分プライベートクラスタリング(1/2)

1.実用的な差分プライベートクラスタリング(1/2)まとめ ・k-meansクラスタリングは機密性の高いデータセットを処理する際は問題がある ・データポイントが他と大幅に離れていると単一のクラスタを構成してしまうため ・差分プライバシー方式...
入門/解説

FugueSQL:PandasのDataFrameをSQL文で操作(2/2)

1.FugueSQL:PandasのDataFrameをSQL文で操作(2/2)まとめ ・SQL文を文字列して定義後、fsql(SQL).run()を呼ぶ事で実行する事ができる ・結果として返される型はfugue.dataframe形式であ...
入門/解説

FugueSQL:PandasのDataFrameをSQL文で操作(1/2)

1.FugueSQL:PandasのDataFrameをSQL文で操作(1/2)まとめ ・Pandasは、Pythonで表形式データを扱う際に良く利用されるデータ構造 ・Pythonに精通していない人にとってSQLでDataFramesを操...
アプリケーション

スプレッドシート内で使用される数式を周辺セルから予測

1.スプレッドシート内で使用される数式を周辺セルから予測 ・Google スプレッドシートの数式は便利だが初心者は間違いをしやすい ・目標セル周辺の豊富な文脈情報に基づいて数式を自動生成するモデルを開発 ・このモデルは既にユーザーが一般的に...