basic theory

ヘルスケア

機械学習を使って人工呼吸器の制御を改善(1/3)

1.機械学習を使って人工呼吸器の制御を改善(1/3)まとめ ・人工呼吸器は患者からの呼吸測定値に基づき、臨床医が処方した呼吸波形に合わせる ・患者の肺の違いや変化に対応可能な堅牢性と望ましい波形に追従する機能の両方が必要 ・機械学習により手...
データセット

GoEmotions:きめ細かい感情分類を行うためのデータセット(2/2)

1.GoEmotions:きめ細かい感情分類を行うためのデータセット(2/2)まとめ ・クラスタリングすると曖昧な感情はポジティブな感情に関係している事が判明 ・喜びと興奮、緊張と恐怖、悲しみと嘆き、苛立ちと怒りなども密接な相関関係 ・絵文...
データセット

C4_200M:文法エラー訂正用の合成データセット(2/2)

1.C4_200M:文法エラー訂正用の合成データセット(2/2)まとめ ・タグ付き破損モデルは再現したいエラーの種類をエラータイプタグで入力できる ・そのため現実世界で実際に見られる書き込みエラーの分布を再現する事ができる ・英語を母国語と...
データセット

KYD:データセット探索用の新ツール(2/2)

1.KYD:データセット探索用の新ツール(2/2)まとめ ・画像説明文内の「男性のまなざし」について調査し従来の研究結果を裏付ける事ができた ・高齢者は現実世界の集団内での存在に比べてデータセット内で過小評価されている事も判明 ・KYDを使...
データセット

Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)

1.Data Cascades:皆モデルの開発をやりたいのです!データ整備ではなく!(1/2)まとめ ・機械学習ではモデル構築が優先されデータ関連作業の優先度が低くなる事はよくある ・データ整備を軽視すると時間経過とともに技術的負債が発生し...
基礎理論

EpochとBatch SizeとIterationsとNumber of batchesの違い

1.EpochとBatch SizeとIterationsとNumber of batchesの違いまとめ ・エポックとは全学習データの事。サイズが多くなるので分割して処理する事が多い ・エポックを分割したものをバッチと呼ぶ。バッチ内のデー...
アプリケーション

より少ないデータから表形式データを推論することを学習(2/2)

1.より少ないデータから表形式データを推論することを学習(2/2)まとめ ・パフォーマンスを向上させるために反事実条件と合成の2つの新しい事前トレーニングを導入 ・経験則を用いてデータの一部分のみを使って計算効率を最適化出来ないかを調査 ・...
データセット

ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(2/2)まとめ ・最もパフォーマンスの高いモデルであっても約20%の確率で情報を幻覚化するように見える ・最先端のモデルでも幻覚、数値的推論、および稀なトピックに苦労している事...
データセット

ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)

1.ToTTo:表から文を抽出する能力を測るためのデータセット(1/2)まとめ ・自然言語生成は元の文章に存在しない幻覚のような文章を生成してしまう事がまだある ・既存のデータセットでは幻覚の原因がデータノイズなのかモデルの欠点なのか特定が...
モデル

人間による評価を使って要約を学ぶ(4/4)

1.人間による評価を使って要約を学ぶ(4/4)まとめ ・モデルは依然として不正確な要約を生成する可能性があり満点の要約は45%の割合で達成 ・人間がモデル出力の品質を簡単に評価できないようなタスクにも今回の手法を応用したい ・人間の好みに合...
モデル

RepNet:人工知能で動画内の反復行動を数える(2/2)

1.RepNet:人工知能で動画内の反復行動を数える(2/2) ・RepNetは反復行動動画を合成し、更に軸をずらしてカメラの動きを摸倣した合成データで学習した ・特定の反復行動にとらわれず多くの異なる領域で反復動作を数える事ができるモデル...
モデル

RepNet:人工知能で動画内の反復行動を数える(1/2)

1.RepNet:人工知能で動画内の反復行動を数える(1/2) ・月の満ち欠けや心拍や呼吸、製造ラインや交通パターンなどの反復行動は現実世界で一般的 ・反復行動を理解する事でより複雑な行動パターンを認識できたり様々な洞察を得る事ができる ・...