モデル

モデル

胸部X線画像を用いた深層学習モデルの開発(1/2)

1.胸部X線画像を用いた深層学習モデルの開発(1/2)まとめ ・胸部X線は多くの疾患の検出のための重要で利用しやすい臨床画像ツールだが解釈が難しい場合がある ・ディープラーニングを画像診断に適用したくとも正確な臨床ラベルがないとモデルの評価...
モデル

ロボット学習のためにシミュレーションと現実のギャップを埋める(1/4)

1.ロボット学習のためにシミュレーションと現実のギャップを埋める(1/4)まとめ ・ロボットを自律的に学習させるためにはシミュレーションが有用であるが現実世界との間にギャップがある ・現実世界とのギャップは、現実とシミュレーションの間の微妙...
モデル

SPICE:自己教師学習で音の高さを推定

1.SPICE:自己教師学習で音の高さを推定まとめ ・メロディーを認識するためには音の高さの変化、つまりピッチの変化を追跡する能力が必要 ・しかし音の高さをそのまま認識する絶対音感より相対的に認識する相対音感の方が人間の脳でも一般的 ・SP...
モデル

MobileNetV3:次世代のオンデバイス視覚モデル(1/3)

1.MobileNetV3:次世代のオンデバイス視覚モデル(1/3)まとめ ・スマートフォンなどのデバイス上で実行される事が前提のニューラルネットワークMobileNetV3の発表 ・オンデバイスでの実行に最適化されているがMobileNe...
モデル

Cloud TPU v3 PodsがAI学習にかかる時間を競うコンペで最速記録を達成

1.Cloud TPU v3 PodsがAI学習にかかる時間を競うコンペで最速記録を達成まとめ ・Cloud TPU v3 Podsが機械学習モデルの学習時間を測るベンチマークであるMLPerfで最速記録を達成 ・オンプレミスが主体のNVI...
モデル

BERTのGoogle検索エンジンへの実践投入

1.BERTのGoogle検索エンジンへの実践投入まとめ ・文脈を理解するAIとして昨年秋に話題になったBERTがGoogle検索に実践投入 ・従来より検索語の意図を理解する能力が高まり英語検索の10%程度が改善された ・改良された学習結果...
モデル

動画用ニューラルネットワークを自動で探索する試み(3/3)

1.動画用ニューラルネットワークを自動で探索する試み(3/3)まとめ ・従来モデルより大幅に早くビデオ認識が可能なTiny Video Networksも自動探索する事ができた ・アーキテクチャの自動進化中に実行時間を考慮し計算量を削減する...
モデル

動画用ニューラルネットワークを自動で探索する試み(2/3)

1.動画用ニューラルネットワークを自動で探索する試み(2/3)まとめ ・AssembleNetでは、様々なサブネットワークを融合する新しい方法を検討した ・目的は、ビデオの外観と動きの視覚的な手がかりをまとめて、より優れた特徴表現を学習する...
モデル

動画用ニューラルネットワークを自動で探索する試み(1/3)

1.動画用ニューラルネットワークを自動で探索する試み(1/3)まとめ ・現在動画用のモデルは通常既存の画像用モデルなどを元に手動で拡張設計されている ・動画用モデルは時空間情報を扱うためAutoMLのような自動化アプローチが困難 ・この課題...
モデル

強化学習を使って量子計算を改善(1/2)

1.強化学習を使って量子計算を改善(1/2)まとめ ・量子コンピュータの構成要素である量子ビットは周囲の微量なエネルギーの影響を受ける ・更には制御用ツールによってもたらされる干渉などの影響も受けて誤差が拡大してしまう ・強化学習を使用して...
モデル

エンドツーエンドモデルによる多言語リアルタイム音声認識(2/2)

1.エンドツーエンドモデルによる多言語リアルタイム音声認識(2/2)まとめ ・多言語モデルはトレーニングセット内に頻繁に表れる言語の特徴表現からより多くの影響を受ける ・利用可能なデータが多い言語から多くの影響を受けてしまうので言語情報を入...
モデル

エンドツーエンドモデルによる多言語リアルタイム音声認識(1/2)

1.エンドツーエンドモデルによる多言語リアルタイム音声認識(1/2)まとめ ・音声データからニューラルネットワークが学習した「知識」の多くは他の言語に流用できる ・この洞察を元に利用可能な音声データが多い言語で学習した結果をマイナーな言語に...