基礎理論

Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(1/3)

1.Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(1/3)まとめ ・脳の仕組みは生物と同じ方法で情報を処理する効率的な人工ニューラルネットワークのヒントとなる ・しかし、情報の時間的符号化に繋がる可能性があ...
学会

Google at Interspeech 2019

1.Google at Interspeech 2019まとめ ・オーストリアで国際音声コミュニケーション協会の第20回年次会議(Interspeech 2019)が開催 ・GoogleはInterspeech 2019のゴールドスポンサー...
学習手法

ディープラーニングで皮膚疾患の鑑別診断を実現(3/3)

1.ディープラーニングで皮膚疾患の鑑別診断を実現(3/3)まとめ ・DLSの診断の際には多くの患部画像と病歴等のメタデータを用意する事が精度向上に結びつく ・メタデータが用意できない場合は画像のみで学習させた方が精度が向上する ・希少な症例...
ヘルスケア

ディープラーニングで皮膚疾患の鑑別診断を実現(2/3)

1.ディープラーニングで皮膚疾患の鑑別診断を実現(2/3)まとめ ・DLSの診断結果を比較したところ専門医ではない医療従事者より高い精度を達成した ・皮膚の色やタイプがDLSによる皮膚病の診断に影響を与えていない事も検証された ・年齢、性別...
ヘルスケア

ディープラーニングで皮膚疾患の鑑別診断を実現(1/3)

1.ディープラーニングで皮膚疾患の鑑別診断を実現(1/3)まとめ ・皮膚病は患者の数に比べて皮膚科を専門とする医者の数が圧倒的に足りない ・そのため皮膚病を専門としない一般医が診断する事が多いが精度にばらつきがある ・画像とデータを元に皮膚...
学習手法

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(3/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(3/3)まとめ ・VideoBERTはベースラインとした完全教師付き学習のtop-5 accuracyに匹敵する精度を達成 ・VideoBERTはヴィジュアルトークン作成時に細...
モデル

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(2/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(2/3)まとめ ・ビデオ内の画像とテキストを組み合わせたクロスモーダルな文章を元にVideoBERTを学習させた ・VideoBERTを、料理、ガーデニング、車両修理など、10...
学習手法

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)まとめ ・機械学習で動画内でどのような活動が行われているのかを認識させるのは困難 ・従来手法では細かくラベル付けされた大量の動画が必要になるがこれは高価 ・動画内の音声...
モデル

モジュラーディープラーニング用の再帰的スケッチ(2/2)

1.モジュラーディープラーニング用の再帰的スケッチ(2/2)まとめ ・モジュラーディープネットワークは複数の独立したニューラルネットワークから構成される ・モジュラーディープネットワークに対応するスケッチは、再帰的なメカニズムで対処する ・...
入門/解説

モジュラーディープラーニング用の再帰的スケッチ(1/2)

1.モジュラーディープラーニング用の再帰的スケッチ(1/2)まとめ ・スケッチとはディープニューラルネットワークが入力をどのように処理しているかを要約する試み ・スケッチはニューラルネットワークに記憶を元にした回答や要約機能を持たせる事に繋...
その他の調査

長文を読みあげる合成音声の品質を評価する(2/2)

1.長文を読みあげる合成音声の品質を評価する(2/2)まとめ ・複数の文が含まれる長文を評価する事は人間の音声を評価対象にしても評価がぶれる ・長文を読みあげる合成音声の評価は簡単ではなく、人間の行動真理などが関係している可能性がある ・段...
入門/解説

長文を読みあげる合成音声の品質を評価する(1/2)

1.長文を読みあげる合成音声の品質を評価する(1/2)まとめ ・合成音声の品質評価は従来1文ごとに行われており、文脈の中で評価する統一基準は存在しない ・しかし評価対象の文を長い文章の一部として評価すると従来と来なる評価基準が採用されている...