音声

インフラ

Googleが開発する人工知能用演算装置TPUの第三世代

1.Googleが開発する人工知能用演算装置TPUの第三世代まとめ ・第二世代TPU Podsの8倍の性能を誇る第三世代TPU Podsが発表 ・第三世代TPU Podsは100petaFLOPSの性能を達成 ・第二世代TPU Podsは今...
入門/解説

Google Duplex:電話予約をAIに委任できるシステム

1.Google Duplex:電話予約をAIに委任できるシステムまとめ ・ヘアサロンやレストランの電話予約を行ってくれるGoogle DuplexをGoogleが発表 ・Googleアシスタントとスケジュール確定すればGoogle Dup...
その他の調査

マイクロソフトの翻訳アプリが新人工知能搭載でオフライン可

1.マイクロソフトの翻訳アプリが新人工知能搭載でオフライン可まとめ ・Microsoftの翻訳アプリがバージョンアップ、オフラインでも使用可能に ・新しい人工知能のアプローチで従来製品より劇的に改良と言う ・Amazon Fire、Andr...
モデル

Looking to Listen:動画から個々の音声を切出す試み

1.Looking to Listen:動画から個々の音声を切出す試みまとめ ・Googleがカクテルパーティー効果を人工知能で実現 ・複数の人が同時にしゃべっている動画から個別の音声を抜き出せた ・動画と音声の解析を連動させている事がTa...
学習手法

タコトロンによる音声合成の表現力を向上

1.タコトロンによる音声合成の表現力を向上まとめ ・Googleが文書読み上げシステムTacotronでprosodyを実現 ・prosodyとは発話の強弱やリズム、イントネーションで話者固有の抑揚 ・動画からノイズを取り除いてスピーチの再...
その他の分野

笑うAlexa

1.笑うAlexaまとめ ・Amazonのスマートスピーカーに搭載されている人工知能Alexaが突然笑い出すと話題に ・Alexaは子供の声やTVの声にも反応して注文をしてしまう不具合も報道されている ・人が聞き取れないボイスコマンドを音声...
入門/解説

人間の脳の偉大な機能

1.人間の脳の偉大な機能まとめ ・人間の脳の学習機能は素晴らしく大変素早く認知機能を更新する事ができる ・しかし、目の錯覚や自分の手を偽物の手と間違うなど意外な盲点もある ・人工知能に脳の働きを真似させる手法は将来的にこういった脳の特徴に苦...
AI関連その他

AIアナウンサー日本語版

1.AIアナウンサー日本語版まとめ ・日本語の人工知能アナウンサーが月額9,800円で商用利用可能に ・デモでは他社の同機能製品に比べてスムーズな発音が出来ている ・人工知能記者が書いた記事を人工知能アナウンサーが読む時代も近いかも 2.荒...
入門/解説

人間より公平で客観的?企業に広がるAI面接官

1.人間より公平で客観的?企業に広がるAI面接官 まとめ ・企業の採用選考に人工知能が使われ始めていると日経新聞で報道 ・人工知能は人間より客観性や公平性が高いのではないかと期待する人達もいる ・人工知能が人間の差別や偏見を素直に学習してし...
インフラ

Microsoftの人工知能機能提供クラウドサービス

1.Microsoftの人工知能機能提供クラウドサービスまとめ ・Microsoftの人工知能関連サービスは最初に2.25万円の使用枠が貰える ・開発環境やボット作成、画像系、音声系、言語系、検索エンジン関連など様々なサービスがある ・価格...
プライバシー

GoogleのAI研究チームの2017年成果プライバシーとセキュリティ

1.GoogleのAI研究チームの2017年成果プライバシーとセキュリティまとめ ・昨年のGoogleBrainの研究成果にプライバシーとセキュリティに関わるものがあった ・プライバシーは病歴等のセンシティブな個人情報を保護しながら学習する...
AI関連その他

音声認識システムを騙す方法

1.音声認識システムを騙す方法まとめ ・音声に特殊な加工をして人工知能を騙す方法が論文で発表される ・人間が聞き取れる音声とまるで違う音声を認識させ任意のボイスコマンドを実行できる ・将来的に偽装音声を放送させて実行できるようになると大きな...