入門/解説 50億のパラメータを持つ人工知能はどこかぁ~に君ぃ~を隠しているからぁ~♪の続きを歌えるのか? 1.50億のパラメータを持つ人工知能はどこかぁ~に君ぃ~を隠しているからぁ~♪の続きを歌えるのか?まとめ ・10億版に比べて50億版の表現力は明らかにあがっており違和感が減っている ・特に英語の歌では人工知能によって補完された歌である事に気... 2021.02.10 入門/解説
アプリケーション IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(2/2) 1.IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(2/2)まとめ ・デバイス上で実行するためバックボーンの幅と深さをパフォーマンスに影響を与えずに削減 ・バックボーン選択後ニューラルアーキテクチャ探索(NAS... 2021.02.09 アプリケーション
アプリケーション IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2) 1.IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)まとめ ・Android用アプリのVoice Accessを使用するとユーザーは口頭で指示してアプリ操作可能 ・アイコン情報を提供していないアプリもあ... 2021.02.08 アプリケーション
アプリケーション Google Mapで電気自動車用に充電場所を考慮した経路案内を実現(2/2) 1.Google Mapで電気自動車用に充電場所を考慮した経路案内を実現(2/2)まとめ ・グラフを改良する事でダイクストラで充電時間を考慮した経路を求める事が可能になった ・しかし充電ステーションの密度が非常に高い場所ではグラフが巨大にな... 2021.02.07 アプリケーション
アプリケーション Google Mapで電気自動車用に充電場所を考慮した経路案内を実現(1/2) 1.Google Mapで電気自動車用に充電場所を考慮した経路案内を実現(1/2)まとめ ・ガソリン駆動車の経路案内時には給油場所は問題にならないが電気自動車は考慮が必要 ・充電時間は総移動時間のかなりの部分を占める可能性があり充電率によっ... 2021.02.06 アプリケーション
入門/解説 データサイエンティスト向けPython仮想環境ガイド 1.データサイエンティスト向けPython仮想環境ガイドまとめ ・機械学習モデルを開発する際は他の人が作ったライブラリ等を利用させて貰う事が多い ・他の人が作ったライブラリは特定のVersionのpythonやライブラリを必要とする場合があ... 2021.02.05 入門/解説
アプリケーション Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2) 1.Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(2/2)まとめ ・ストリーミング翻訳モデルはライブ翻訳専用にモデルを再構築する手間がかかる ・マスキングとバイアスを組み合わせた独自の再翻訳アプローチで全体的に性能を向上 ... 2021.02.04 アプリケーション
アプリケーション Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(1/2) 1.Google 翻訳アプリのライブ音声書き起こし翻訳の訳を安定化(1/2)まとめ ・Google翻訳アプリの文字起こし機能を使うリアルタイムに翻訳済み文書に文字起こし可能 ・しかし、このアプリの初期バージョンは翻訳文が後から改訂される事が... 2021.02.03 アプリケーション
アプリケーション Googleマップでインドの言葉の翻字を改善(2/2) 1.Googleマップでインドの言葉の翻字を改善(2/2)まとめ ・複数モデルのアンサンブルを採用する事で個々のモデルより大幅に高品質の翻字を実現 ・従来のPOI名に対して今回のアンサンブル翻字手法で品質と対応範囲が大幅に改善された ・今後... 2021.02.02 アプリケーション
アプリケーション Googleマップでインドの言葉の翻字を改善(1/2) 1.Googleマップでインドの言葉の翻字を改善(1/2)まとめ ・日本だと「Google 渋谷」でも「グーグル 渋谷」でも渋谷のGoogle入居ビルを捜せる ・同じ単語を別の文字で書く事を翻字(transliteration)と言い多言語... 2021.02.01 アプリケーション
基礎理論 RxR:多言語の案内指示に対応する能力を測るベンチマーク(2/2) 1.RxR:多言語の案内指示に対応する能力を測るベンチマーク(2/2)まとめ ・RxRには約1,000万語が含まれており既存のデータセットの約10倍の規模 ・RxRを使い現在の最良のモデルであっても人間の半分程度のスコアである事が判明 ・R... 2021.01.31 基礎理論
基礎理論 RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2) 1.RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2)まとめ ・話し言葉や書き言葉を使った指示に応じて複雑な環境を案内できるAIの開発は大きな課題 ・視覚と言語のナビゲーション(VLN)と呼ばれるこの課題には、空間言語の高度... 2021.01.30 基礎理論