アプリケーション ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較する 1.ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較するまとめ ・最近リリースされた超多言語翻訳モデルであるMADLAD 400、SeamlessM4T V2、Gemini proと自作の機械翻訳モ... 2023.12.21 アプリケーションモデル
アプリケーション segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデル 1.segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデルまとめ ・画像内にある物体を自動で認識して、切り出せるようにセグメンテーションマスクを作ってくれるSegment-Anything M... 2023.04.07 アプリケーションモデル
アプリケーション Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(2/2) 1.Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(2/2)まとめ ・Spotlightは、4つ下流タスクにおいて4つの従来手法を大幅に上回るスコアを達成する事ができた ・モデルが注目している領域を確... 2023.03.21 アプリケーションモデル
アプリケーション Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(1/2) 1.Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(1/2)まとめ ・AIにユーザーインターフェースの構成を理解して貰う事は、知的なUI動作を実現するための重要なステップとなる ・個々のUIタスクを学... 2023.03.20 アプリケーションモデル
アプリケーション chatGPTの上位互換であるGPT-4のリサーチブログの全訳とGPT-4で出来る事の紹介 1.chatGPTの上位互換であるGPT-4のリサーチブログの全訳とGPT-4で出来る事の紹介まとめ ・OpenAIが最新モデルGPT-4を発表。人間より能力が劣る部分もあるが専門的・学術的ベンチマークで人間レベルの性能を発揮 ・機械学習モ... 2023.03.15 アプリケーションモデル
アプリケーション 衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(2/2) 1.衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(2/2)まとめ ・火災と雲の画素を別々に分類するために、CNNの後に1x1の畳み込み層を設けて分類精度を向上させている ・画像内のほとんどの画素に火災が含まれていないため、非燃... 2023.02.16 アプリケーション
アプリケーション 衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(1/2) 1.衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(1/2)まとめ ・Googleの山火事追跡機能が最近機能拡張されより正確に10-15分ごとに火災の境界情報が更新されるようになった ・山火事の境界追跡は詳細さと更新頻度のバラン... 2023.02.15 アプリケーション
アプリケーション BardとGPT:検索エンジン時代からAI検索時代への変化を情報発信視点で考える 1.BardとGPT:検索エンジン時代からAI検索時代への変化を情報発信視点で考えるまとめ ・Microsoftの検索エンジンBingにAIが組み込まれるとの報道とほぼ同時期にGoogleも対話型人工知能LaMDAをベースにしたBardを組... 2023.02.10 アプリケーションAI関連その他
アプリケーション OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(2/2) 1.OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(2/2)まとめ ・OSS VizierはGoogleの多くのオープンソースプロジェクトや外部のフレームワークと大きく統合されていく事になる ・ニューラ... 2023.02.08 アプリケーション学習手法
アプリケーション OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(1/2) 1.OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(1/2)まとめ ・Google VizierはGoogle製品内の人工知能のハイパーパラメータを最適化するために使われてきた非公開システム ・そのGo... 2023.02.07 アプリケーション学習手法
アプリケーション OpenAIがテキストのembeddingを算出するAPIの価格を値下げ 1.OpenAIがテキストのembeddingを算出するAPIの価格を値下げまとめ ・openaiがGPT-3のモデルを使ってembeddingを作成するembeddingモデルの料金を引き下げる ・新しいモデルは従来5つに細分化されていた... 2023.01.19 アプリケーション
アプリケーション speaker labels:誰の発言がわかるように音声データにラベルをつけるスマホアプリ(2/2) 1.speaker labels:誰の発言かわかるように音声データにラベルをつけるスマホアプリ(2/2)まとめ ・音声をembedding化した後、複数のクラスタリング手法で話者推定を実施する ・メイン処理に渡す前に予備的アルゴリズムで事前... 2022.12.24 アプリケーションAI