アプリケーション

アプリケーション

ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較する

1.ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較するまとめ ・最近リリースされた超多言語翻訳モデルであるMADLAD 400、SeamlessM4T V2、Gemini proと自作の機械翻訳モ...
アプリケーション

segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデル

1.segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデルまとめ ・画像内にある物体を自動で認識して、切り出せるようにセグメンテーションマスクを作ってくれるSegment-Anything M...
アプリケーション

Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(2/2)

1.Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(2/2)まとめ ・Spotlightは、4つ下流タスクにおいて4つの従来手法を大幅に上回るスコアを達成する事ができた ・モデルが注目している領域を確...
アプリケーション

Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(1/2)

1.Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(1/2)まとめ ・AIにユーザーインターフェースの構成を理解して貰う事は、知的なUI動作を実現するための重要なステップとなる ・個々のUIタスクを学...
アプリケーション

chatGPTの上位互換であるGPT-4のリサーチブログの全訳とGPT-4で出来る事の紹介

1.chatGPTの上位互換であるGPT-4のリサーチブログの全訳とGPT-4で出来る事の紹介まとめ ・OpenAIが最新モデルGPT-4を発表。人間より能力が劣る部分もあるが専門的・学術的ベンチマークで人間レベルの性能を発揮 ・機械学習モ...
アプリケーション

衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(2/2)

1.衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(2/2)まとめ ・火災と雲の画素を別々に分類するために、CNNの後に1x1の畳み込み層を設けて分類精度を向上させている ・画像内のほとんどの画素に火災が含まれていないため、非燃...
アプリケーション

衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(1/2)

1.衛星画像と機械学習を用いて山火事の境界をリアルタイムに追跡(1/2)まとめ ・Googleの山火事追跡機能が最近機能拡張されより正確に10-15分ごとに火災の境界情報が更新されるようになった ・山火事の境界追跡は詳細さと更新頻度のバラン...
アプリケーション

BardとGPT:検索エンジン時代からAI検索時代への変化を情報発信視点で考える

1.BardとGPT:検索エンジン時代からAI検索時代への変化を情報発信視点で考えるまとめ ・Microsoftの検索エンジンBingにAIが組み込まれるとの報道とほぼ同時期にGoogleも対話型人工知能LaMDAをベースにしたBardを組...
アプリケーション

OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(2/2)

1.OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(2/2)まとめ ・OSS VizierはGoogleの多くのオープンソースプロジェクトや外部のフレームワークと大きく統合されていく事になる ・ニューラ...
アプリケーション

OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(1/2)

1.OSS Vizier:Google社内で使われている人工知能チューニングツールが公開(1/2)まとめ ・Google VizierはGoogle製品内の人工知能のハイパーパラメータを最適化するために使われてきた非公開システム ・そのGo...
アプリケーション

OpenAIがテキストのembeddingを算出するAPIの価格を値下げ

1.OpenAIがテキストのembeddingを算出するAPIの価格を値下げまとめ ・openaiがGPT-3のモデルを使ってembeddingを作成するembeddingモデルの料金を引き下げる ・新しいモデルは従来5つに細分化されていた...
アプリケーション

speaker labels:誰の発言がわかるように音声データにラベルをつけるスマホアプリ(2/2)

1.speaker labels:誰の発言かわかるように音声データにラベルをつけるスマホアプリ(2/2)まとめ ・音声をembedding化した後、複数のクラスタリング手法で話者推定を実施する ・メイン処理に渡す前に予備的アルゴリズムで事前...