アプリケーション

Qwen3-0.6B_WBD:ブラウザ・スマホ内で動く日本語を強化した小規模言語モデル

1.Qwen3-0.6B_WBD:ブラウザ・スマホ内で動く日本語を強化した小規模言語モデルまとめ・Qwen3-0.6Bに継続学習・強化学習を施し、日本語ベンチマーク平均スコアを+15.5ptに向上・ブラウザ上での完全動作デモを公開。インスト...
人工知能/機械学習

LLMにおける2重BOS問題とは?

1.2重BOS問題の注意・Gemma, LLamaなどは設定通りに動かすとプロンプトの先頭にBOSが2つ付与されて誤動作を誘発するケースがある・話題になった事はあるが、トレーニングツール、ベンチマークツール、インターフェースツールのいずれか...
人工知能/機械学習

$100ドルで買える最高のchatGPT、nanochatの日本語版の開発

1.$100ドルで買える最高のchatGPT、nanochatの日本語版の開発・「$100ドルで買える最高のchatGPT」のキャッチフレーズでAndrej karpathy氏が発表したnanochatの日本語版を作る試みを実行中・事前学習...
入門/解説

今からYouTube動画や配信を始めたい人へ

1.今からYouTube動画や配信を始めたい人へまとめ・これから動画や配信を新たに始めたい初心者のあなたへ。- AIに要約される時代の新しいYouTube攻略法 -・YouTubeの「引き伸ばし構文」はいつまで通用するか?8分解説+AIツー...
アプリケーション

視聴者に同調して配信を盛り上げるAI Agentシステムの紹介

1.視聴者に同調して配信を盛り上げるAI Agentシステムの紹介まとめ・配信者と対話して応援する対話型応援AI Agentに続いて、視聴者に同調して配信を盛り上げる同調型応援AI Agentのデモ・実際に配信で使ってみた所、セットアップが...
アプリケーション

APIを使わずにローカルPCだけで動作するAItuber改め、配信を手伝うAI Agent構想

1.APIを使わずにローカルPCだけで動作するAItuber改め、配信を手伝うAI Agent構想まとめ・VoiceCoreの認知度向上のためにカスタマーサポートの生産性向上を競うコンペティションに参加する事にした・具体的にはvtuber/...
人工知能/機械学習

VoiceCoreの基本的な使い方 – 感情豊かなAIエージェント向け音声合成モデル

1.VoiceCoreの基本的な使い方 - 感情豊かなAIエージェント向け音声合成モデルまとめ・商用利用可能なライセンスで無料で感情豊かな日本語音声の発生が可能なAIエージェント用モデルVoiceCoreを公開・Colab用のサンプルスクリ...
アプリケーション

ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較する

1.ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較するまとめ・最近リリースされた超多言語翻訳モデルであるMADLAD 400、SeamlessM4T V2、Gemini proと自作の機械翻訳モデ...
AI

2023年12月時点で英語圏で人気のある大規模言語モデルとトレンド

1.2023年12月時点で英語圏で人気のある大規模言語モデルとトレンドまとめ・chatGPTのようにAIが人間に迫るレベルで言葉を扱う事を可能した技術を大規模言語モデル(LLM:Large language Models)と言う・英語圏で最...
モデル

日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開

1.日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開まとめ・先日公開した日英・英日機械翻訳モデルALMA-7B-Jaの性能を更に向上したV2を公開・70億パラメーターモデルだがMETA社の540億パラメーターモデルに近い性能を達成・...
AI関連その他

GPUの需要と供給から考える2024年以降のAI開発の傾向と対策

1.GPUの需要と供給から考える2024年以降のAI開発の傾向と対策まとめ・アメリカの対中国の半導体輸出規制の影響は価格を落ち着かせるのではなく高騰に拍車をかけそう・法人/データセンター向けGPUは品不足が続きそうだが個人向けが同様に盛り上...
モデル

日英・英日機械翻訳モデルALMA-7B-Jaの公開

1.日英・英日機械翻訳モデルALMA-7B-Jaの公開まとめ・使い勝手の良いサイズ感の機械翻訳用のモデルが意外に選択肢がないと感じる事がある・多言語翻訳用の無料の機械翻訳モデルはサイズが大きかったりドキュメント不足で使うのが難しい・ALMA...