モデル

Qwen3-0.6B_WBD：ブラウザ・スマホ内で動く日本語を強化した小規模言語モデル

１．Qwen3-0.6B_WBD：ブラウザ・スマホ内で動く日本語を強化した小規模言語モデルまとめ・Qwen3-0.6Bに継続学習・強化学習を施し、日本語ベンチマーク平均スコアを+15.5ptに向上・ブラウザ上での完全動作デモを公開。イン...

2026.02.24

人工知能/機械学習アプリケーション業界/分野モデル

$100ドルで買える最高のchatGPT、nanochatの日本語版の開発

１．$100ドルで買える最高のchatGPT、nanochatの日本語版の開発・「$100ドルで買える最高のchatGPT」のキャッチフレーズでAndrej karpathy氏が発表したnanochatの日本語版を作る試みを実行中・事前...

2025.10.26

人工知能/機械学習モデル

人工知能/機械学習

VoiceCoreの基本的な使い方 – 感情豊かなAIエージェント向け音声合成モデル

１．VoiceCoreの基本的な使い方 - 感情豊かなAIエージェント向け音声合成モデルまとめ・商用利用可能なライセンスで無料で感情豊かな日本語音声の発生が可能なAIエージェント用モデルVoiceCoreを公開・Colab用のサンプルス...

2025.07.25

人工知能/機械学習モデルAI

ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較する

１．ALMA-Jaの日英・英日翻訳性能をGoogleやMetaの最新多言語機械翻訳モデルと比較するまとめ・最近リリースされた超多言語翻訳モデルであるMADLAD 400、SeamlessM4T V2、Gemini proと自作の機械翻訳モ...

2023.12.21

アプリケーションモデル

日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開

１．日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開まとめ・先日公開した日英・英日機械翻訳モデルALMA-7B-Jaの性能を更に向上したV2を公開・70億パラメーターモデルだがMETA社の540億パラメーターモデルに近い性能を達...

2023.11.06

モデル

日英・英日機械翻訳モデルALMA-7B-Jaの公開

１．日英・英日機械翻訳モデルALMA-7B-Jaの公開まとめ・使い勝手の良いサイズ感の機械翻訳用のモデルが意外に選択肢がないと感じる事がある・多言語翻訳用の無料の機械翻訳モデルはサイズが大きかったりドキュメント不足で使うのが難しい・A...

2023.10.09

モデル

商用利用可能なライセンスで公開されたMetaの大規模言語モデルLlama2の動かし方

１．商用利用可能なライセンスで公開されたMetaの大規模言語モデルLlama2の動かし方まとめ・一昨日に発表されたMetaのLlama2はかなり性能が向上したので、130億パラメーター版(13b)をColabとローカルPCで動かしてみた方...

2023.07.24

入門／解説モデル

Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(2/2)

１．Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(2/2)まとめ・Vid2Seqアーキテクチャにはビデオフレーム用のエンコーダー音声入力用のエンコーダーが含まれる・Vid2Seqモデル幅広い領域をカバーする...

2023.04.22

モデル

Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(1/2)

１．Vid2Seq：ビデオ内の各イベントを記述可能な事前学習済み視覚言語モデル(1/2)まとめ・数分レベルの長さのビデオの中のすべてのイベントを説明するタスクを「高密度ビデオキャプション」という・標準的なビデオキャプションと比べて高度に...

2023.04.21

モデル

PaLM-E:ロボットは邪魔をされても引き出しからポテチを取り出すくらいはできるようになっている(2/2)

１．PaLM-E:ロボットは邪魔をされても引き出しからポテチを取り出すくらいはできるようになっている(2/2)まとめ・PaLM-Eはロボット操作タスクと視覚・言語タスクを共通の特徴表現で括ることで、汎化モデルを学習する新しいパラダイムを提...

2023.04.16

モデルロボット

PaLM-E:ロボットは邪魔をされても引き出しからポテチを取り出すくらいはできるようになっている(1/2)

１．PaLM-E:ロボットは邪魔をされても引き出しからポテチを取り出すくらいはできるようになっている(1/2)まとめ・ロボットモデルの規模拡大は一定の成功を収めているが、テキストや画像に匹敵する規模のデータセットがないので遅れをとっている...

2023.04.15

モデルロボット

FollowYourPose:画像生成モデルとポーズ動画と文章からキャラクターの動画を生成

１．FollowYourPose:画像生成モデルとポーズ動画と文章からキャラクターの動画を生成まとめ・FollowYourPoseは棒人間形式にした動画とプロンプトを与えるとプロンプトと動画に基づいたキャラクター動画を簡単に作れる新モデル...

2023.04.08

モデル