🚀 Next Generation Voice AI Agent

感情豊かに日本語を話すVoice AIエージェント

3Bの軽量モデルで商用モデル級の品質を実現。
Finetuningで貴社専用の音声ブランディングを構築

3B
軽量パラメータ
2.83
UTMOS スコア
100%
商用利用可能
Features

VoiceCoreが選ばれる理由

エンタープライズ向けに設計された、次世代音声AIエージェント

🎯

自由にカスタマイズ可能

貴社のデータでFinetuning可能なオープンモデル。特定領域では商用モデルを超える性能を実現し、独自の音声ブランディングを構築できます。

完全無料の無制限生成

3Bパラメータの軽量設計により、消費者向けGPU上でリアルタイム動作可。高額なAPIコストから解放され、無制限の音声生成が可能です。

🎨

自然な感情表現

AIエージェントが分脈を意識した人間らしい感情を込めた発話を実現。ユーザーとの深いエンゲージメントを創出します。

🏢

エンタープライズ対応

商用利用可能なライセンスと、セキュリティ・サステナビリティに配慮した法人向けサポートプランをご用意。

🛡️

プライバシー保護

完全自社サーバー(オンプレミス)運用が可能。機密データを外部に送信することなく、安心安全な音声生成環境を構築できます。

🔧

カスタマイズサポート

公開スクリプトを超えた高度なpost trainingや、システム統合まで、専門チームが貴社のニーズに合わせてサポート。

Performance

業界最高水準の音声品質

標準的な評価指標で、最新商用モデルと肩を並べる性能を実証

📊 UTMOS (聴感品質)

東京大学開発の評価モデル。人間が感じる音声の自然さ・品質を予測。スコアが高いほど自然で高品質。

🎚️ NISQA (技術品質)

ノイズ・音質・連続性など技術面を多角的に評価する業界標準指標。通信音声品質の評価に広く採用。

モデル UTMOS平均 UTMOS標準偏差 NISQA平均 特徴
VoiceCore (本モデル) 2.83 0.46 4.29 全体的に品質のバラツキが少ない
ElevenLabs V3 2.96 0.67 4.19 高品質だが文章によってややブレがある
Gemini 2.5 Pro preview tts 2.81 0.58 4.52 技術的に最もクリーン

💡 Finetuningで、その先へ

これらはElevenLabs社が提供しているサンプル文章を読み上げた汎用的なベースライン性能です。
貴社のデータでカスタマイズすることで、特定領域では商用モデルを凌駕する可能性があります。

Demo

実際の音声を聴き比べる

各モデルの音声品質を実際にご確認ください

サンプル 1

女性声(プレビュー)
🎯 VoiceCore
UTMOS: 2.75 NISQA: 4.31
ElevenLabs V3
UTMOS: 3.87 NISQA: 4.81
Gemini 2.5 Pro tts
UTMOS: 3.62 NISQA: 4.75

サンプル 2

男性声
🎯 VoiceCore
UTMOS: 3.51 NISQA: 4.79
ElevenLabs V3
UTMOS: 3.15 NISQA: 4.09
Gemini 2.5 Pro tts
UTMOS: 2.64 NISQA: 4.62

サンプル 3

女性声(プレビュー)
🎯 VoiceCore
UTMOS: 2.30 NISQA: 3.89
ElevenLabs V3
UTMOS: 2.02 NISQA: 3.36
Gemini 2.5 Pro tts
UTMOS: 2.07 NISQA: 3.78

サンプル 4

男性声
🎯 VoiceCore
UTMOS: 2.59 NISQA: 3.88
ElevenLabs V3
UTMOS: 2.75 NISQA: 4.56
Gemini 2.5 Pro tts
UTMOS: 2.59 NISQA: 4.62

サンプル 5

男性声
🎯 VoiceCore
UTMOS: 2.99 NISQA: 4.57
ElevenLabs V3
UTMOS: 3.02 NISQA: 4.11
Gemini 2.5 Pro tts
UTMOS: 3.14 NISQA: 4.84

注: VoiceCoreの女性の声(サンプル1, 3)は現在プレビュー版の位置づけです。フィードバックをお待ちしております。
緑色の数値はそのサンプルでの最高スコアを示しています。

今すぐVoiceCoreを始める

次世代AIエージェントシステムに、感情豊かな日本語の音声を。