
VoxCPM
ストックにはログインが必要です
リアルな声を実現するトークナイザーなしのTTS
Artificial Intelligence
GitHub
Open Source
Audio
VoxCPMとは?
VoxCPMは、最新のオープンソースのトークナイザーなしTTS(テキスト読み上げ)モデルです。
特徴
- トークナイザーなし: 音声を連続空間でモデル化し、離散トークンの制約から解放されます。
- 表現力豊か: 文脈に応じた生成機能により、テキストを読み上げる際のトーンを変えることが可能です。例えば、物語を語るようにも、ニュースを伝えるようにもなります。
- リアルな音声クローン: ゼロショット音声クローン機能によって、音色だけでなく話者の独特のアクセントや感情も再現します。
使用環境
VoxCPMは一般消費者向けのGPUでも効率的に動作し、誰でも簡単に利用することができます。
投票数: 9