Chatterbox Turbo
ストックにはログインが必要です
ネイティブなウォーターマーキング機能を備えた、速く表現力豊かなオープンソースTTS
Artificial Intelligence
Open Source
Audio
概要
- 350MパラメータのオープンソースTTSモデル。
- パラ言語タグで laugh/sigh などの感情を簡単に制御可能。
- ゼロショットによる声のクローン機能を搭載。
- 実時間の6倍以上の高速処理。
- 安全性のため PerTh ウォーターマーキングをデフォルト搭載。
- MITライセンス下の公開で、オープンソース領域での活用が期待される。
著者コメントの要点
- 使い勝手のよい感情制御と安全機能の組み込みを高く評価。
投票数: 110