Speech AI Platform
ストックにはログインが必要です
150MB で実現する発音評価、STT&TTS — AIエージェント向け
Artificial Intelligence
Developer Tools
Education
概要
Speech AIは発音評価・STT・TTSの3APIを統合した音声処理プラットフォームです。発音評価とSTTは同一の17MBモデルを共有。TTSはKokoro-82M(115MB)を使用し、英語12ボイス。3機能はMCPサーバに8ツールとして同梱され、AIエージェントからのツール呼び出しで統合利用が可能。REST APIとAzure Marketplaceも利用可能。
特長
- 小型モデルで低コスト・低遅延
- 単一APIキーで3機能を管理
- Claude・GPT等のエージェント統合対応
デモと今後
- HuggingFaceスペースのデモを提供
- 追加機能の検討を歓迎
投票数: 3