Speech AI Platform

概要

Speech AIは発音評価・STT・TTSの3APIを統合した音声処理プラットフォームです。発音評価とSTTは同一の17MBモデルを共有。TTSはKokoro-82M（115MB）を使用し、英語12ボイス。3機能はMCPサーバに8ツールとして同梱され、AIエージェントからのツール呼び出しで統合利用が可能。REST APIとAzure Marketplaceも利用可能。

特長

小型モデルで低コスト・低遅延
単一APIキーで3機能を管理
Claude・GPT等のエージェント統合対応

デモと今後

HuggingFaceスペースのデモを提供
追加機能の検討を歓迎

Speech AI Platform

ストックにはログインが必要です

概要

特長

デモと今後