AssemblyAI

音声エージェント向け、ストリーミング対応で最も正確な音声認識モデル。

概要

Universal-3 Pro Streamingは、音声エージェント向けのリアルタイムSTTで最も正確です。エンティティ検出・話者ラベル・コードスイッチングを備え、難所である不発話・英数字・ノイズ環境にも対応します。1つのAPIで99言語以上をサポート。新機能としてリアルタイム話者ディアリゼーションとグローバル言語対応を追加しました。従来のストリーミングでは解決できなかったエッジケースを網羅します。

ストックにはログインが必要です

概要