Mercury 2 logo

Mercury 2

即時のプロダクションAI向けに設計された、最速の推論LLM

Artificial Intelligence API Development

概要

Mercury 2は逐次デコードを捨て、並列リファインメントで生成を行う拡散LLM。1,000トークン/秒超の推論速度により、エージェントループの遅延を大幅に抑える。APIはOpenAI互換で、コードを書き換えず導入できる。Diffusion系の新世代として注目される。

特徴

  • 並列生成により低遅延を実現
  • 推論品質を維持しつつ高速化

活用シーン

  • マルチステップのエージェントループ、リアルタイム音声アプリなど、遅延が課題となるケースに有効
投票数: 91
← 投稿一覧に戻る