
DeepSeek-V3.2-Exp
ストックにはログインが必要です
DeepSeek Sparse Attentionによる長文脈効率性の向上
Artificial Intelligence
GitHub
Open Source
API
概要
DeepSeek-V3.2-Expは、長文脈の効率性を重視した新しい実験モデルで、DeepSeek Sparse Attention (DSA)を導入しています。この新たなアーキテクチャにより、トレーニングと推論が高速かつ低コストで実現され、前のバージョンであるV3.1-Terminusのパフォーマンスが維持されています。
特徴
- 新しいアーキテクチャ: DeepSeek Sparse Attention (DSA)による長文脈の最適化
- コスト削減: APIの価格が50%以上ダウン
- 効率的なトレーニング: 質を損なわずにプロセスを迅速化
このリリースは、開発者にとって特に嬉しいニュースで、より安価で効率的に利用できる環境が整います。さらに、DeepSeekの最近の論文がNatureに掲載されたことで、今後の革新にも期待が高まります。個々の用途に応じた活用が進むことでしょう。
投票数: 114