Qwen3-VL

概要

「Qwen3-VL」は、Qwenチームが開発した最先端のビジョン-言語モデルで、特に以下の分野での性能が際立っています。

視覚エージェントタスクの向上：スマートフォンやPCのGUIを実際に操作できる能力
長時間動画の理解：256K（最大1Mまで拡張可能）のコンテキストウィンドウを利用
空間推論：様々な視覚的な文脈を理解し処理する力

また、Qwenは新しいテキストモデル「Qwen3-Max」を発表し、コーディングとエージェントスキルを強化しています。このリリースには、アップグレードされた「Qwen3-Coder」、リアルタイム翻訳機能、新しい安全モデルシリーズも含まれ、Qwen3シリーズはマルチモーダル能力と知能の両方で最高の性能を達成しています。

ストックにはログインが必要です

概要