Qwen3-VL logo

Qwen3-VL

鮮明な視界、深い思考、広い行動

Artificial Intelligence Open Source Photo & Video

概要

「Qwen3-VL」は、Qwenチームが開発した最先端のビジョン-言語モデルで、特に以下の分野での性能が際立っています。

  • 視覚エージェントタスクの向上:スマートフォンやPCのGUIを実際に操作できる能力
  • 長時間動画の理解:256K(最大1Mまで拡張可能)のコンテキストウィンドウを利用
  • 空間推論:様々な視覚的な文脈を理解し処理する力

また、Qwenは新しいテキストモデル「Qwen3-Max」を発表し、コーディングとエージェントスキルを強化しています。このリリースには、アップグレードされた「Qwen3-Coder」、リアルタイム翻訳機能、新しい安全モデルシリーズも含まれ、Qwen3シリーズはマルチモーダル能力と知能の両方で最高の性能を達成しています。

投票数: 15
← 投稿一覧に戻る