通义千问开源Qwen3-VL-30B-A3B模型
6 天前

10月4日,阿里云通义千问宣布开源Qwen3-VL-30B-A3B-Instruct与Thinking模型,同步推出FP8版本及超大规模模型Qwen3-VL-235B-A22B的FP8版本。Qwen3-VL-30B-A3B-Instruct与Thinking体积更小但性能强劲,仅需30亿激活参数,即可在STEM、视觉问答、光学字符识别、视频理解、智能体任务等多个领域媲美甚至超越GPT-5-Mini和Claude4-Sonnet。该模型可在魔搭社区、Hugging Face免费下载,并已同步上线Qwen Chat。