阿里发布了 Qwen3.6-27B。27B 参数,Dense 架构,不是 MoE!原生支持 上下文,Apache-2.0 开源。官方给的数据很夸张:SWE-bench Verified 77.2,超过了 Qwen3.5-397B-A17B 这个 397B 参数的 MoE 旗舰。也就是说,参数量只有对方 1/15,但编码能力反而更好。这种模型跑分我通常不太信,得自己跑一下。我的设备,RTX 4090(24GB 显存,Windows,LM Studio 加载模型。用的是 Q4_K_M 量化版,体积大概在 16GB 出头。
兰 亭 墨 苑
期货 · 量化 · AI · 终身学习