这次大概率是真的,但跟网上传的版本有很大出入。
先看截图本身。@bdsqlsz是国内做模型量化最顶尖的独立开发者之一,他在HuggingFace上传DeepSeek-V4-INT8权重文件,然后配了句"it is coming"。这个人不是营销号,不蹭热度,他出现在这里可能只有一个原因:他拿到了V4的权重,正在做量化适配。
INT8量化这个细节信息量很大。它说明V4的开源权重已经定型,进入了发布前最后的社区适配阶段。量化是模型从实验室走向生产环境的最后一步,相当于芯片流片前的最终验证。走到这一步,发布基本是可确定的事。
此前还有消息说DeepSeek要求供应商在6到20号期间保持稳定,最近两天在做最后的压力测试。结合bdsqlsz的上传时间点,时间线完全吻合。
但我还是要泼点冷水。
截图里只有model文件和README,看不出任何多模态支持的痕迹。网上那些"原生多模态""图片视频文本同时生成"的说法,在这次泄露的文件结构里找不到佐证。此前科创板日报综合的消息称V4是原生多模态架构,V4 Lite代号"sealion-lite",拥有100万token上下文,但那些信息来源全是自媒体爆料和社区猜测,DeepSeek官方从未确认过任何一条。
所以这次上传的INT8权重,更可能是V4的文本基座模型,多模态版本大概率会在之后分步发布。DeepSeek的风格一直是先把基座放出来让社区跑起来,再逐步加能力。V3就是这么干的。
至于跑分,2月中旬泄露的SWE-Bench Verified 83.7%确实炸裂,超过了Claude Opus 4.5的80.9%和GPT-5.2的80%。但正如有人质疑的:这个分数是基于哪个版本的checkpoint跑出来的?用了什么评测框架?有没有做pass@k?没有这些细节,一个数字就只是一个数字。
其实真正值得关注的是另一条暗线。路透社和金融时报报道,DeepSeek这次绕开了英伟达,没有给英伟达V4的早期接入权限。这意味着V4在推理侧已经完成了国产芯片的全面适配。如果这件事坐实,V4的战略意义远超模型本身。它证明了一件事:在推理部署环节,中国AI产业链可以完全脱离英伟达生态独立运转。
所以V4来了,大概率是可期待的事情。但别被社区的狂热预期带偏了。冷静看待这次发布,关注三件事就够了:一看参数量和架构是否开源论文同步发布,二看实际推理成本对比V3降了多少,三看国产芯片上的推理效率到底能打到什么水平。
跑分榜上的王座轮换很快,真正改变格局的是成本结构和硬件生态。V4如果在这两个维度上再推一把,那才是真正的"it is coming"。