走进中国AI实验室:工程师文化如何重塑LLM竞赛格局
作者深入走访多家中国AI实验室,指出其以学生驱动、务实协作和“自建技术栈”为核心的工程师文化,在芯片与数据受限环境下形成独特生态,与美国形成差异化竞争路径。
sync_time: 2026-05-09 00:10:28
source: clipboard
content_hash: fb4a09f837eedbb7abbca94da689df47
tags: [中国AI, 中美科技对比, 大语言模型, 产业生态, 技术文化]
summary: "作者对中国AI实验室文化与产业生态的深度观察与反思。"
score: 9
title: ""
manual_edit: false
核心摘要
《来自中国AI实验室内部的笔记》整理版
作者:Nathan Lambert
日期:2026年5月7日
一、总体观感
作者实地走访中国多家顶尖AI实验室后,对中国AI生态形成了三点总体印象:
- ✅ 研究者普遍谦逊、务实、专注工程落地
- ✅ 实验室之间更像“生态系统”,而非对抗部落
- ✅ 企业构建大模型源于对核心技术掌控的长期战略需求
第一部分:中国研究文化的特征
1️⃣ 工程文化优先
中国AI实验室在LLM构建上展现出高度系统化能力:
- 强调全栈优化(数据→架构→强化学习→部署)
- 愿意做“苦活累活”以提升整体模型表现
- 更少个人英雄主义冲突
- 组织结构更具可扩展性
对比美国:
| 维度 | 中国 | 美国 |
|---|---|---|
| 文化导向 | 工程执行 | 个人表达 |
| 明星研究者 | 少 | 多 |
| 内部冲突 | 较少 | 更常见 |
2️⃣ 学生作为核心力量
中国实验室大量依赖年轻研究者:
- 学生被直接整合进核心团队
- 适应新范式速度快(MoE → RL → Agent)
- 更少路径依赖
- 更少哲学性讨论
但也存在特征:
- 对AI社会影响讨论较少
- 更专注模型构建本身
3️⃣ 对哲学与宏观议题的态度
中国研究者:
- 更关注“如何把模型做好”
- 较少参与AGI伦理或宏观经济讨论
- 不强调个人公共影响力
文化引用:
中国由工程师管理,美国由律师管理。
第二部分:中国AI产业生态
1️⃣ AI市场规模争议
关键问题:
中国AI支出更像SaaS市场(小)还是云市场(大)?
作者判断:
- 更接近云服务市场
- 推理需求可能大规模增长
2️⃣ 工具偏好现象
- 中国开发者高度认可 Claude
- Kimi / GLM 被用于本地开发
- Codex 提及较少
说明:技术人员务实,不完全受历史付费习惯限制。
3️⃣ “技术掌控”思维
中国企业自研大模型的原因:
- 掌控技术栈
- 避免完全依赖开源社区
- 形成内部微调能力
案例企业:
- 美团
- 小米
- 阿里
- 字节跳动
与美国差异:
- 美国类似企业多选择采购模型服务
- 中国企业更倾向自建
4️⃣ 政府角色
特点:
- 地方政府积极招商
- 协助解决行政障碍
- 未观察到技术层面干预
- 具体影响程度不透明
5️⃣ 数据产业现状
- 外部数据市场质量有限
- 强化学习环境多内部自建
- 大厂拥有自有标注团队
体现出:
构建 > 购买
6️⃣ 芯片瓶颈
- 对英伟达算力需求极强
- 供应受限
- 华为芯片用于推理
算力是现实约束条件。
第三部分:生态差异总结
🇨🇳 中国模式
- 工程驱动
- 生态协同
- 掌控技术栈
- 实用主义
- 对AI持乐观态度
🇺🇸 美国模式
- 个人品牌突出
- 思辨文化强
- 商业趋势讨论活跃
- 更强的地缘政治叙事
第四部分:作者的核心问题
- 不同生态是否会产生本质不同的模型?
- 中国是否会持续处于3–9个月追赶状态?
- 美国是否会在开放模型政策上动摇?
核心结论提炼
- ✅ 文化塑造模型能力
- ✅ 中国AI更像协同生态
- ✅ 芯片与数据约束塑造技术路径
- ✅ 企业自研源于掌控欲而非短期回报
- ✅ 全球AI竞争正在进入结构性分化阶段
编辑修正说明
作者补充:
中国研究者较少讨论宏观议题,不仅源于谦逊,也源于其成长与教育体系。
一句话概括
这不仅是一篇AI产业观察,更是一篇关于文化如何塑造技术路径的现场记录。
原始内容
《来自中国AI实验室内部的笔记》
作者:Nathan Lambert,2026年5月7日
坐在从杭州开往上海的崭新高铁上,窗外是起伏的山脊,风力发电机在落日的映衬下显得格外宏伟。群山成为广阔的田野与高耸楼群交错的背景。我带着极大的谦逊从中国归来。去一个如此陌生的地方,却能受到如此真诚的欢迎,这是一种温暖的人性体验。我有幸见到了许多在AI领域早已神交的研究者,他们都以灿烂的笑容和热情迎接我,不断提醒着我自己的工作以及整个AI生态的全球化程度。
中国研究者的思维方式
中国那些构建语言模型的公司,似乎是这波技术的完美“快速跟随者”。它们建立在悠久的文化传统之上,这套传统根植于教育和职场,也与美国构建科技公司的方法有着微妙的不同。当你只看产出,比如那些能驱动智能体工作流的最新宏大模型,以及构成它的要素——优秀的科学家、大规模的数据、加速计算能力——中美实验室看起来大同小异。但持久的差异,则体现在这些要素是如何被组织和驯化的。
我长久以来一直有种直觉,中国实验室之所以如此善于追赶乃至同步前沿,是因为他们的文化天然适合这项任务。但在与这些人直接交流之前,我不敢把如此重要的推论完全寄托于直觉之上。与许多优秀、谦逊而开放的中国顶尖实验室科学家交谈之后,我之前的许多信念变得更加清晰了。
如今,构建最好的LLM在很大程度上取决于全栈的精细工作,从数据到架构细节,再到强化学习算法的实现。模型的每一个环节都能提供一些改进的可能性,而将它们整合在一起是一个复杂的过程——在这个过程中,一些杰出个人的工作可能会因为整体模型在多目标优化上的取舍而被搁置。
美国研究者当然同样擅长解决这些独立组件的问题,但美国文化更强调为自己发声。作为一个科学家,只有你勇于为自己的工作辩护才能获得成功,而当代文化正推动着一种“AI明星科学家”的新路径走向成名。这会导致直接的冲突。据传,Llama组织正是因为不同利益在其层级森严的组织结构中内耗而走向崩溃。我也听说,有些实验室为了安抚一位顶尖研究员,不得不付钱让他别再抱怨自己的点子最终没能被采纳进模型。无论这些传言是否完全属实,其背后的道理是清晰的:个人自我意识和对职业晋升的渴望,确实会阻碍构建出最好的模型。
当然,部分原因也在于中国究竟是谁在构建模型。一个显而易见的现状是,所有实验室的核心贡献者中,都有很大一部分是活跃的学生。实验室成员非常年轻,这让我想起了我们在Ai2的设置,学生被视为同僚,并被直接整合进LLM团队。这与美国顶级实验室的情况截然不同。像OpenAI、Anthropic、Cursor这类公司干脆不提供实习机会。而其他像谷歌这样的公司,名义上有与Gemini相关的实习,但实习生们很担心会被孤立,远离真正的核心业务。
总结一下,文化上的细微变化如何能提升构建模型的能力:
- 更愿意做那些不张扬的苦活累活,只为了提升最终模型的质量;
- 新入局AI的人不受先前AI热潮周期的束缚,能更快地适应新的现代技术(事实上,我交谈过的一位中国科学家就特别强调了这一点优势);
- 较少的自我意识使得组织架构能更好地扩展,因为“玩弄体制”的现象较少;
- 人才储备充足,且他们非常善于根据其他地方的概念验证来解决问题。
这种在构建当今大语言模型所需的技能上稍有倾斜的优势,与一个众所周知的刻板印象形成了对比:即中国研究者往往不太擅长进行更具创造性、开辟新领域、从0到1的学术式研究。在我们这次拜访的那些更偏学术的实验室时,许多领导者都在谈论如何培育这种更具雄心的研究文化。同时,我们交谈过的一些技术领导者,对短期内是否可能出现这种科研方法上的重塑持怀疑态度,因为这需要重新设计教育和激励体系,而这种变革的规模在当期的经济均衡下难以发生。这种文化似乎非常适合训练出在LLM构建游戏中表现优异的学生和工程师。当然,他们的数量也是极多的。
这些学生告诉我,中国也正在经历与美国相似的“人才流失”,很多以前考虑走学术道路的人现在打算留在工业界。最有趣的一句引述来自一位研究者,他本来对当教授感兴趣,因为可以亲近教育体系,但他随即说道:“教育已经被LLM解决了——学生还有什么理由要来找我聊天呢!”
学生的优势在于他们能带着全新的眼光看待LLM。过去几年里,我们见证了LLM的核心范式从扩展MoE架构,到扩展强化学习,再到驱动AI智能体。要把其中任何一项做好,都需要极快地吸收海量上下文信息,既包括广泛的文献,也包括你所在公司的技术栈。学生们习惯于此,并且兴奋地、谦逊地放下所有关于什么应该有效的预设。他们会全身心投入,并为了获得改进模型的机会而全力以赴。
这些学生也异常地直接,完全没有那些可能会让科学家分心的哲学清谈。当被问及他们对模型的经济性或长期社会风险有何看法时,只有极少数中国研究者对此有深思熟虑的观点和改变现状的动力。他们的角色就是去构建最好的模型。
这种差异很微妙,也很难否认,但当你与一位优雅、睿智、能熟练用英语清晰沟通的研究者进行长时间交谈时,感受最深——那些关于AI更偏哲学层面的基本问题,会悬在空中,伴随着一种单纯的困惑。这对他们来说,是一种范畴错误。当被追问到这些领域时,一位研究者甚至引用了著名作家Dan Wang的经典论断:中国是由工程师管理的,而美国则是由律师管理的,以此来强调他们渴望构建的意愿。中国不存在一种能系统性地赋能科学家打造个人明星光环的路径,类似于Dwarkesh或Lex那样的大型主流播客。
我试图让中国科学家评论由AI引发的即将到来的经济不确定性、超出AGI能力范畴的问题、或是关于模型应如何行为的道德争论——这一切都恰好捕捉到了这些科学家所接受的成长环境与教育体系。他们对自己的工作极其投入,但他们成长于一个不鼓励对社会应如何构建和变革进行辩论和发表意见的体系中。
将视野拉远来看——北京尤其让我感觉很像旧金山湾区,一个彼此竞争的实验室之间只是步行或打个车即可到达的距离。我一落地,就在去酒店的路上顺道拜访了阿里的北京园区。然后,在36小时内,我们马不停蹄地拜访了智谱(Z.ai)、月之暗面(Moonshot AI)、清华大学、美团、小米和零一万物(01.ai)。用滴滴出行很方便,如果你在中国选择优享车型,经常会叫到电动面包车,里面还配着按摩椅。我们向研究者们询问了人才争夺战的情况,他们说这和美国一样激烈。研究者频繁跳槽很正常,人们选择去哪,很大程度上取决于当下最看重的氛围。
在中国,LLM社区的感觉更像是一个生态系统,而非交战的部落。在许多非正式谈话中,大家对同行只有尊重。所有的中国实验室都忌惮字节跳动及其广受欢迎的豆包模型,这是中国唯一的前沿闭源实验室。与此同时,所有实验室都极度尊重DeepSeek,认为它是在执行层面拥有最佳研究品味的实验室。而在美国,当你私下与实验室成员会面时,火花很快就会四溅。
中国研究者最令人印象深刻的谦逊,还体现在他们常常对商业端的问题耸耸肩,说这不是他们的问题,而美国似乎每个人都痴迷于各种生态层面的行业趋势,从数据卖家到算力,再到融资。
中国AI产业与美国实验室的异同
今天构建AI模型最有趣的地方在于,它不再仅仅是把一群顶尖研究员聚集在同一栋楼里,去创造一项工程奇迹了。以前或许如此,但要维持AI业务,LLM正日益成为研发、部署、融资和推广的综合体。顶尖的AI公司处于复杂的生态系统中,这个系统为它们提供资金、算力、数据等各种资源,以持续推动前沿。
对各种如何创造和维持LLM的驱动因素的整合,在西方生态中已经有很好的概念化和布局,典型代表便是Anthropic和OpenAI。因此,找出中国实验室在这些方面的不同思路,就能指明它们可能在对未来做出哪些有意义的差异化选择。当然,这些未来在很大程度上会受到资金或算力限制的影响。
以下是我与这些实验室交谈后,在“AI产业”层面最重要的几点收获:
-
国内AI需求的早期迹象。 有一个被广泛传播的假设,即中国AI市场会较小,因为中国企业习惯上不愿为软件付费——因此,永远无法解锁一个足以支撑实验室的巨大推理市场。但这仅适用于SaaS生态的软件支出,SaaS市场在中国历史上规模确实很小;然而,中国依然存在着庞大的云服务市场。一个关键的未解问题是:企业在AI上的支出,是更接近SaaS市场(小),还是云市场(基础性)?对此,中国实验室自己也在争论。总体而言,感觉AI的趋势更接近云服务,而且没有人会真的担忧市场无法围绕这些新工具成长。
-
大多数开发者都是Claude的拥趸。 中国大多数AI开发者都对Claude极其着迷,痴迷于它如何改变了他们构建软件的方式,尽管Claude名义上在中国被禁。仅仅因为中国企业历史上不愿意为软件付费,就认为未来不会出现巨大的推理需求激增,这点并不能说服我。中国技术人员是如此务实、谦逊,且充满动力——这一事实似乎比他们过去不花钱的习惯更强大。
一些中国研究者提到会使用他们自己的工具进行构建,比如Kimi或GLM的命令行工具,但他们所有人都会提到用Claude来构建。令人惊讶的是,几乎没什么人提到Codex,而它在旧金山湾区正变得非常流行。
-
中国公司具有技术拥有的掌控思维。 中国文化正与蓬勃的经济引擎结合,创造出不可预测的结果。我离开时,一个持久的感受是:众多的AI模型反映了这里众多科技企业一种务实的、当下的均衡。没有总设计师那样的统一蓝图。整个行业的基础是对字节跳动和阿里巴巴的尊重,这两大巨头凭借海量资源,被预期会赢下大部分市场。DeepSeek是备受尊重的技术领导者,但远非市场领导者。它们设定方向,但这并非是为了经济上的胜利。
这就解释了像美团或蚂蚁集团这样的公司,西方人可能会惊讶它们居然也在造模型。但现实是,它们清楚地看到LLM是未来科技产品的核心,因此需要一个强大的技术底座。当它们微调这个强大的通用模型时,这个过程本身会固化它们的技术栈,避免因完全依靠开源社区反馈而变得透明。同时,它们可以保留内部微调的版本用于自家产品。行业中盛行的“开放优先”心态,在很大程度上是务实驱动的——这有助于他们的模型获得强烈反馈,回馈开源社区,并赋能他们的使命。
-
政府援助是真实的,但规模难测。 人们常断言,中国政府在积极助力这场开放的LLM竞赛。但这是一个层级分散的政府,各级部门对于具体要做什么并没有清晰的剧本。在北京,不同的区都在争抢科技公司入驻,提供几乎是必要的支持。提供给这些公司的“帮助”,几乎必然包括了疏通像许可证之类的手续,但这能做到什么程度呢?地方政府能帮助吸引人才吗?他们能帮助走私芯片吗?在整个访问中,有很多关于政府兴趣或帮助的提及,但这些细节太少了,远远不足以自信地评估政府能在多大程度上影响中国AI的轨迹。
当然,也绝对没有任何迹象表明,中国政府的顶层在干预模型的技术决策。
-
数据产业远不发达。 听闻太多关于Anthropic或OpenAI会为单个环境花费超1000万美元、每年总计花费数亿美元以推动强化学习的前沿,我们非常渴望知道,中国实验室是从美国的公司购买类似环境,还是有镜像般的国内生态系统支持。答案并非简单的没有数据产业,而是他们普遍认为外部数据产业的质量相对较差,往往不如在内部构建环境或数据。研究者自己会花费大量时间来制作强化学习的训练环境,而像字节跳动和阿里巴巴这样的大公司,可以有内部的数据标注团队来支持这项工作。这完全呼应了上一点提到的“构建而非购买”的思维。
-
对更多英伟达芯片的迫切渴望。 英伟达的计算能力是训练的黄金标准,而每个人的进展都受限于无法获得更多。如果供应充足,他们会毫不犹豫地购买。其他的加速器,包括但不限于华为,在推理方面获得了积极评价。无数实验室都拥有华为芯片。
这些描绘出了一幅截然不同的AI生态系统图景,如果将西方实验室的运营模式直接套用到它们的中国同行身上,往往会得出错误的结论。关键问题是:这些不同的生态系统,未来会催生出本质上完全不同的模型吗?还是说,中国的模型总会被解释为与美国3-9个月前的前沿模型相似?
结语:全球新平衡
在这次旅行之前,我对中国几乎一无所知,而现在我离开,却感觉自己才刚刚开始了解。中国无法用简单的规则或配方来表达,它是一个有着截然不同的动力学和化学反应的地方。这里的文化如此古老、如此深厚,并且仍然与国内科技的构建方式完全交织在一起。我还有很多要继续学习。
当下,美国的许多权力结构,都在将其对中国的主观世界观作为决策的关键心理工具。在当面正式或非正式地与几乎所有中国顶尖AI实验室交谈之后,我发现中国有很多特质和来自本能的出发点,是很难用西方的决策模型来模拟的。哪怕在直接询问为什么这些实验室会公开其顶级模型之后,拥有关键技术的掌控心态与真正支持生态系统之间如何关联,我仍然很难完全贯通。
中国的实验室非常务实,他们并非绝对的开源主义者,并不是每一个模型都会开放。但他们的确怀有一种深层的意愿,去支持开发者、支持生态,并将其作为深入了解自己模型的一种方式。
几乎所有中国的大型科技公司都在构建自己的通用LLM,正如我们看到像美团(外卖平台)和小米(广泛的消费科技公司)也会发布开放权重模型一样。在美国,同等的公司只会去购买服务。这些公司构建LLM,并非出于追赶时髦新事物的竞赛心态,而是源于一种根本的渴望:掌控自己的技术栈,并掌握当今时代最重要的技术。每当我从笔记本上抬起头,总能看到地平线上的塔吊,这本身就很好地融入了中国那种更广泛的构建文化,以及那股能量。
中国研究者所展现出的人情味、魅力和真诚的温暖,让我强烈地感受到他们人性化的一面。在个人层面,我们在美国习以为常的、尖锐的地缘政治叙事,对他们没有丝毫渗透。这个世界需要更多这种纯粹的积极。作为AI社区的一员,我眼下更担忧的,是美国社区内部因国籍标签而出现的裂痕。
如果说我不希望美国实验室在AI技术栈的各个环节都保持明确的领导地位——尤其是在我投入大量精力的开放模型领域——那我是在撒谎。我是美国人,这是一个坦诚的偏好。基于此,我希望整个开放生态本身能在全球蓬勃发展,因为这能为世界创造更安全、更易获得、更有用的AI。而眼下的问题是,美国实验室是否会采取行动来占据那个领导地位。
就在我完成这篇文章时,更多关于总统行政命令会在开源模型上摇摆不定的传言四起,这可能会进一步复杂化“美国领导力”与“全球生态”之间的协同关系——这并未让我充满信心。
感谢我在Moonshot、智谱、美团、小米、通义千问、蚂蚁灵、01.ai等机构遇到的所有出色的人们,感谢你们的欢迎和慷慨分享的时间。我会在思考逐渐成熟时,继续分享我对中国的看法,无论是文化整体的,还是AI专门的。很明显,这些认知都将与AI发展前沿未来所展开的叙事直接相关。
编辑注 05/07:在原版这一段中,我将研究者不愿谈论更广泛议题的原因错误地主要归因于谦逊。谦逊当然是原因之一,但这种习惯也源自他们成长和受训的系统,一个他们在其中表现出色并游刃有余的系统。
📊 核心要点总结
这篇文章的核心观点可以归纳为以下几个关键结论:
-
文化驱动效率:中国AI实验室的竞争力,根植于一种务实、谦逊、少谈哲学、专注做事的工程师文化。学生作为核心研发力量,带来了快速迭代和不设限的视角。
-
“生态型”竞争:与美国实验室间的“部落式”竞争不同,中国AI社区更像一个彼此尊重的生态系统。DeepSeek被尊为“技术品味标杆”,字节跳动(豆包)则因闭源路线和市场领先让同行忌惮。
-
约束下的路径:英伟达高端芯片的短缺是中国实验室面临的最大现实瓶颈,这反而催生了极致优化的系统能力。同时,国内数据服务产业的不成熟,倒逼出“自建而非购买”的内部研发文化。
-
商业逻辑迥异:中国企业构建AI是出于掌控核心技术栈的底层渴望,而非追求短期财务回报。这解释了为何像美团、小米这类公司也在自研大模型。
-
乐观的公众基础:中国技术人员和公众对AI技术普遍持拥抱和乐观的态度,这与西方社会弥漫的AI威胁论和恐惧情绪形成鲜明对比。
-
去中心化的模糊政策:政府确实在提供援助,但形式更偏向于去除官僚障碍,而非顶层设计式的直接干预技术决策。