我们做大模型,跟量化和金融都没有直接关系。我们要做的是通用人工智能,也就是AGI。
语言大模型是通往AGI的必经之路,并且初步具备了AGI的特征,所以我们从这里开始。
我们不会过早设计基于模型的一些应用,会专注在大模型上。从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。我们的目标很明确,就是不做垂类和应用,而是做研究,做探索。
我们理解人类智能的本质就是语言,人的思维就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。
只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。
我们希望更多人,哪怕一个小App都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。大厂的模型,可能会和他们的平台或生态捆绑,而我们是完全自由的。
从商业角度来讲,基础研究是投入回报比很低的。我们比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。
从最早的1张卡,到2015年的100张卡、2019年的1000张卡,再到一万张,这个过程是逐步发生的。很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动,对AI能力边界的好奇。
对很多行外人来说,ChatGPT这波浪潮冲击特别大;但对行内人来说,2012年AlexNet带来的冲击已经引领一个新的时代。AlexNet的错误率远低于当时其他模型,复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的,特别是当2020年OpenAI发布GPT3后,方向很清楚,需要大量算力。那之后,我们有意识地去部署尽可能多的算力。
一件激动人心的事,不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。
人工成本是对未来的投资,是公司最大的资产。我们选的人相对朴实一点,有好奇心,来我们这里有机会去做研究。大厂很难单纯去做研究,做训练,它更多会是业务需求驱动。如果不能很快应用,大厂不一定能持续坚持,因为它更需要看到结果。
我们招人有条原则是,看能力,而不是看经验。如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性与热爱等更重要。
我们的核心技术岗位,基本以应届和毕业一两年的人为主。做一件事,有经验的人会不假思索告诉你,应该这样做,但没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。
我们招人的条件是热爱,这些人的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。
我们的考核标准和一般公司不太一样。我们没有KPI,也没有所谓的任务。
创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。我们交给员工重要的事,并且不干预他。让他自己想办法,自己发挥。
招人时确保价值观一致,然后通过企业文化来确保步调一致。当然,我们并没有一个成文的企业文化,因为所有成文的东西,又会阻碍创新。更多时候,是管理者的以身示范,遇到一件事,你如何做决策,会成为一种准则。
按照教科书的方法论来推导创业公司,在当下,他们做的事,都是活不下来的。但市场是变化的,真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。很多大公司的组织结构已经不能快速响应和快速做事,而且他们很容易让之前的经验和惯性成为束缚,而这波AI新浪潮之下,一定会有一批新公司诞生。
最让我们兴奋的是去搞清我们的猜想是不是事实,如果是对的,就会很兴奋了。
信仰者会之前就在这里,之后也在这里。他们更会去批量买卡,或者跟云厂商签长协议,而不是短期去租。
创新是昂贵且低效的,有时候伴随着浪费。所以经济发展到一定程度之后,才能够出现创新。很穷的时候,或者不是创新驱动的行业,成本和效率非常关键。OpenAI也是烧了很多钱才出来的。
这个世界存在很多无法用逻辑解释的事,就像很多程序员,也是开源社区的疯狂贡献者,一天很累了,还要去贡献代码。类似你徒步50公里,整个身体是瘫掉的,但精神很满足。
不是所有人都能疯狂一辈子,但大部分人,在他年轻的那些年,可以完全没有功利目的,投入地去做一件事。
我们的大模型服务降价只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利,在成本之上稍微有点利润。
抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。
如果目标是做应用,那沿用Llama结构,短平快上产品也是合理选择。但我们的目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。
最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。
随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。
大部分中国公司习惯follow,而不是创新。
创新的成本肯定不低,过去那种拿来主义的惯例和过去的国情有关。但现在,无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。
过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。
在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,这就是我们的护城河。
开源,发论文,并没有失去什么。对于技术人员来说,被follow是很有成就感的事。开源更像一个文化行为,而非商业行为。给予是一种额外的荣誉,一个公司这么做也会有文化的吸引力。
美国最赚钱的公司,都是厚积薄发的高科技公司。
中国AI和美国真实的gap是原创和模仿的差距。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。
英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
我们不会闭源,我们认为先有一个强大的技术生态更重要。
我们短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。
更多的投入并不一定产生更多的创新,否则大厂可以把所有的创新包揽了。
我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek的基础上构建toB、toC的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。
如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。
技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。
提供云服务不是我们的主要目标,我们的目标是去实现AGI。
大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。
大模型创业公司可能活下来2到3家。现在都还处在烧钱阶段,那些自我定位清晰、更能精细化运营的,更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。
我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。
我们发布的V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但我们能自己打造这样的人。
DeepSeek也全是自下而上的。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。
我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批,同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。
我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。
创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信,这种信心通常在年轻人身上更明显。
我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们是有吸引力的。
OpenAI不是神,不可能一直冲在前面。
AGI可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向:一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。
未来会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。
我主要的精力在研究下一代的大模型,还有很多未解决的问题。
所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样,很可能是一种刻舟求剑。
我们经历了一个漫长的积累过程,外部看到的是幻方2015年后的部分,但其实我们做了16年。
未来中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。
未来硬核创新会越来越多,现在还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变,我们只是还需要一堆事实和一个过程。
下面将对这60条思考逐条进行详细阐述和深入分析,以帮助读者理解每个观点背后的逻辑、信念以及对技术、商业和组织文化的影响。
梁文锋强调,他们的目标并不在于拓展金融、量化等狭窄领域应用,而是瞄准通用人工智能(AGI)。这种区分表明,他们追求的不是“应用快速落地”的商业模型,而是一个更加开放和长远的目标:让人工智能拥有类似人类多方面通用的认知能力。
语言是人类思维与交流的载体。梁文锋认为,研究语言大模型不仅能帮助我们模拟语言过程,更能初步呈现出类人智能的特质。换句话说,通过对语言认知的逐步逼近,我们可以触碰到实现AGI的核心要素。
这里强调的是“基础研究优先”。而不是在初期就将模型应用于特定领域,团队希望先建立起足够强大和普适的大模型。未来,当技术成熟后,应用场景自然会跟上,而且这样可以避免被现有垂直领域应用的限制锁定,从而降低后续技术应用门槛,让更多初创公司有机会参与。
这一条提出了一种“语言中心论”:认为人类的思维过程内在地依赖语言,甚至很多时候我们“思考”其实是以语言为媒介在内部对话。若能基于这种观点构建大模型,那么人工智能很可能在某种程度上复制或模拟人类的思维过程,离AGI更近一步。
梁文锋指出,单纯“复刻”现有论文或开源代码所需的训练成本相对较低,但如果要进行真正的原创性科研,就需要做大量实验、对比和创新,算力和人才成本都会显著上升。这也意味着,追求前沿创新需要更多资源和更高风险承受力。
团队希望技术不要被大厂或少数公司垄断,让更多人甚至小型应用都能以低成本享受大模型带来的便利。这种思考背后反映出对“技术普惠性”的追求,希望构建一个开放、自由的发展生态,而不是受制于平台和商业利益。
梁文锋坦承,从商业角度看,基础科研的投入产出比往往较低,但正因为他们有能力、有热情投入这一领域,所以尽管短期看不到巨额回报,长远来看却有可能打破常规、形成突破。
从最早的单卡训练到如今成千上万的算力资源积累,表明大模型的发展是一个循序渐进的过程。这里没有什么“神秘”的商业套路,而是技术人员源自于对AI能力边界的无尽好奇,推动着硬件与算法同步进步。
对于大众来说,ChatGPT代表了最近的颠覆;而对“行内”人而言,早在2012年AlexNet的成功已经预示了新纪元的到来。作者借此说明,尽管外部热度不断,但技术的发展往往有着更长时间的沉淀过程,算力、数据、模型三者始终是核心驱动力。
梁文锋用钢琴的比喻说明,技术创新的价值不仅在于其金钱收益,更在于激发人们内心的热情和创造的欲望。这种驱动力往往来源于内在的满足感,而非简单的商业利润。
他提到“人工成本”其实是一种对未来的投资。公司选择那些心态朴实、充满好奇和热情的年轻研究者,而不像大厂那样受业务需求约束。这种战略保证了团队在追求前沿科研时拥有足够的自由和动力。
在招人时,他们更看重候选人的能力和潜质,而不是已有的经验。因为在追求创新时,经验有时会变成固化模式,限制个体对问题的全新思考。优秀的“菜鸟”反而更容易跳出固有框架,持续探索创新之路。
核心技术岗位主要由应届生或工作一两年的人承担,他们往往更愿意探索、犯错、调整,因为他们没有过去的经验包袱,这有助于打破常规、创造新的解决思路。
热情和对研究的执着往往能使人全身心投入工作。公司吸引优秀人才的一大方式,就是打造一个让热衷科研的人“自愿”前来共事、共同攻关的环境。
为了鼓励自由创新和试错,公司刻意放弃了传统的KPI考核制度。没有固定任务和指标,可以给团队成员更大的自由度,让他们专注于思考和实验,而不是追求数据上的短期成绩。
梁文锋强调,在创新过程中,管理层应尽量少进行干涉,让每个员工都有自由发挥和犯错的空间。创新往往是自发且偶然出现的,过多的管理有时反而会扼杀灵感。
内部文化和价值观的一致性比一套成文的规章制度更为关键。领导者的示范作用、面对问题时的行为风格,会成为团队成员认知和模仿的准则,从而形成一种无形却强大的文化共识。
梁文锋指出,按照传统教科书上的方法论来管理创业公司往往行不通,因为创新型企业需要的是一种适应变化、快速响应市场和技术发展的能力,而不是死板的管理和规则。
对于技术团队而言,最激动人心的事情莫过于验证自己关于未来技术的猜想是否成立。当自己的假设被事实证明时,那种兴奋感无可替代,这也是推动科研人员不断前行的内在动力。
真正相信这一理念的人总会在一开始就加盟,不论是通过购买硬件资源(“批量买卡”)还是与云服务提供商签长期协议。这种早期的坚定支持是企业持续创新的重要保障。
创新往往伴随着高成本和资源的浪费,只有一个经济足够发达、企业能够承受短期亏损的环境下,这种颠覆性技术才有可能出现。正如OpenAI的历程一样,前期巨额投入是必要的。
有许多人,即使工作再累也愿意为开源项目贡献代码,这种“非功利”的精神或许无法用简单的逻辑解释,但正是这种情怀推动了整个社区和技术生态的繁荣。
并非每个人都能一直保持这种“疯狂”的状态,但大多数人在年轻时能够抛弃功利包袱,全心全意投入到对理想和技术的追求中,这是未来创新不可或缺的动力。
公司选择以几乎“贴成本”甚至只是略有盈利的价格提供大模型服务,这既是一种商业战略,也是为了让更多人能够接触和使用先进技术,从而形成一个更大的生态系统。
降低服务价格的主要出发点不是为了短期内抢占用户,而是体现在对技术普惠和长期生态建设的全局考虑上。同时,降价也反映了在技术架构优化后降低了成本。
如果目标只是快速推出应用,沿袭目前成功的结构(如Llama等)是可行的;但若追求AGI,就必须在现有模型基础上探索全新的结构和方法,从数据构造到模型设计,都需要突破传统思维。
在这波AI浪潮中,他们的出发点不是为了赚取暴利,而是要站在技术前沿,推动整个生态的发展。只有走在最前沿,才能真正对全球技术趋势产生影响,而非充其量只做“应用搬运工”。
过去中国在IT浪潮中多依赖于采用和改进西方技术,而现在,需要转变为技术的原创者和贡献者。这样的转变不仅能提高国家的技术话语权,还能带来更持久的竞争优势。
梁文锋指出,目前大部分中国公司习惯于“跟风”而非自主创新,这种模式在全球竞争中难以长久保持领先地位。只有打破这种惯性,积极探索原创,才能突破技术瓶颈。
尽管中国在整体经济和企业利润上非常有实力,但在真正的高端技术创新上,缺乏的往往不是资金,而是信心和如何高效组织人才开展创新的体系。
历史上,过于追求商业利润导致对基础创新的忽视。当时代的重心逐渐转向硬核创新,曾经“赚快钱”的模式可能会被淘汰,转而由真正具有长远战略眼光的团队引领未来。
在颠覆性技术面前,闭源策略的护城河往往是短暂的,因为技术进步和跨团队合作可以迅速破解封闭壁垒。相比之下,把技术积累沉淀在团队和企业文化中更具持久性。
开源和发表论文不仅不会损失竞争优势,反而能为技术人员带来荣誉,同时吸引更多志同道合的人加入。这是一种文化行为,体现了对技术共享和进步的认同。
美国最赚钱的科技公司往往都有长期的技术积淀和研发投入,这种厚积薄发的方式决定了后期市场的巨大回报。耐心积累和持续投入是实现颠覆性技术突破的必经之路。
从整体水平上看,中国AI与美国的差距在于原创技术的缺失。只有摆脱模仿和跟随,深入挖掘自身的创新能力,中国才能进入真正意义上的技术领导者行列。
以英伟达为例,其领先不仅归功于单个企业的努力,而是得益于整个西方技术社区和产业链的协作。中国要想在AI领域崛起,也需要建立起一个完善的、信息共享和技术互助的生态系统。
团队选择不走闭源路线,强调构建一个由强大技术生态支持的未来。开放不仅能吸纳更多伙伴,更能促使整个行业在竞争中共同进步。
梁文锋表示,他们目前没有急迫的融资需求,阻碍发展的主要问题在于高端芯片及相关设备受国际形势和禁运政策的制约,而非资金短缺。这表明他们已经具备较强的资本实力,真正的挑战在于硬件生态。
更多的资金投入并非必然带来更多的创新。大厂虽然有大量资源,但往往因业务需求和管理惯性而难以实现颠覆性创新。真正的科研探索需要的是灵活、专注的实验环境,而非单纯的资本堆砌。
当前阶段的重点在于基础技术和模型结构的创新,而不是应用爆发。构建一个由基础模型供应者和各类应用开发者组成的完整生态系统,将使整个产业链更加稳定和高效,从而推动AGI的长期实现。
虽然如果市场需求迫切,他们也有能力开发应用,但始终将基础研究和技术创新放在首位。只有在核心技术达到一定高度之后,再考虑基于此构建各类应用,才能确保不丧失创新本质。
即使某项技术从理论上可以轻易复制(如英伟达的显卡设计),要想在实践中重组团队、整合资源并赶上下一代技术,所需时间和投入是巨大的。护城河往往体现在这种重置成本上,而非单一的技术秘密。
提供云服务或API只是目前技术成熟的一种应用方式,但他们的最终目标是实现AGI。这表明他们关注的焦点始终是如何让人工智能跨越当前的应用瓶颈,迈向更高水平的通用智能。
大型企业虽然拥有庞大的用户群体,但成熟的业务模式和现金流同时也会成为创新的包袱。这样一来,它们在面对革命性技术变化时,反而可能因为内在惯性而失去领先优势。
在众多参与大模型浪潮的创业公司中,能脱颖而出的仅有少数(可能只有2到3家)。这种竞争格局要求公司必须有明确定位、精细化运营和清晰的战略规划,而不是盲目跟风烧钱。
梁文锋强调,衡量技术和商业模式成功与否的重要标准,应是它能否提高整个社会的运行效率,以及在产业链中找到自己擅长和独特的位置。最终,只要能提升全局效率,哪怕中间经历多个阶段性的波动,终局也会证明其存在价值。
从发布的V2模型可以看出,他们主要依靠的是本土团队,这不仅显示出国内技术实力的提升,也表明在没有依赖海外人才的情况下,同样可以打造出顶级模型,增强自主可控能力。
公司采用的是自下而上的协作模式,强调自然分工和团队内部的自由讨论。当一个想法被认为有潜力时,会自发地调动资源集中攻关。这种模式能激发员工的主动性和创造力,而非由上而下的指令驱动。
团队鼓励每个成员在遇到问题或者有新想法时,随时调用集群计算资源(“卡”)和专家支持,不设限、不审批。这种开放、无壁垒的资源共享模式,有助于快速推进研究进程和解决困难。
在招聘和团队建设中,热爱和对领域的好奇心始终是最重要的标准。这不仅让团队充满年轻创新的活力,也使得每个成员都有各自独到的经历,共同形成丰富多样的创意碰撞。
硅谷之所以能成为全球创新的策源地,很大原因在于那里的从业者敢于挑战现状、迎接风险。国内的创新氛围相对保守,因此提倡“敢”的精神,鼓励年轻人放下功利包袱,勇于追求世界上最难的问题。
正如“解决世界上最难的事”能够吸引更多顶级人才加盟一样,只有不断追求挑战极限,解决真正难题的公司,才能获得那些拥有突破性思维和能力的人才。
梁文锋提醒大家,OpenAI虽然目前处在领先位置,但并非永恒。面对不断涌现的新技术与新思路,任何一个领头羊都无法保证持续领先。市场和技术竞争是动态的。
对于AGI何时能实现,梁文锋持开放态度,可能2年、5年或10年,总之是在有生之年见证。他们在研究中同时押注三条方向:数学与代码(封闭、可验证系统)、多模态(与真实世界交互)以及自然语言本身,各条路线相辅相成,互为探索路径。
未来将会涌现出一批专门提供基础模型和基础服务的公司,形成从技术研发到应用落地的长链条分工。这样一来,产业协同效应会不断增强,整体生态会更加完善、稳定。
创始人的主要精力仍然放在前沿大模型的研究上,许多问题还悬而未决。对这些问题的深入探索,正是他们持续保持技术领先和创新的关键所在。
过去的商业套路和互联网逻辑不一定适用于未来的AI时代。用老一代的商业模式去评估新技术,就像在不合时宜的情境下解释全新的现象一样,可能会出现刻舟求剑的误区。
尽管外界只能看到近几年“幻方”的成果,但实际上团队经过16年的积累才有了今日突破。耐心积累与长期投入往往是颠覆性成果背后的隐形资本。
随着中国经济的发展和成熟,未来的产业升级将越来越依赖于硬核技术的突破。很多曾经依赖时代运气赚快钱的企业,终将被真正推动社会效率的技术所取代。
当前社会对硬核创新难以完全理解,部分原因在于整体群体习惯于短期利益。然而,随着一批又一批实实在在的硬核创新者功成名就,整个社会的认知和价值取向都会随之转变,逐步形成对基础创新的广泛认可和支持。
总结
总体来看,梁文锋的这60条思考既是一种对技术发展方向的战略性把脉,也是一种对企业文化、人才理念和市场竞争逻辑的深刻反思。从追求AGI这一终极目标出发,他和团队对大模型研究、技术开放、生态建设、人才培养和创新精神都有着清晰而坚定的认识。这样的思考不仅指明了公司未来发展的道路,也为整个行业提供了一种新的视角,鼓励更多人从长远和全局出发看待技术革命与社会进步。
下面将每一条原文内容与之前的详细解释一一对应罗列,供参考:
原文:
我们做大模型,跟量化和金融都没有直接关系。我们要做的是通用人工智能,也就是AGI。
解释:
梁文锋强调,他们的目标并不在于拓展金融、量化等狭窄领域应用,而是瞄准通用人工智能(AGI)。这种区分表明,他们追求的不是“应用快速落地”的商业模式,而是一个更开放、长远的目标:赋予人工智能类似人类多方面、通用的认知能力。
原文:
语言大模型是通往AGI的必经之路,并且初步具备了AGI的特征,所以我们从这里开始。
解释:
这里强调语言作为人类思维与交流的载体,成为迈向AGI的重要桥梁。通过研究语言大模型,不仅能够模拟人类语言处理,而且可以观察到初步的类人智能特征,进而为实现真正的AGI打下基础。
原文:
我们不会过早设计基于模型的一些应用,会专注在大模型上。从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。我们的目标很明确,就是不做垂类和应用,而是做研究,做探索。
解释:
这一条强调公司选择专注于大模型的基础研究,而非一开始就追求各类衍生应用。未来随着技术成熟和应用门槛降低,更多创业团队都能利用大模型构建产品。这种战略体现了对长远技术趋势和生态开放的信心。
原文:
我们理解人类智能的本质就是语言,人的思维就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。
解释:
这里提出“语言中心论”,认为人类思维和智能本质上依赖于语言。假如人工智能能够真正理解和生成语言,那么模型有望模拟人类的思维过程,进而更接近AGI的表现。
原文:
只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。
解释:
梁文锋指出,简单复刻现有模型成本较低,但要进行原创研究则需要耗费更多的时间、算力及人才精力。真正突破需要大量实验、数据对比和创新,因此成本和风险也明显上升。
原文:
我们希望更多人,哪怕一个小App都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。大厂的模型,可能会和他们的平台或生态捆绑,而我们是完全自由的。
解释:
公司倡导大模型技术的普惠性,希望打破大厂垄断,让更多初创公司和小型应用以低成本接入先进模型。这种开放思路有助于打破平台壁垒,推动整个生态的发展和多样化创新。
原文:
从商业角度来讲,基础研究是投入回报比很低的。我们比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。
解释:
尽管从短期商业角度看,基础研究回报低,但他们认为既然有足够的能力和热情投入到此项艰难的技术攻关中,就具备成为领先者的潜力。这里表现出对长远发展和技术前沿的坚定信念。
原文:
从最早的1张卡,到2015年的100张卡、2019年的1000张卡,再到一万张,这个过程是逐步发生的。很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动,对AI能力边界的好奇。
解释:
这条强调算力积累是渐进的,背后驱动力主要是技术团队对AI能力边界的好奇和探索,而非单纯的商业逻辑。算力的逐步扩充正见证了从懵懂到成熟的科研历程。
原文:
对很多行外人来说,ChatGPT这波浪潮冲击特别大;但对行内人来说,2012年AlexNet带来的冲击已经引领一个新的时代。AlexNet的错误率远低于当时其他模型,复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的,特别是当2020年OpenAI发布GPT3后,方向很清楚,需要大量算力。那之后,我们有意识地去部署尽可能多的算力。
解释:
这段文字对比了大众和业内对不同节点技术浪潮的感受。虽然ChatGPT近期火爆,但业内早已因AlexNet和GPT-3的成功意识到,算力、数据和模型三者的结合才是推动AI进步的核心驱动因素。团队因此提前布局,持续加大算力投入。
原文:
一件激动人心的事,不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。
解释:
梁文锋用买钢琴的比喻说明:有时技术创新的意义和价值远超过金钱本身,它能够激发团队的热情和创造力。真正令人激动的是技术本身带来的无限可能,而不仅仅是商业利润。
原文:
人工成本是对未来的投资,是公司最大的资产。我们选的人相对朴实一点,有好奇心,来我们这里有机会去做研究。大厂很难单纯去做研究,做训练,它更多会是业务需求驱动。如果不能很快应用,大厂不一定能持续坚持,因为它更需要看到结果。
解释:
公司认为人才是最重要的资源,选择那些充满好奇心和热情,愿意为未来前沿研究投入的人才。而大厂则因业务驱动更注重短期效益,这在某种程度上限制了纯科研活动的发展。
原文:
我们招人有条原则是,看能力,而不是看经验。如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性与热爱等更重要。
解释:
梁文锋强调在创新领域中,固有的工作经验有时会成为束缚。相比之下,具备良好能力、创新意识和热情的新人往往能够带来全新的思考和方法,因此团队更看重潜力而非单纯的经验。
原文:
我们的核心技术岗位,基本以应届和毕业一两年的人为主。做一件事,有经验的人会不假思索告诉你,应该这样做,但没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。
解释:
核心岗位由年轻人担当,有助于打破传统思维模式。缺乏经验反而使他们更开放,更愿意不断试验和探索,从而更容易发现创新的解决方案。
原文:
我们招人的条件是热爱,这些人的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。
解释:
招聘时看重的是对领域的热情和真诚的兴趣。这种内驱力促使人才积极主动地参与到前沿研究中,也使得优秀的人才更愿意加入和长期留在这样一个充满创新氛围的团队里。
原文:
我们的考核标准和一般公司不太一样。我们没有KPI,也没有所谓的任务。
解释:
为了鼓励自由探索与创新,团队摒弃了传统的KPI考核方式。没有固定任务和外部压力,研究人员可以更专注于真正在意的问题,减少因指标产生的不必要束缚。
原文:
创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。我们交给员工重要的事,并且不干预他。让他自己想办法,自己发挥。
解释:
梁文锋主张减少高层对创新过程的过度干预,从而保证团队成员拥有充足的自由度,鼓励他们通过试错不断探索。这种宽松的管理风格有助于激发内在创造力和自发性的灵感迸发。
原文:
招人时确保价值观一致,然后通过企业文化来确保步调一致。当然,我们并没有一个成文的企业文化,因为所有成文的东西,又会阻碍创新。更多时候,是管理者的以身示范,遇到一件事,你如何做决策,会成为一种准则。
解释:
这里强调,企业在招聘时注重价值观的共鸣比成文规章更重要。真正的企业文化往往来源于管理者的榜样作用和实际决策,而不是刻板文字,这种文化能够在关键时刻形成无形的团队凝聚力。
原文:
按照教科书的方法论来推导创业公司,在当下,他们做的事,都是活不下来的。但市场是变化的,真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。很多大公司的组织结构已经不能快速响应和快速做事,而且他们很容易让之前的经验和惯性成为束缚,而这波AI新浪潮之下,一定会有一批新公司诞生。
解释:
梁文锋指出传统的管理框架在快速变化的技术环境中显得僵化。创业公司需要具备敏捷应变和持续调整的能力,而不是依赖现成方法论。大公司的经验和惯性反而会阻碍它们迅速抓住新机遇,而新兴公司则可能凭借灵活性取得突破。
原文:
最让我们兴奋的是去搞清我们的猜想是不是事实,如果是对的,就会很兴奋了。
解释:
对科研人员而言,验证自己关于技术和未来趋势的猜想并将其证明为事实,其激动和满足感远超金钱收益。这种好奇心和探索精神正是推动不断创新的重要内在动力。
原文:
信仰者会之前就在这里,之后也在这里。他们更会去批量买卡,或者跟云厂商签长协议,而不是短期去租。
解释:
这条说明那些真正相信并看好该领域前景的人,会提前布局并长期投入资源,例如一次性购入大量计算卡或签订长期云服务协议,从而为技术研发奠定坚实的资源基础和信心支持。
原文:
创新是昂贵且低效的,有时候伴随着浪费。所以经济发展到一定程度之后,才能够出现创新。很穷的时候,或者不是创新驱动的行业,成本和效率非常关键。OpenAI也是烧了很多钱才出来的。
解释:
梁文锋指出,在一个经济体量较小或者资源有限的环境中,高风险和高成本的创新往往难以实现。只有当社会整体发展到一定水平,企业才能承受前期颠覆性创新所需的大量投入和可能的浪费,正如OpenAI的早期阶段一样。
原文:
这个世界存在很多无法用逻辑解释的事,就像很多程序员,也是开源社区的疯狂贡献者,一天很累了,还要去贡献代码。类似你徒步50公里,整个身体是瘫掉的,但精神很满足。
解释:
在这里,作者用程序员对开源的热情比喻了那种即使身心疲惫也依然坚持贡献的精神。这种不完全依赖逻辑和外部回报的投入体现了对技术与社区认同的情怀,反映出科研人员内心对纯粹创造的追求。
原文:
不是所有人都能疯狂一辈子,但大部分人,在他年轻的那些年,可以完全没有功利目的,投入地去做一件事。
解释:
这条强调年轻时那种无功利、全情投入的状态是难能可贵的。虽然并非所有人都能持续这种“疯狂”,但在年轻时敢于舍弃短期利益专心做科研,是推动突破性创新的重要动力。
原文:
我们的大模型服务降价只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利,在成本之上稍微有点利润。
解释:
定价策略上,团队采取的是基于实际成本核算,同时保证一种可持续但低盈利模式的策略。这既保证了技术普惠性,也体现了他们不追求暴利、而是希望通过量的普及最终推动生态整体发展的理念。
原文:
抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。
解释:
降价并非为了激烈竞争抢占市场,而是出于技术演进所带来的成本下降及推动技术普惠化的理念。团队坚信,未来无论是作为API服务还是其他形态,AI产品都应当让更多人轻松享用。
原文:
如果目标是做应用,那沿用Llama结构,短平快上产品也是合理选择。但我们的目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。
解释:
这一条明确区分了“快速应用”与“基础研究”。如果仅为应用,沿用成熟的模型架构即可;而为了实现AGI,他们必须突破现有结构限制,进行全方位的基础研究,如数据构造和模型人性化设计,从而打造真正领先的大模型技术。
原文:
最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。
解释:
梁文锋强调,他们的目标是走在技术前沿,推动整个全球技术生态的发展,而不是利用现有技术赚取短期暴利。这种战略既表明了对国际创新浪潮的参与,也体现了由应用变现向基础技术创新转型的决心。
原文:
随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。
解释:
这一条呼吁中国在经济与技术上的转型,从过去的追随者逐步转变为技术创新的主动贡献者。过去凭借摩尔定律带来的硬件改善,实际上忽略了背后长久的技术沉淀和原创精神,未来需要更多地参与到科技前沿的原创创新中。
原文:
大部分中国公司习惯follow,而不是创新。
解释:
梁文锋直言,多数中国企业在商业和技术上倾向于追随已有模式,而缺乏原创性。这种跟风模式可能在短期内有效,但在长期全球竞争中难以保持领先优势,因而必须转向自主创新。
原文:
创新的成本肯定不低,过去那种拿来主义的惯例和过去的国情有关。但现在,无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。
解释:
尽管中国在经济和企业利润上有足够实力,但在高端原创技术方面,问题在于如何建立一种能高效组织和激励人才进行创新的机制,而非简单的资金不足。缺乏信心和有效的创新机制是当前面临的重要挑战。
原文:
过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。
解释:
这条反思了过去中国企业过于注重商业利益、忽视技术创新的现状。梁文锋认为真正的创新不仅依赖利润驱动,更需要天生的好奇心和创造力,而这种追求或许随着时代进步会逐步成为主流。
原文:
在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,这就是我们的护城河。
解释:
梁文锋认为,单纯依靠闭源策略构建的技术壁垒在面对颠覆性进步时往往只是暂时的。真正持久的核心竞争力在于团队的积累、经验和组织文化,这种“软实力”能够支持长期、持续的创新。
原文:
开源,发论文,并没有失去什么。对于技术人员来说,被follow是很有成就感的事。开源更像一个文化行为,而非商业行为。给予是一种额外的荣誉,一个公司这么做也会有文化的吸引力。
解释:
开源和发表论文不仅可以增强科研人员的成就感,同时也有助于建立开放、共享的技术文化。这种做法虽然不是直接的商业竞争手段,但能吸引更多志同道合的人才和资源,为整个生态注入活力。
原文:
美国最赚钱的公司,都是厚积薄发的高科技公司。
解释:
梁文锋指出,美国那些市值巨大的高科技企业,都是经过长期沉淀与持续研发的结果,体现了“厚积薄发”的战略思路。这种模式说明深厚的技术积累和前瞻的研发投入最终会转化为显著的商业成功。
原文:
中国AI和美国真实的gap是原创和模仿的差距。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。
解释:
这里明确指出,中国在AI领域与美国最根本的差距在于原创能力与模仿能力的悬殊。唯有真正转向原创性研究,才能打破长期处于追随者的局面,迎来根本性的技术改变。
原文:
英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
解释:
英伟达的成功归功于一个成熟且协作良好的技术生态,这种集体智慧和信息共享让他们始终处于领先。中国要在AI领域赶超,亟需建立一个类似的开放生态和技术社区,而不仅仅依赖单个公司的努力。
原文:
我们不会闭源,我们认为先有一个强大的技术生态更重要。
解释:
团队选择开放策略,强调构建广泛的技术生态比闭源更重要。开放不仅能促进技术交流,还能吸引更多优秀的人才和合作伙伴,共同推动整个行业进步。
原文:
我们短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。
解释:
梁文锋表示当前公司的资金情况充裕,限制发展的真正瓶颈是国际形势下高端芯片和关键硬件的供应问题,而非资金短缺,这表明他们战略重心在技术和生态构建上。
原文:
更多的投入并不一定产生更多的创新,否则大厂可以把所有的创新包揽了。
解释:
该观点认为,单纯加大投入并非必然能带来颠覆性创新。大企业可能因管理惯性和业务压力而难以实现真正的科研突破,创新更多需要方法、环境和组织的灵活性,而不仅仅是资金堆积。
原文:
我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek的基础上构建toB、toC的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。
解释:
团队认为现阶段应聚焦于技术和模型的创新,而非短期内追求应用的多元化。未来通过构建基础技术生态,其他企业可在此基础上开发各类应用,形成完整的产业链,这样既能发挥各自优势,也减少了自己开发应用的必要性。
原文:
如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。
解释:
虽然团队有能力开发应用,但核心精力仍放在基础研究上。应用开发可以作为辅助,但技术领先和创新永远是他们战略的首要目标。
原文:
技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。
解释:
即便单项技术可以被模仿,重新构建团队、积累经验、赶上技术前沿的成本和时间却构成了实际的壁垒。换句话说,护城河不仅来自技术本身,更来自于团队协作和长期技术沉淀。
原文:
提供云服务不是我们的主要目标,我们的目标是去实现AGI。
解释:
虽然提供云服务或API是当前技术商业化的一种方式,但团队的终极目标——实现AGI——才是他们所有工作的出发点和归宿,表明他们在目标定位上的长远视野。
原文:
大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。
解释:
尽管大厂拥有庞大的用户基础和稳定现金流,但这些优势同时也会成为负担,使得它们在面对颠覆性技术时,因过度依赖现行业务模式而难以转型,从而给新技术公司留下超车的机会。
原文:
大模型创业公司可能活下来2到3家。现在都还处在烧钱阶段,那些自我定位清晰、更能精细化运营的,更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。
解释:
在激烈竞争和高耗资的环境下,只有少数自我认知清楚、战略明确且运营精细的创业公司能最终存活。即使部分公司会走向转型,真正有价值的创新技术最终会以不同形式持续存在。
原文:
我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。
解释:
这里强调技术或商业模式的价值,应以其是否能整体提升社会运作效率为最终衡量标准。虽然中间可能经历多次调整和波动,但只要能提升整体效率,就证明其长期存在的合理性。
原文:
我们发布的V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但我们能自己打造这样的人。
解释:
这条表明团队在人才构建上实现了自主化和本土化,证明即使部分顶尖人才可能不在国内,但通过培养和挖掘本土人才也能打造顶级模型,这提升了技术自主性与安全性。
原文:
DeepSeek也全是自下而上的。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。
解释:
团队采用自下而上的协作模式,鼓励成员自然分工、自由讨论,并在某个想法被证明有前景时迅速整合资源,从而兼顾了自发创新与组织协调的平衡。
原文:
我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批,同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。
解释:
此条表达了资源和人员调动上的极高自由度,打破了传统公司中层级审批和部门壁垒,鼓励团队成员在遇到问题或看到机会时,能够迅速借调算力和人力以推动创新和问题解决。
原文:
我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。
解释:
团队在招聘时侧重于热情与好奇心,这不仅能够使团队保持年轻和活力,也能吸引那些愿意为了研究和探索而不计较短期利益的人,从而形成独特且富有创意的团队文化。
原文:
创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信,这种信心通常在年轻人身上更明显。
解释:
此处指出,真正创新需要强大的信念和勇气。国内在面对前沿创新时常显得畏缩,而硅谷的成功在于那份敢于挑战极限的自信。年轻人往往更能展现这种自信,从而推动真正突破。
原文:
我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们是有吸引力的。
解释:
通过攻克世界难题的雄心壮志,团队吸引那些追求突破、勇于挑战的顶尖人才。虽然国内存在对顶尖人才的低估,但解决艰难问题正是这些人才展示才华和实现自我价值的最佳平台。
原文:
OpenAI不是神,不可能一直冲在前面。
解释:
梁文锋提醒业界,虽然OpenAI目前处于领先地位,但技术和市场环境不断变化,任何一个领先者都无法永久保持优势。技术竞争是动态的,新技术和新理念始终会不断涌现。
原文:
AGI可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向:一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。
解释:
关于AGI实现的时间,团队持开放但乐观态度,认为有生之年有可能实现。内部关注的三个方向既包括数学与代码这种封闭试验场,也包括融合真实世界信息的多模态系统,以及专注于自然语言本身,每个方向都为AGI探索提供不同视角和可能性。
原文:
未来会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。
解释:
梁文锋预见未来将形成一个以基础模型公司为核心,上游提供技术、下游开发各类应用的长链条产业生态。这种专业分工将让许多公司各展其长,共同满足社会多元化需求。
原文:
我主要的精力在研究下一代的大模型,还有很多未解决的问题。
解释:
创始人明确表态,自己的主要关注点依然是下一代大模型的前沿问题,针对那些当前未解之谜进行持续探索,这也是保持技术领先的重要保障。
原文:
所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样,很可能是一种刻舟求剑。
解释:
这一条提醒人们:过去的商业逻辑未必适用于未来AI时代。用老套的互联网或传统工业逻辑去解读未来的AI盈利模式,可能会导致对新技术潜力和市场形态的错误判断。未来需要更具前瞻性和灵活性的思考。
原文:
我们经历了一个漫长的积累过程,外部看到的是幻方2015年后的部分,但其实我们做了16年。
解释:
团队历经长期的沉淀和技术积累,虽然外界只见其近期成果,实际上整个研发过程跨越了16年。这种持续努力和长期投入正是今天取得突破的重要基础。
原文:
未来中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。
解释:
随着经济与产业转型,未来中国将越来越依赖硬核技术和根本性创新,这也会促使社会从追逐短期利益转向长线的技术驱动,推动整个国家产业升级和竞争力提升。
原文:
未来硬核创新会越来越多,现在还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变,我们只是还需要一堆事实和一个过程。
解释:
最后一条强调,当前社会对硬核创新的理解还不够深入,但随着越来越多事实和成功案例的出现,大众的观念将逐步转变,真正依靠硬核技术的创新者最终会改变整个生态的思维模式和价值取向。