如何评价 DeepMind 公司?
DeepMind 公司评价:野心、成就与文化
DeepMind 的自我认知与宏大目标
DeepMind 被定位为全球最大的 AI 研究机构,其核心驱动力源自对“智能”的深度探索,并以**“推动科学发展、造福人类”(Advancing Science and Humanity)为使命。公司由一群顶尖科学家、工程师和伦理学家组成,展现出极强的野心,专注于长期、高难度的研究项目,即使短期内看不到直接商业回报。其终极目标是实现通用人工智能 (AGI)**,或者如一些观察者更精确地解读为“人类升级”(Humanity Upgrade),旨在超越现有智能范畴。
DeepMind 的运作模式类似于一个烧钱但极具前瞻性的基础科学研究所,其巨额投入主要用于支持前沿研究,而非追求短期盈利。尽管其研发开支巨大,但通过与母公司 Alphabet 旗下其他部门(如Google)的合作,利用其研究成果赋能内部产品(如Google地图估时、安卓省电算法),在2020年实现了首次盈利,结束了长期亏损状态。
核心技术路线与“野心”的体现
DeepMind 的研究策略倾向于解决具有极端复杂性和明确目标函数的问题,尤其擅长构建和优化“直觉”模型,在超大规模的搜索空间内进行高效探索。
1. 强化学习 (RL) 与“奇点”的思考
DeepMind 早期通过 AlphaGo 项目展示了其在复杂组合搜索问题上的统治力。AlphaGo 战胜人类世界冠军,是通过模拟人类近三十年的训练量(RL 驱动的暴力搜索)实现的。这引发了对技术奇点 (Singularity) 的思考:即AI何时能实现自我代码编写和有目的的自我进化。作者认为,当前模型(如AlphaGo系列)本质上仍依赖大规模数据和算力的“暴力破解”(brute-force),与需要通过书籍和教学获取知识的类人学习系统仍有差距。
DeepMind 的技术迭代体现了其对突破瓶颈的持续追求:
- AlphaGo AlphaZero: 展现了从特定领域知识(人类对局数据)到完全自洽、自我学习系统的转变,目标函数明确(赢棋),搜索空间巨大(围棋)。
2. 跨领域应用与科学发现的融合
DeepMind 成功地将解决复杂搜索和模式识别问题的直觉构建能力,迁移到基础科学领域:
-
AlphaFold (蛋白质折叠): 这是一个困扰基础科学界50年的难题。DeepMind 发现蛋白质结构预测与围棋博弈在“阵型”和“结构”的直觉判断上存在异曲同工之处。
- 迭代与突破: 在AlphaFold取得初步成功后,团队果断决定大改架构,耗时一年推出性能超越前代的 AlphaFold 2,最终在2021年发布了包含人类所有已知蛋白质结构的 AlphaFold DB 数据库,被公认为当前 AI 对基础科学做出的最大贡献之一。
- 技术深度: AlphaFold 2 结合了 Transformer 架构与早期 CNN 的经验,展现了 DeepMind 跨项目、跨技术栈的自我整合和迭代能力。
-
后续研究: 紧随 AlphaFold 的成功,DeepMind 迅速将研究拓展至基因表达预测(Enformer,旨在解读非编码 DNA 的98%),以及利用 AI 辅助解决数学问题(通过模式识别和记忆力增强),不断挑战科学前沿。
研究深度、广度与文化特质
DeepMind 的研究展示出惊人的深度与广度,其文化特点可以概括为:顶尖科研能力、强大的资源整合、黑客精神以及强烈的社会责任感。
1. 跨学科整合能力
DeepMind 的研究团队能够自行消化和解决项目中出现的跨学科难题。例如,AlphaFold 2 的成功并非横空出世,而是站在了如 Chris Sander 等前辈学者十余年研究的基础上,并通过其强大的工程和算力资源实现了突破。团队在研究中展现出强大的自我循环提升机制:如同 AlphaGo 与自己对弈,不同项目组的经验(如Transformer、CNN的结合)可以在内部循环印证和促进。
2. 对前人工作的尊重与贡献回馈
尽管 DeepMind 资金雄厚,但其研究并非完全脱离前人积累。收购并开源物理引擎 MuJoCo,以及其对 AlphaFold 基础研究的继承,体现了其“做好事留名”但更注重实际推进科学进展的务实态度。
3. 教育与社会回馈(“政治正确”)
DeepMind 将自己定位为一个科研机构而非纯粹的商业实体,高度重视教育和回馈社会:
- 人才培养: 在全球多所顶尖大学(如UCL, Cambridge, Alberta)设立 DeepMind Chair,并提供大量的公开课程、演讲资料和开源学习资源(如 YouTube 频道、Podcast)。
- 全球影响力: 组织并赞助了覆盖中东、东欧、东南亚、非洲、南美等地的机器学习暑期学校(如NASSMA, EEML, Deep Learning Indaba),致力于培养全球范围内的AI人才。
- 学术支持: 设立学术研究员奖学金项目(Fellowship Program),并特别关注弱势群体(如 Women in Machine Learning, Black in AI)。
4. 组织结构与治理挑战
DeepMind 虽然在文化上保持独立和自由的氛围,但其作为 Alphabet 旗下的子公司,与 Google 间存在行政和文化上的互动。
- 纯粹性: DeepMind 内部设有专门团队(DMG)负责科研成果转化,这使得核心研究团队能保持相对纯粹的研究导向。
- 法律风险: 尽管目标崇高,但 DeepMind 也面临实际的伦理和法律挑战,例如因被指控不当使用医疗数据而面临诉讼,这反映了在追求宏大目标时,AI 伦理和数据隐私的边界仍然模糊不清。
创始人与公司环境
创始人:
- Demis Hassabis: 具有跨界背景,从国际象棋高手到游戏公司创始人,再到认知神经科学博士,其跨学科思维和对复杂系统的兴趣是 DeepMind 的核心驱动力。
- Mustafa Suleyman: 早期便与 Hassabis 探讨“让世界变得更好”的议题,表明了公司在创立之初便具备强烈的社会责任感导向。
公司环境:
DeepMind 在伦敦的办公环境优越,年轻、自由的氛围浓厚,享有谷歌总部的资源(免费食宿、健身房),并靠近重要文化和交通枢纽(大英图书馆、多条地铁线)。这种环境为其吸引和留住顶尖人才提供了物质和文化上的保障。
总结
DeepMind 是一家以探索智能本质、推动基础科学为核心的超级研究机构。它以 AGI 为终极愿景,通过在围棋、蛋白质折叠等超复杂问题上展现出的卓越的模式识别、搜索优化和跨领域整合能力,持续地在高风险、高投入的研究领域制造颠覆性成果。同时,DeepMind 积极通过教育和开源贡献回馈学术界,塑造了其在 AI 领域中既顶尖又具人文关怀的复杂形象。它在科学上的巨大贡献与在资源消耗上的天文数字,共同定义了其在当前科技版图中的独特地位。
DeepMind 的自我认知
DeepMind,世界最大的 AI 研究机构,烧了很多钱,他们原话是都拿去打游戏了。整个公司非常有野心,因为有人又有钱,项目都是往大的搞,短期有没有用无所谓,终极目标是通用人工智能 (AGI);作为 OpenAI 创始人 Elon Musk 口中的 "top concern",他们对自己的描述非常精确了:「一群试图解析智慧、发展科学、造福人类的业界精英」
We're a team of scientists, engineers, ethicists and more, committed to solving intelligence, to advance science and benefit humanity.
「发展科学、造福人类」是我随手翻译的,顺口但不恰当,因为 friends with benefits 这种蝇头小利也可以叫 benefits,翻译成「回馈社会」都不过分,因为官方本意是谦虚、安抚吃瓜群众的。
原答案中,关于终极目标我写的其实不是 AGI 而是「人类升级」,因为 humanity 一般理解为人类但也可以理解为文明以及人生而为人的一种状态,根据我对 DeepMind 多年理解感觉这才是对其野心的正确措辞。
今天看 Demis 自己做的 PPT 实锤了:
Solving intelligence to advance science and humanity.
DeepMind 的野心
AlphaCode
正好昨天 AlphaCode 发布(创新什么的我先不评价,但 DeepMind 一如既往把事情做到极致)接触 AI 久一点的应该都听说过技术奇点 (singularity),身边很久没人提过了,读高中那阵应该是这个概念最火的时候。当时还有一部电影 Transcendence,台湾译名《全面进化》很恰当,刚刚复习了眼预告片还是全身鸡皮疙瘩:
In a short time, its analytic power will become greater than the collective intelligence of every person born in the history of the world. Some scientists refer to this as the Singularity. I call it Transcendence.
个人理解是当一个 AI 能给自己有目的性地写代码实现自我进化的时候,就是奇点了。但其实 AlphaCode 离进化还有很大距离,因为目前没有一个模型可以真正意义上从书本获取知识,不然 AlphaGo 之类的模型就不用训练一千万场比赛这么多了——现在的模型其实某种意义上来讲还是 brute-force. 当然还有意识上传这条路,Elon Musk 有公司在做的脑机接口但离意识上传还很遥远。
总之,DeepMind 在仰望星空,看似对 transcendence 有想法,更严谨地说,DeepMind 对于技术奇点更像是 CERN 对于引力奇点:CERN 有可能不小心撞出黑洞;DeepMind 有可能「不小心」码出 AGI. 与此同时,他们也都脚踏实地地利用现有的知识疯狂推动科学进步。
AlphaGo
就算 AlphaGo 之父 David Silver 再坚持「AI = DL + RL」,我认为只靠数据疯狂 RL 而脱离模仿人类抽象能力的学习系统是带不来奇点的。当年 AlphaGo 打败围棋世界冠军就是靠着约等于人类三十年的不吃不喝疯狂下棋,倘若一个学习系统能像人类一样通过老师和书本获取知识,会是谁学得快一点呢?可能在不久的将来我们就会知道答案。
从 AlphaGo 到 AlphaZero 大家应该看出来了 DeepMind 擅长的这套方案解决的究竟是什么类型的问题:1. 首先要难,能 brute-force 的都不叫难,比如组合搜索空间如同围棋一样的叫难,围棋有 种组合, 这个数字比全宇宙原子多;2. 目标明确,能定义目标方程来优化;3. 数据要多
围棋手下棋都是凭直觉,难以像象棋等棋种的玩家那样说出个具体的前因后果,堪比玄学,而 DeepMind 最擅长的事就是构建直觉,在超大空间进行高效搜索。2016 年 AlphaGo 战胜李世乭,Demis 从韩国回来当天就启动了 AlphaFold 项目。
AlphaFold
蛋白质折叠这个50年未解之题,Demis 早年就心心念念要做了,竟然也是个能凭直觉求解的问题,围棋的阵型和蛋白质的结构居然异曲同工。
发现这种相似的 DeepMind 果断着手该问题开发 AlphaFold,果然在下一届每两年一度的 CASP 竞赛种大放异彩,让多年没什么进展的结构预测剧情反转。
此时就迎来了 DeepMind 最难的时刻,因为 AlphaFold 已经封神,优化到头了。
此时他们做了一个艰难的决定,大改架构,一切又从零开始,耗时一年,终于发现 AlphaFold 2 反超原版本。
后来 AlphaFold 全组一共磨刀五六年,终于2021联合 EMBL-EBI 公开了人类最全蛋白质数据库 AlphaFold DB,给基础科学研究做了贡献。
主流观点是 AlphaFold 乃目前 AI 对科学做出的最大贡献,但算法本身没有那么神,感兴趣可以看 AlphaFold 优点和不足,但他们持之以恒地挑战自己,所以希望我写的不足很快可以全部消失!
不论如何,大家对它的激情与赞誉本身值得我们这种投身生物界的人激动。
今天追星成功,获得 AlphaFold 之父 John Jumper 可爱合影!
不得不说 DeepMind 的研究深度广度都令人惊叹:AlphaFold 2 中 Transformer 的使用结合 AlphaFold CNN 的经验;最近发 ConvNeXt 对 CNN 固有 inductive bias 的正名也结合 Transformer 的各种经验,来回自我提高、面面俱到,像极了 AlphaGo 自己跟自己玩的训练模式。
研究里出现的难点疑点全都可以自行消化跨组解决,实名羡慕。
其他应用
刚公开数据库没多久,国庆 DeepMind 又发 Nature Methods,搞完蛋白质结构预测直接瞄准基因表达:人类编码蛋白质的基因只占 DNA 的2%,看来 DeepMind 准备把剩下98%的非编码 DNA 也纳入黑魔法范围 (解读 Enformer).
12月1日 DeepMind 又又登上 Nature 封面,通过「引导人类直觉」解决一些数学问题。答主在数学系挣扎的时候发现很多时候数学靠的完全是记忆力,而 AI 的有效记忆力是很可怕的,加上找 pattern 是 DeepMind 最擅长的事情之一,关于数学记忆力我看过这个非常有同感的答案。
再往前八月份还有眼科疾病的研究,往后年底有量子化学的研究,每天都在不停发论文,吃瓜的都赶不上种瓜人的进度了,到此为止。
教育与社会
DeepMind 是一个愿意、懂得并有能力回馈社会的公司,更像一个科研机构,重视推动科学发展与教育。比如 DeepMind 提供了很多公开课并且组织员工去大学教学,并已在三个大学已经设立 DeepMind Chair:Alberta, UCL, Cambridge.
Simon Osindero 上课的时候长这样
关于培养人才他们还做了很多:
DeepMind Learning Resources 官方学习资料主页
DeepMind YouTube channel 有很多演讲和网课 (点不开拉到文末),比如
伦敦大学学院 (UCL) 历年的高阶深度学习+强化学习网课,
以前在牛津大学也开过 NLP 的课好像没放上去 但这里有,
在 MIT 的 talk、TF dev summit 的 talk 等
还有有面向大众的 podcast
讲解 AlphaGO 系列视频
除此之外很多 DeepMind 员工在其他大学也有教职,比如
英国 UCL、牛津、剑桥、帝国;
北美 Alberta、McGill、MIT.
建立或管理了很多英美之外的组织/活动,比如
中东 North Africa and Middle East Summer School in Machine Learning (NASSMA)
东欧 Eastern European Machine Learning Summer School (EEML)
东南亚 Southeast Asia Machine Learning School(SEAMLS)
加拿大 AI4Good Summer Lab
非洲 Deep Learning Indaba
南美 Khipu AI
提供了平台并给年轻学者打钱:
DeepMind Academic Fellowship Program 目前 QMUL, UCL, Cambridge
DeepMind scholarship programme 奖学金项目目前很多学校
对领域内弱势群体相当关照:
关照技术界女性 Anita Borg Foundation,
机器学习界女性 Women in Machine Learning,
人工智能界黑人 Black in AI
网课在 Coursera、网易公开课、B站都有,建议大家搜最新的,或者看看官网课程链接,知乎也有很多资源贴都挺好的。顺便附上 DeepMind 开源的项目,全都在 GitHub:
dm_control: DeepMind Infrastructure for Physics-Based Simulation.
Sonnet: TensorFlow-based neural network library
Acme: a research framework for reinforcement learning
Haiku: Sonnet for JAX
AlphaFold: Predictions of protein structure
……
除了开源自家项目,这几天又收购并开源了物理引擎 MuJoCo,这个不仅自己的 dm_control 非常依赖,OpenAI 也在用。DeepMind 做好事留名,但好事是真做了。总之我还蛮喜欢 DeepMind,非常有黑客精神,科研顶尖且愿意砸钱在科学上、政治正确(可能不是好词)、文化自由,还回馈社会
其他知识碎片
创始人:DeepMind 创始人兼 CEO Demis Hassabis 本是象棋高手,高中毕业就 gap year 去游戏公司的斜杠青年,很难想象他有一个新加坡华裔母亲。
剑桥毕业又开游戏公司,所以在 UCL 认知神经科学博士毕业之后再开公司以专注 AI 打游戏为起点并不奇怪。
但另一创始人 Mustafa Suleyman, CBE 从小就认识 Demis 并且聊过让世界变得更好这种问题,虽然可能只是 媒体前的言论,但在全世界的监督下是会朝着造福人类的方向前进的。
谷歌/公司结构:DeepMind 和 Google 早已没有附属关系,团队之间的文化影响肯定有,但他俩都是 Alphabet 旗下行政自由的公司。
DeepMind 专门有 DeepMind for Google (DMG) team 进行科研成果转化,所以 DeepMind 整体是很纯粹的。
但 DeepMind 最近因不当使用160万病人的数据被法律公司 Mishcon de Reya 起诉,并不意外。
公司环境:公司年轻氛围自由真的没啥槽点,位置就在谷歌伦敦总部里,吃喝免费内置健身房,建好之前经常绕着它夜跑,走两步就到大英图书馆,楼下六条地铁线,火车直达巴黎爱丁堡……满满的都是回忆,唯一可能有争议的点就是KX太乱。但这都和我没关系,答主当年妖怪同学太多,AGI 就交给他们了。有想法的读者可以看下 DeepMind researchers 都是什么专业的?
AlphaFold 1&2:不是拍脑袋想出来的。
哈佛教授 Chris Sander 11年的论文 就做到基于 MSA 解蛋白质结构;再早些 UCL 教授 Dr David Jones 99年的论文 用双神经网络做这事给领域奠基了,他是 DeepMind 在 AF 开发早期的顾问,后来参与编写 DeepMind 的 AlphaFold 文章。
AlphaFold 站在了很多很多的前辈肩膀上烧钱,但 John Jumper 带领团队确实实现了很多精妙处理。
经费:DeepMind 钱哪来的?
简单地说亏了很久都是谷歌独自垫着,现在终于不亏了但100%的盈利还是谷歌等姐妹公司那来的。
通用人工智能 (AGI) 还早,为了 justify 自己存在的意义并且哄金主爸爸别哭,像谷歌地图驾车时间估算、安卓系统省电算法都有 DeepMind 的重大功劳。
Alphabet 2020年收入 (revenue) 达1825亿美刀,而这个较为不争气的孩子·一直以来每年就要亏几个亿美刀(多数人可能都忘了当年买 DeepMind 也就花了五六亿刀),终于2020年它盈利了,赚了不到一个亿,但问题是 DeepMind 的非主流盈利模式是产品都卖给姐妹公司,所以其实它作为科研部就是个烧钱的部,和做基础科学的研究所没有本质区别:人力物力投入极大,放眼科学发展,根本不在乎短期收益。