申真谞的统治力解析:AI时代围棋技术进阶与棋手品性典范

申真谞的统治力解析:AI时代围棋技术进阶与棋手品性典范

本文旨在对申真谞(Shin Jinseo)在农心杯上取得跨赛季16连胜的现象级表现进行深入分析,探讨其围棋技术领先的本质,特别是与人工智能(AI)训练方法的关联,并结合其棋手品性,阐述其成为现代围棋世界第一的深层原因。文章将采纳专业、严谨的结构化论述方式。


一、 核心论点:申真谞的统治力源于“判断力”的AI驱动升级

申真谞的统治力并非简单源于AI普及带来的“水平拉平”,而是得益于他对AI训练方法的深度掌握,使其在现代围棋技术结构中的核心要素——**“判断力”(Value Network的理解与应用)**上实现了对同代棋手的代际领先。这种领先,结合其展现出的“闇然而日章”的品性与责任感,确立了其无可争议的世界第一地位。


二、 技术层面分析:围棋技术三要素与申真谞的风格演变

2.1 AI普及与“水平拉平”论的证伪

部分观点认为AI的出现拉近了棋手间的差距,因为所有顶尖棋手都使用AI进行训练。然而,申真谞接近90%的年化胜率和连续终结三国擂台赛的统治力,有力地驳斥了这一论调。AI的平等性体现在训练资源的平等获取,而非训练效果的必然均等。AI对棋手的更高要求在于:能否将AI提供的海量信息转化为自身能力的有效提升。

2.2 申真谞的风格演变:从战斗到控盘

申真谞早期以强悍的战斗风格著称,但常因“行棋过刚”导致优势下的崩溃。AI时代后,其风格转变为极端的控盘流

控盘流的本质与优势:
控盘流旨在通过精确的局面判断,将棋局导向高容错率、低波动性的平滑状态,使对手“有力无处使”,避免进入人类计算能力易出错的复杂战局。这保证了其极高的胜率稳定度。

与李昌镐的对比:
前一代控盘大师李昌镐的巅峰优势在于其对局面的“判断力”,而非单纯的官子精度。当对手的判断力提升到与其相近的水平时,控盘流的效率降低,需要通过战斗解决问题,导致其统治力随之波动。申真谞的控盘优势,正是基于比同时代棋手更优越的判断力。

2.3 围棋技术结构的理论框架:棋感、计算与判断

借鉴作者提出的围棋技术三要素(对应AlphaGo的算法结构),可以更清晰地定位申真谞的领先点:

2.3.1 棋感(直觉/Policy Network):经验的积累与学习的第一阶段

棋感涉及定式、局部形状的优劣感知等。学习AI的棋感是AI时代的第一阶段:通过熟悉AI下法来更新定式记忆和中盘直觉。所有职业棋手都在进行此项工作,这是提高的必要基础,但非决定性因素。申真谞完成了这一基础积累,形成更新后的布局棋感

2.3.2 计算(Search):人类能力的边界

计算能力受限于人脑的容量和效能。AI在计算深度上远超人类,但人类棋手在计算力的绝对上限上提升空间极小,且个体差异与AI无关。因此,指望在计算上超越对手是困难的。

2.3.3 判断力(Value Network):申真谞的核心优势

判断力是评估某一局面(而非局部变化)的全局价值和倾向,是人机对决中人类最薄弱的环节。AI的Value Network(VN)能够直接估值,而人类必须通过逻辑和经验的综合认知来逼近这种估值。

判断力的领先体现:
在“地”与“势”的转换等复杂局面中,人类的传统认知方法容易产生失准的判断。申真谞通过AI训练,极大地提升了其对全局价值的量化评估能力,使得他能够在对手尚未察觉时,就预判到局面的细微走向,从而提前布局、锁定胜势,实现“控盘”。

2.4 AI训练的阶段性差异与申真谞的“高级班”

大多数棋手仍停留在“学习新定式”(积累棋感)的初级阶段。申真谞显然已进入了利用AI进行专项“判断力”训练的高级阶段。这种训练着重于:

  1. 经验累积法(当前主流): 针对AI估值差异大的局面进行重复分析和实战模拟,修正旧有的经验判断。
  2. 逻辑方法(未来可能): 总结出更精确、更具普遍性的“棋理”,取代过去模糊或错误的经验法则。

申真谞的统治力证明,他已系统性地掌握了利用AI工具提升判断力的有效路径,使他的局面预判能力超越了当前绝大多数顶尖棋手,从而使其控盘型下法达到前所未有的统治高度。


三、 追赶与超越的路径:针对性训练的必要性

要挑战申真谞的地位,必须采取双重策略:

  1. 短期挑战策略: 针对其控盘流的“弱点”——导入复杂战斗。正如近年战胜他的棋手所采取的策略,尽可能打乱棋局的平稳性,迫使申真谞进入多分支计算的复杂局面,增加其判断失误的概率。
  2. 长期追赶策略: 借鉴并超越申真谞在判断力训练上的领先地位。这要求一线棋手和后备人才必须将判断力训练提升至日常训练的核心地位,并探索基于AI辅助的系统性逻辑推理训练方法。

四、 品性层面:君子之道“闇然而日章”的体现

围棋大师的品性与棋艺的相通性,曾因现代围棋的功利化而受到质疑。申真谞的经历,特别是他展现出的内在修养,为挽回这一信念提供了积极的范例。

4.1 对围棋的敬畏与谦卑

申真谞对AI的理解展现了高度的谦逊和求索精神:

“Bluespot(蓝圈圈)是AI向人类推荐的,赢棋概率最高的一手棋。但是之上,分明有什么东西。”
“现在我更注重一盘棋的过程……我对围棋有了敬畏之心。”

这种认知表明,他并未将AI视为终极答案,而是将其视为揭示围棋“更深奥艺术”的催化剂。他探寻的是**“真实”之外的“意义”**,这与吴清源大师推崇的“闇然而日章”——内在德性光芒日益彰显的君子之道高度契合。他不是被动接受AI,而是主动利用AI来拓展人类认知。

4.2 困境中的品格坚守

申真谞的成长并非一帆风顺,他经历了低谷、嘲讽,乃至无端污蔑。其可贵之处在于:

  • 保持气度: 在遭受不公待遇时,仍能保持棋士应有的品格和风范。
  • 责任感与承担: 他不仅背负着竞技取胜的压力,更肩负着维护棋士形象和为行业树立榜样的责任。这种责任感在某些时刻可能转化为负担,但在农心杯的传奇表现中,他证明了自己能够完全承担并超越这种期待。

4.3 行业共同体责任感

申真谞在特殊历史时期(如新冠疫情初期)的捐助行为,体现了其对围棋行业共同体和社会的深层责任感。

  • 回馈社会: 围棋作为非生产性行业,其社会合法性根基在于对人类精神与思维边界的探索,以及对社会的回馈。申真谞的行为,与前辈如李昌镐、李世石在公共事件中的表现一同,强化了棋手作为文化代表的正面形象。
  • 榜样力量: 对于学棋的年轻一代而言,申真谞的“棋艺”和“人品”共同构成了强大的正向激励,使“棋如其人”的信念得以稳固。

五、 结论:统治力、AI认知与棋士精神的统一

申真谞的现阶段统治地位,是其**技术突破(判断力的大幅提升)品性修养(对围棋的深刻敬畏和责任感)**共同作用的结果。

他的技术领先核心在于:通过深度AI训练,实现了对“判断力”这一围棋技术瓶颈的有效突破,从而将控盘流的稳定性发挥到极致。

他的棋士精神典范在于:面对AI带来的知识革命,他没有陷入迷失,而是以谦卑的姿态深入探寻,将技术进步与君子品德相结合,真正践行了“闇然而日章”的境界。

在围棋界,申真谞已然成为一个里程碑式的存在,标志着人类在AI时代下,通过更高阶的认知和更坚定的品格,得以继续攀登竞技与艺术的顶峰。

李喆:申真谞赢在哪里? 写在农心杯之后

2024年2月24日 下午6:10:00 • 新闻 • 阅读 8,439
2024年02月24日 新浪体育综合
  文章来源:喆理围棋

  申真谞在农心杯取得跨赛季的16连胜,超越当年李昌镐14连胜的传奇纪录,作为主将凭一己之力击败所有中国队参赛棋手,连续四届终结三国擂台赛,再次证明了他是当前毫无争议的围棋世界第一。

  在这里,我想谈谈对申真谞的印象,包括他的棋艺和品性。棋艺方面,主要想谈谈小申的棋究竟领先在什么地方,尤其是从AI训练的方法以及围棋技术领域的理论层面进行简要分析,这部分基于知识理论的分析或许能够对我们的一线棋手乃至年轻新秀们有所助益。之所以在棋艺之外也想谈谈品性,是因为仍有许多人相信棋如其人,相信绝顶高手的人品风范一定与棋艺相通,这两者几乎不可分割——这种信念在前些年实际上遭到了严重的质疑,不仅有来自社会的疑问(人们在问:棋下得好与电竞打得好有什么区别吗?),许多棋手自身也都对此产生怀疑(也包括学棋的小孩和家长们),但幸运的是,申真谞似乎至少暂时挽回了这种信念。

  很多棋手都喜欢用吴清源大师的折扇,最常见的题字是“闇然而日章”,大家或许更多是出于对吴清源卓越成就的钦佩,没认真考虑过吴清源大师为什么题这五个字在扇子上。“闇然而日章”出自《中庸》:“君子之道,闇然而日章;小人之道,的然而日亡”,“闇”在这里的意思与“暗”相通,这句话的意思大致是说,君子锦绣谨藏于中,初看闇然无光彩,而其德性光明是日益彰显出来;小人则相反,日夕用心于外,一心炫耀不知内省,徇物欲而忘返,初看表面光鲜,而其内在空洞,“暴于外而无实以继之”,于是日渐衰亡。吴清源大师晚年畅想21世纪的围棋,提出围棋乃“中和”之道,推崇《中庸》,将“闇然而日章”题于扇面传世,显然传达了他的人生理念和围棋观。

  申真谞,这位出生于21世纪第一年的棋手,在攀登棋艺高峰的路途中,展现出“闇然而日章”的君子之道,逐渐成为一名大棋士的同时,也成为未来许多学棋小孩心中的榜样——对于整个棋界来说,这都是幸事一件。

  首先,申真谞现象级的统治力至少证明了一个说法的谬误。围棋AI普及之后,曾有一种论调说AI拉近了棋手之间的水平差距,大家都跟AI学,所以水平都差不多了。如今申真谞连年接近90%胜率、几乎比肩当年李昌镐统治力的成绩显然证伪了这个说法。很明显,并非大家都学AI就会达到相近的水平。尤其我们国内的棋手们,不要再被这个说法欺骗了,AI的确带来了巨大的平等,但这平等主要是训练条件的平等(在大家都有强AI用作日常训练之后),而不是训练效果的平等。AI的出现实际上对棋手的能力提出了更高的要求,这一点需要一线棋手和致力于竞技的小棋手们认真对待,这也是我主要想谈的部分。

  几无争议的是申真谞达到了目前为止人类围棋的最高水平(当然,人类围棋的水平整体上是不断提升的,未来无疑会出现层级更高的棋手)。那么,申真谞是如何达到这个高度的?在攀登棋艺高峰的过程中,他经历过什么低谷与困境?他的技术主要领先在哪里?

  很多人都注意到了,申真谞近年的对局一改当年的战斗型风格,变成了控盘流,农心杯的一串六,除了最后面对中国队主将辜梓豪的一局有过一段比较大的波澜(证明小申也有足以导致败局的明显失误),其它五局都是从头控到尾,让对手毫无胜机。

  这里我想先提出一个简单的论点:在现代围棋的职业竞技中,统治力最强的棋手极大概率会是控盘型棋手。这是一个通俗的说法,之后我会用围棋技术领域的理论来解释为什么这么说。

  当然小申的战斗力或者说计算力是很强的,当年他刚刚走进世界赛场,就是典型的战斗风格,而他那段时期的输棋很多都是优势之下行棋过刚而折(还记得首届新奥杯八强战,我和申真谞同场竞技,抽签仪式上我很想对上他,因为他是当时八强里唯一的非中国队选手,而且如此年轻。那时我已多年不训练、偶尔参赛,逐渐退出一线,而小申算得上初出茅庐)。

  围棋AI出来之后,小申通过向AI学习,逐渐弥补了他的短板,风格变化为控盘型,胜率也达到了罕见的惊人高度。

  其实围棋里各种“风格”的说法是可为趣谈而不那么精确的。所谓“控盘型”,无非是指常常在不怎么发生激烈战斗的情况下通向胜利,让对手有力无处使,这种风格能避免复杂计算中人类难免的波动,使局面平滑而有容错率,由此保持极高胜率,但是并非所有“控盘型”棋手都能达到那样的高度。上一位控盘型的高峰当然就是李昌镐,大李的巅峰期就是那种看上去平平无奇,却能把对手控制得找不到机会的下法。如今用AI来重新分析,李昌镐最强的地方还不是官子,而是局面的判断,很多当年被认为是李昌镐官子逆转的棋局,其实并非逆转,而是大李更准确地判断出了他实际占优的结果,对手和观众则误判了局面(至于怎么做到的,以后有机会再展开来谈)。而在李昌镐职业生涯的末期,之所以他一度被认为变换了风格,变成有些靠近“战斗型”,是因为在他的影响下,年轻棋手们的判断力和胜负感也都逐渐增强了,当判断能力没有显著差距时,控盘流就很难轻易得手,而常常需要战斗(双方前景不明的多头绪计算)来解决问题,到了那个阶段,他的胜率和统治力就下滑了(那也是我在国家队参与集体研究二李的时期)。

  也就是说,控盘的关键是“判断力”。这里我要提出一个论点:如今申真谞领先最多的部分,就是“判断”的能力,而这显然是他用AI训练来提升的。

  职业棋手们常说:“判断是围棋里最难的”,那么判断到底是指什么,为什么最难,又怎样提升呢?限于篇幅这里也只能简单谈一下,以后有机会再展开全面论述。

  在编《中英围棋术语辞典》的时候,我发现围棋里的很多术语并没有严谨的定义,而不严谨的术语无法导向严谨无误的知识。在说到围棋技术领域的时候,“中盘能力”这类词的指涉就比较缺乏清晰性,而“判断”的概念是比较清晰的。

  七年前,我在“AlphaGo——未来的围棋”这篇文章里第一次提出围棋技术的三要素:棋感(直觉)、计算和判断(这三者恰好对应着AlphaGo的算法结构),人类下棋的能力与技术可以全部涵盖在这三个概念的框架之下。去年我写了一篇论文“围棋的知识结构分析”,在论文的主题之外,文末顺带提到人类棋手通过使用AI学习,在这三个方面分别能带来多少进步及进步空间,结论是:在棋感方面会以累积经验的方式持续进步,在计算方面进步空间极小,而在判断方面则有很大的进步空间,并且未来还有产生理论化的可能。

  所有定式的记忆,都可归于棋感一类。在围棋上学习AI的第一阶段,就是学AI的棋感,也就是多看AI的下法,产生相同或相近局面下的比原先更好的局面印象,而围棋的布局阶段最容易出现“相同或相近局面”,因此也是棋感部分最容易学到的,俗称“背定式”(不那么准确)。这个阶段,人类棋手重新学习定式,成为职业高手必备的功课,但这并不是全部的学习。布局下法之外,中盘转换的棋感、局部好坏形状的棋感、厚薄关系和何时脱先的棋感等等,都有更新的空间。这部分的训练是以经验累积为主,见得多了就认识了,当然从见得多到真正认识,也需要对不认识的、看不懂的下法进行仔细的理解分析,才能真正地转化为自己的棋感。

  有些棋手和棋迷误以为这就是跟AI学习的全部,由此认为有AI之后围棋下得好就靠背谱,这是显然错误且很容易传播的具有误导性的观点。淘汰旧定式,学习AI新定式,也就是形成布局的新棋感,这只是棋手们在AI时代提高棋艺的第一步,或者说第一阶段而已。

  在计算方面,AI的确帮不了我们太多忙,人类棋手的计算能力受限于人类大脑的容量和效能,或者说人的有限性,在不做脑机接口的情况下,人类下棋的计算能力整体上是没有多少提升空间的,个体差异则仍然存在且与AI无关。

  问题的关键就是“判断”。实际上,在当年人机对决的过程中,我们就已经可以完全理解人类棋手和AI最大的差距就在“判断”领域(反而不是“计算”)。为什么是AI教我们下“点三三”,难道人类算不出点三三的基本变化?当然不是,而是对于地势转换的局面,人类棋手从前的判断是失准的。如果展开来讲,就是在地与势转换的时候,人类所使用的两种认知方法(“逻辑”与“经验”)所做出的判断的精确度差别较大,导致了判断失准(而地与地对决的时候判断就不会偏离太多,因为使用的是同一套判断的认知方法)。

  围棋中的判断能力(对应AlphaGo的Value Network这部分),是人类可以通过向AI学习来提升的,这部分人类差AI很多,并且远没有达到人类能力的极限,因此有很大的提升空间。

  AI的VN给出的是胜率,人类当然无法像AI那样直接将局面转化为胜率估值,因此人类还是需要用人类自身的认知方法来获得提升。人类的认知方法不外乎逻辑与经验,在棋感方面的提升,主要依靠的是经验的累积;而判断方面的提升,则是两者都有发挥作用的空间了。

  人类棋手如今可以针对“判断”来进行专项训练,有AI这么好的辅助工具,这类训练应该成为最重要的日常训练方式之一。当然,由于一些高手的AI训练方法仍是保密的,具体怎么练,这里也不好谈论太多,只是有必要先从围棋的知识结构上把理论说清楚:为什么专门练习判断力是可行且高效的。

  用AI来训练自己的局面判断能力,最简单的是用经验累积的方法,也是目前最容易制定的训练方案。未来可能出现的逻辑的方法,则将依托于新的思维概念,用通俗的话来说就是总结出更好的、更有效的棋理(淘汰掉以往一些错误或不精确的棋理观念),当然这大概不是短期能实现的。也就是从理论上来说,在目前的阶段,制订一些专门训练判断能力的训练方案,以累积局面判断的正确经验为主要目标,对于仍有志于一线的棋手而言,是十分重要且可行的。这方面,很可能申真谞已经走在了前面,大部分棋手们都还处在向AI学习的第一阶段:积累棋感(还有一些厌学的),而小申同学已经进入了高级班。

  申真谞面对众多同样是在每天认真训练的高手,能够发挥出控盘流的优势,主要就是因为他的判断能力已经强出了至少一档,而在进入复杂战斗的局面时,他的胜率就会显著下降了(近年战胜过小申的棋手跟我说他的策略就是想方设法与小申战斗)。这里的原理如果用AI的胜率波动来说,所谓控盘流,就是使局面维持在有许多个选点出入不大、都能保持胜率领先的状态,此时的失误也不会突然导致败局;而所谓复杂战斗(或无论别的什么名字)的一个特点是,在计算分支较多的情况下,又要求几乎每一步棋都精确,一步失误就可能胜率跳崖。现代棋手们从小都是苦练计算的死活题大师,在计算力方面是很难有人超出别人太多的,因此战斗型棋手固然可能达到非常高的水准,但稳定度会低于控盘型,这是棋艺原理与人类的能力限度所决定的。当然换个角度来说,如果大家的判断能力都接近了,那么复杂战斗就成为了分胜负的主要方式(参考AI对决),此时所谓控盘型就不存在了,也就没有统治力极强的棋手了。

  总结一下,申真谞现在超高的胜率依赖于他的控盘式下法,而这种下法之所以能获得巨大成功,是因为他的判断能力在众高手中显著领先(就像当年李昌镐一样,能在对手还觉得形势难分优劣的时候预判出某些变化图一方已经领先),判断能力的大幅提升使他避免了早期长时间处于战斗中容易被逆转突然崩溃的情况,而判断力的提升与使用AI训练的方法有非常大的关系。也就是说,目前要想击败小申,概率最高的方法是导入复杂战斗;而要想在棋力上追赶小申,就需要找到新的训练方法通过AI辅助来提升判断能力。

  小申能通过AI学到更高的水平,或许在理论上不是完全自觉的,但与他对围棋AI的理解认知与感受,相信有很深的关联。

  让我印象很深的是2021年申真谞接受采访谈论对围棋AI的看法,迄今我仍认为这是面对AI时代人类棋手最有意味的回应。

  申真谞说:“Bluespot(蓝圈圈)是AI向人类推荐的,赢棋概率最高的一手棋。但是之上,分明有什么东西。”

  “我最近终于领悟了胜负不是围棋的一切。现在我更注重一盘棋的过程。对局前我的状态是否足够集中于一盘棋?对局中我有没有下轻率的一手棋?局面有利时,我有没有自满?局面不利时,我有没有早早放弃了?出现了失误时,我有没有努力扳转局面?总之,我对围棋有了敬畏之心。”(参见访谈——申真谞:AI让人类跳出藩篱,追求更深奥的围棋艺术)

  我将这段话放在武大围棋课第二学期第一节课的PPT上,用来展示一种人类对待AI的真正积极的态度(不只是围棋)。

  AI所呈现出的“棋局的真实”,呼唤着棋手去不断找寻新的理解和语言,这种找寻需要谦卑的理智作为德性基础,而自大者将会陷入矛盾和茫然。到这里,棋与人的关系开始显露。

  之所以说申真谞体现了“闇然而日章”的君子之道,一部分是因为他并非早早就锋芒毕露站在顶峰接受膜拜,而是经历了很长一段时期的低谷,甚至在艰难攀登和追赶的路途中被对手多次嘲讽,被命运之神的滑标捉弄到面壁落泪,被无端的污蔑气得睡不着觉,却始终保持了一名棋士的品格和气度,不得不还击时还能保持不卑不亢的腔调。从纯竞技的功利角度来说,小申最大的弱点或许是责任感太强,他显然不止肩负着取胜夺冠乃至打破纪录的责任,还肩负着维护棋士形象、为行业树立榜样的责任,这些责任感在比赛中有时会化为重担,使他难以在决赛中进入无我的澄明之境,又无法完全抛开所有责任感去只考虑赢这一件事。当然,农心杯上的传奇表现,证明如今申真谞已经能够完全担起这些责任,证明并非放弃责任才能没有负担地去赢。

  那年小申被无端污蔑时,我过于生气,拉黑了一些跟风污蔑他的棋友,并通过韩国的朋友告诉小申,中国棋手里也有很多反对无端污蔑,维护棋士荣誉的朋友。这么做是不希望集体的公开沉默带来误解。之前韩国棋界的戴安娜事件,我通过金承俊老师向戴安娜女士表达了来自中国棋手的支持,也是出于同样的想法。出于各种各样的原因和理由,我们为公正所做的太少了,这对于被涂污的人们来说是很糟糕的,至少我们也应跟随内心去表达支持,即便与他们所受到的伤害相比是微不足道的。

  2020年新冠疫情爆发时,家人在医院一线工作,我留在武汉遭遇封城,深感自身的无力无用,于是提议发起了围棋界对灾区的捐助,意外的是很快收到了来自韩国的捐赠请求,第一位提出捐赠武汉灾区的韩国棋手就是当时还不满二十岁的申真谞,后来又有李昌镐和崔精,他们每人捐出了1000万韩元来支援武汉抗疫(同时,捐赠在国内棋界也得到大量支持,但也引起了“拒绝道德绑架”的言论)。这让我想起2008年汶川大地震,李世石和赵汉乘在亚洲杯决赛前就共同决定捐出全部奖金,那届亚洲杯我输给赵汉乘半目,当时多么希望能和他们一起完成善举啊,在这样的时刻和事件中,我才能感到我们身处同一个行业共同体,而好的榜样对于更年轻的从业者们相当重要。棋手这个职业,本就不生产任何社会经济生活所需求的用品,却得到了不少物质奖励和一些社会关注,如果棋手们既不去探求人类精神与思维的界限,又不懂得回馈社会而只知无度索取,不屑于关注弱者而只知成王败寇,那么这个职业存在的合法性根基很快就会松动了。

  好在有申真谞这样的棋手啊。无论是棋艺、对棋和AI的理解、对围棋的态度,还是棋品人品、对行业的认知与责任感、对棋道的传承,申真谞都堪为棋界表率,未满二十四岁的他已经渐渐展现出什么叫做“君子之道,闇然而日章”。