如何评价影视飓风在凌晨发布视频《改变视频行业的AI,快来了》?

首先,Tim 说不是广告,那就不是广告。影视飓风的广告都是大大方方地说自己「一拍即合」。所以我们可以认为,Tim 在这个视频里表达的观点是真实的。

其次,为了让没有看视频的人尽快了解发生了什么,我让豆包做了个总结。

豆包帮我总结了三点:

技术层面,Tim 认可 Seedance 2.0 的颠覆性突破,包括运镜、分镜、音画同步,生产力逼近影视级制作水准;

风险层面,模型居然能根据 Tim 的人脸匹配到他本身的声音,能通过建筑正面图生成背面场景。有点恐怖;

行业层面,Tim 认为即便这个版本还不完美,但下个版本,很有可能就会彻底颠覆现有视频创作体系。

我还给了豆包一个定量的题目:

「如果评价分数从1-10分,你觉得他会给Seedance打几分?如果情绪分数从-1到1分,-1为否定,1分为肯定,你觉得他的情绪分数是几分?」

答案我们到最后再揭晓。

其实在影视飓风发这个视频之前,我在的几个 AI 群已经讨论了两天了。结论可能有点暴:Seedance 2.0 的出现,标志着中国 AI 应用第一次在某个关键的功能性赛道上,实现了对全球竞争者的领先。

这种领先不是指某个跑分数据,也不是某个单一维度的技术演示,而是指在「视频创作工作流」这个场景下,Seedance 2.0 率先从一个「素材生成器」进化成了一个「短片创作者」。

领先的不仅是画质,而且是「工作流」

真快啊,转眼 Sora 出来都两年了,现在视频生成模型已经不稀奇了。它们生成的画面越来越真,物理模拟越来越准,支持的时长也在变长,功能也逐渐丰富。

但这些模型本质上依然在解决「生成一段可用的素材」的问题。换句话说,它们是不错的摄影师,但不是合格的导演。

导演需要做的,不仅是单个镜头的效果,而是多个镜头之间的衔接、叙事的节奏以及声音画面的协调配合。

这也是 Tim 在视频里所说的,为什么之前的视频模型,都离不开后期剪辑师。

Seedance 2.0 真正让人感到震惊的,恰恰是解决了这一个痛点,或者说,让我们看到了可能性。

比如「多镜头叙事」,用户可以给出一个核心剧情,模型会拆解成多个连续镜头,并保持角色、风格和光影的一致性。同时,它支持文本、图像、视频、音频四种模态的输入,一次最多可以上传12个参考文件。

比如,从这个视频:

00:15

到这个视频:

00:15

该内容由AI生成

再比如「音视频融合生成」,Seedance 2.0 通过 DB-DiT,同时处理视频和音频,并在中间层进行融合,实现原生的音画同步。

00:10

该内容由AI生成

这就解决了以往「先出画面再配音」导致的口型对不上、情绪不匹配的问题。

一个能稳定输出可用成片的工具,其商业价值和对行业工作流的改造能力,远大于一个只能偶尔生成惊艳片段的玩具。

当海外的玩家纷纷在社交媒体求邀请码的时候,说明中国的大模型产品,第一次在功能性和实用性上,抢占了话语权高地。

公共数据的训练问题

模型是好用的,但 Tim 也把行业中的灰色问题推到了公众面前:训练数据。

实际上,使用公开可访问的数据进行模型训练,是目前全世界所有大模型公司的通用做法。更不用说盗版数据和侵权数据,国外的 OpenAI、Anthropic、Meta,哪个都是一脑门子官司。

之前美国法院裁定过一次 Anthropic 使用盗版书训练模型的案子,法官的结论是,即便使用盗版书的数据训练,也依然构成「合理使用」,最后以「下载并保存盗版书」的名义把 Anthropic 罚了。

在美国,行业内的共识是,当文字数据用完之后,最后一块可用的最宝贵的训练数据,就是 YouTube 视频。

我们完全可以合理推测,谷歌已经在大量使用 YouTube 视频的图像、音频和语音转文字数据训练模型了。

所以这次 Tim 遇到的问题,就是他在公开平台的视频、声音,被用作了训练数据。

这个问题并非 Seedance 独有。马斯克的 Grok 可以生成各种名人的肖像,Sora 和 Veo 同样被质疑训练数据中包含了大量受版权保护的电影、游戏和网红视频。

从训练数据的角度,这个问题无解。AI 需要尽可能多地进行学习数据,见得越多越好。

未来的解决办法,一是输出侧的护栏限制,二是用户的自律。

在输出侧,可以通过护栏屏蔽掉一些欺诈行为,或者要求授权,否则不予生成真实的名人肖像;在用户侧,平台则需要用最醒目的方式提醒用户法律义务,告知深度合成的风险。

而Seedance 2.0 目前虽然处于内测阶段,但字节方面反应很快,经过目前的舆论,已经进行了一系列防范措施,现在只有在进行活体认证的情况下可以生成真人视频,不支持输入真人图片/视频做主体参考等,为的就是防止AI技术被滥用的可能。

小结

最后,揭晓我们在开篇留下的问题的答案,豆包给出的量化打分是:

其实我觉得评价 9 分有点高了,倒不是说 Seedance 2.0 不够强,还是要留点进步空间的。

不过情绪分数的 0.6,我觉得还蛮合理的。

因为怎么说呢,Tim 在这个视频里给我的感觉,就是「兴奋中带一点恐惧」,而且更多是兴奋,恐惧的部分并不会让他完全拒绝 AI 工具。相反,作为影视博主,他和团队是受到冲击最大,也是必须拥抱使用 AI 的。

这种复杂的情绪,恰恰是我们每个人面对飞速发展的 AI 技术时最真实的写照。

Seedance 2.0 既是奇点,也是警钟。它让我们看到了中国 AI 应用登顶的可能性,也让我们前所未有地直面技术背后深刻的数据和伦理挑战。

如何握好这把双刃剑,决定了我们能用它开创一个怎样的未来。