2025 年 10 月 15 日

Sora2掀桌后,中国AI视频进入全方位混战

【来源:虎嗅网】

本文来自微信公众号:亿邦动力 (ID:iebrun),作者:胡镤心

过去一周,Sam Altman在各种经典影视剧中“跑龙套”,比如偷宫崎骏画稿被抓,到化身猫娘撒娇卖萌,再到金字塔前热舞……这一系列热门视频都来自Sora2。

事实上,Sora APP在上线不到5天时间,下载量破100万次,增速超ChatGPT。

一石激起千层浪。Sora不仅将“音画同步”和“物理模拟”推向了技术竞赛的新高地,更在全球范围内点燃了一场关于“谁是下一个Sora2”的终极追问。从马斯克的xAI到谷歌、阿里,从字节的“即梦”到快手的“可灵”,都在面对并回答这个问题。

▎AI版抖音,还是AI版朋友圈?

“Sora APP不是工具,而是一个新的社交网络。”在过去一周,这一结论已经被科技圈接受。

只不过有人认为Sora APP是“AI版抖音”,因为其支持文本提示词生成10秒视频,并同步生成和画面精准匹配的环境音效和对话。如果是中文关键词,Sora 2输出的同样是中文视频。应用内集成了从“灵感浏览-一键创作-分享互动”的完整流程,像刷抖音一样刷AI视频,重塑了内容分发逻辑。

有博主生成不同品种的小猫在卖场里偷了鱼后仓皇逃窜,店主则在身后紧追不舍、高声呼喊的画面。近7天内在TikTok上播放量超2.1亿,获赞超1200万。

有人认为Sora APP是“AI版朋友圈”,因为新推的社交玩法(Cameo功能,即“客串”),可以复制你的样貌和音色,将你的形象放置在任何AI场景中。Remix功能,则可以将你的形象丝滑融入他人作品,进行无限裂变。

比如和Sam Altman一起摆造型,和自己的朋友一起畅想50年后一起打游戏、一起看演唱会、一起在养老院里的样子。

这种建立在熟人关系上的AI玩法,不仅体验超预期,也适合基于社交关系进行裂变传播。

Lovart创始人陈冕认为,Sora APP真正开启了AI的ToC应用时代,也激发了“AI社交”的想象空间,承载着OpenAI消费互联网的野心。

▎大厂齐发力:音画同步成AI视频竞争新高地

Sora所在的视频赛道,一直是大厂的必争之地。虽然目前还没有出现能与Sora 2完全对等的产品,但全球第一梯队的视频模型已经在特定功能或应用场景上展现了不俗的实力。

在模型侧,Sora 2的音画同步和物理正确是核心亮点。目前具备该功能的模型有GAGA-1、通义万相WAN2.5、谷歌Veo 3。

5月,谷歌发布Veo 3,具备和画面同步的对话、音效,实现精准的音画同步。目前面向美国Ultra订阅用户开放,适合专业创作场景。

9月,阿里云在云栖大会发布通义万相WAN2.5,一句话出1080P电影,音画精准同步。

10月,Sand.Ai团队开发GAGA-1,支持通过上传图片和文本生成包含自然表情、动作和配音的视频,可实现音画同步。目前免费使用,无需邀请码,适合短剧、互动影游等场景。

Sora2发布后,马斯克的xAI快速推出Imagine v0.9,以20秒内快速生成、全用户免费开放的优势予以回应;生数科技计划月底上线Vidu Q2参考生功能。

其他模型,如9月25日上线的可灵2.5 Turbo和豆包视频生成模型Seedance1.0侧重多种运镜和物理真实;腾讯在世界模型领域卷生卷死,HunyuanWorld-Voyager支持超长漫游并将视频直接导出为3D格式;PixVerseV5则在9月迈过1亿用户大关,商业化方面订阅已经收入覆盖成本,正准备摩拳擦掌大干一场。

▎谁能成为“下一个Sora2”?

从目前的竞争格局来看,谁是“中国版Sora 2”可能不会只有一个答案,更可能在不同路径上产生领导者。

以Vidu、可灵为代表的技术模型派,深耕模型的核心能力,力求在视频一致性、物理规律模拟等基础能力上对标甚至超越国际标杆,但挑战在于如何将技术能力转化为有活力的用户生态。

以即梦、Seeddance为代表的产品生态派,拥有庞大流量入口和创作者生态。

以GAGA围代表的创业公司,不追求大而全,而是在“人物对话演出”等特定细分领域做到极致,凭借在垂直领域的不可替代性,同样能获得稳固的用户群。

而Sora APP开启的“AI社交”赛道,更成为大厂必争之地。

陈冕预测,第一款对标Sora APP的产品可能一个月内就会出现。我们拭目以待。