从打造陪聊爆款到重写游戏底层逻辑,百万用户AI团队押注“AI游戏2.0”
【来源:虎嗅网】
本文来自微信公众号:白鲸出海 (ID:baijingapp),作者:白鲸小编,编辑:殷观晓,原文标题:《从打造陪聊爆款到重写游戏底层逻辑,百万用户AI团队押注“AI游戏2.0”|对话一线》
对话嘉宾:元象“重生之我用AI做游戏工作室”的负责人小北
对话背景:在推出AI角色扮演出海应用「Saylo」后,元象团队将目光投向了AI游戏领域,尝试用大模型重构“无限剧情”的叙事体验。「昭阳传」是一款以皇帝题材为框架的AI文字冒险游戏,能实现多智能体决策与动态演绎。我们与其核心团队展开了对话,了解这款产品从技术到玩法的构建过程,以及他们如何看待AI在游戏中的落地与边界。
白鲸编辑部对元象的了解始于他们在2024年推出的AI角色扮演出海应用「Saylo」。
这款产品并没有赶上品类爆发的最佳红利期,却凭借自研模型和精细的创作者运营,在不到1年的时间内做到了300万全球用户,一度登上中国台湾、中国香港娱乐免费榜榜首。
这支团队的背景同样引发了我们的关注。元象成立于2021年初,创始人姚星曾任腾讯副总裁,主导组建腾讯人工智能实验室AI Lab,是围棋AI「绝艺」与王者荣耀AI「绝悟」等明星项目的负责人之一。团队成员大多拥有名校背景与大厂履历,元象本身是家AI技术公司,而「Saylo」的实践也验证了他们有能力将实验级AI技术真正落地为面向用户的产品。
在用「Saylo」探索“AI生成+UGC”的路径之后,元象近期官宣了他们的首款AI游戏产品「昭阳传」,尝试将AI从陪聊对象进一步推进为游戏世界中具备自主意识的参与者。
「昭阳传」来自元象旗下的工作室“重生之我用AI做游戏”,这是一款AI文字冒险类游戏,切入的是不少玩家相当熟悉的“皇帝题材”。游戏世界中,玩家机缘巧合穿越成为了昭阳国的太子萧景昭,不久后登基为帝,后续玩家将以皇帝的身份体验到争霸天下、治理国家、收集后宫等玩法。区别于传统游戏中玩家是对有限、既定游戏内容的体验,「昭阳传」中的所有角色都由AI智能体扮演,它们能实现自主决策,并根据决策的结果不断添加、修正记忆并指导后续行动,影响剧情的最终走向。这一设计期待突破固定叙事的框架,为玩家带来“无限可玩”的游戏体验。
「昭阳传」试玩版本已于近日登陆Steam
「昭阳传」近期在Steam上开放了试玩版本,而白鲸编辑部也有幸和元象“重生之我用AI做游戏工作室”的负责人小北进行交流,了解他们题材选择的缘由、「昭阳传」的AI决策系统是如何工作的以及从0-1打造一个从底层就植入AI的游戏,以下是对话全文:
AI团队转向PGC叙事,
用“皇帝题材”试水无限剧情
白鲸出海:元象之前做过「Saylo」(AI角色扮演应用),现在在做AI游戏「昭阳传」。你们怎么理解这两者的关系,是不是有连续性或者反思在其中?
小北:Saylo是一款主打UGC的互动内容消费平台,与目前在做的「昭阳传」更像是横向与纵向交叉的业务关系,Saylo主打UGC带来更丰富的互动小说、角色设定、世界观内容,通过大模型与多模态能力降低创作门槛,给用户增加内容的多样性与“广度”;「昭阳传」更像是在历史经验上的一款PGC作品,我们在世界观、主角人物、各方势力、国家间补充了大量基础文案内容,在世界故事线的发展上引入多套Agent流程去调动、编排各个角色,以及结合通用大模型和专用“小模型”服务,给玩家更加完整的故事体验和更强的沉浸感,希望可以在这类型游戏的“深度”上探索更多的有趣体验。
「Saylo」VS「昭阳传」
白鲸出海:团队是如何确定将“皇帝题材”的文字冒险作为AI游戏的落脚点的?体验提升体现在哪?
小北:文字冒险游戏类型的确定一开始就比较明确,因为目前AI技术最好的还是文字模型,以文字模型为核心基础,再将图像、语音、视频等元素有机嵌入,让文字世界“立”起来。
从题材选择上,让玩家成为“皇帝”也是我们的特殊设计。我们游戏核心是通过AI技术实现无限剧情,那么就需要一个能够承载高自由度的设定,而皇帝身份天然具备“高自由度”的优势。
皇帝身份,能够同时覆盖治国、权谋、社交、战争等多元叙事维度,为AI提供最大化发挥空间。玩家既能通过政令影响国家经济、外交等宏观走向,又能以私人身份与NPC建立情感羁绊。这种“上帝视角+第一人称沉浸”的复合体验,既能展示AI生成内容的广度(如朝堂权谋涌现),又能深化角色互动的细腻度(如后宫情感线),是传统RPG难以实现的叙事规模。
白鲸出海:市面上的AI游戏其实已经比较多了,「昭阳传」有什么特别之处吗?
小北:传统游戏的NPC行为是分支任务或者行为树等形式实现,但都是人工配置的,是枚举的,需要庞大的工作量。而「昭阳传」的AI决策底层,不受人工枚举配置预设的脚本限制,而是基于性格、记忆和环境实时生成动态决策,形成无限剧情分支。
以内容为核心的游戏往往因为结局可以遍历,所以难以持续玩多个周目,我们希望打造无限分支剧情的系统来支持玩家在每个周目中都有全新的内容体验,类似“命运石之门”这个IP的世界线一样的设定,当玩家所控制的“皇帝”每做出一个决策,其实都等于进入了一条新的世界线,这些决策也像蝴蝶扇起了翅膀,开始对世界中的每个角色开始产生影响。
再者,其他AI游戏目前多为单智能体决策或者只能进行AI对话交互,而我们的AI决策底层,是多智能体同时进行决策的,而且创新地引入“PM AI”协调数百角色诉求和解决矛盾,然后叠加“导演AI”自动生成符合世界观和角色人设的具体剧情大纲,最后通过“演绎AI”实现从决策到呈现的全链路智能化(对话、CG、音乐),而且每回合玩家的行为干预所带来的影响,都会反馈到AI决策流程中,每回合动态地生成下一个回合的剧情。
例如,某小国的亡国公主为了实现复国而有一套剧情,在推进过程中玩家作为皇帝可以帮助她或者阻碍她,甚至感化她将其收入后宫不再去复国。这些都是AI决策动态生成的剧情。
7成剧情由AI生成,如何把控质量和速度?
白鲸出海:「昭阳传」目前希望验证“AI演绎”的能力,能具体介绍一下你们对这个能力的理解吗?
小北:传统的文字冒险游戏无非是先有故事大纲,然后使用背景、音乐、音效、特效,角色表情和动态效果,旁白和对话等将脚本编排好然后呈现给玩家,是通过人工枚举配置预设脚本的方式实现的。
而在「昭阳传」中,我们通过“AI演绎”能力,只需将故事大纲告诉大模型,大模型则会帮我们完成脚本的编排。文字内容的旁白和角色对话是模型动态生成的,而其他的资源则分为3个层级来实现,最高层是多模态动态生成,例如某些剧情的CG图是通过AI生图来动态生成,中间层是资源调用,即大模型基于语境调用资源库的合适资源,最底层是文字补充描述,例如在角色对话中括号中的动作和神态的补充描述。
AI演绎突破了人工配置瓶颈,实时无限剧情可能性。就算是相同的大纲,AI演绎出来也会是不同的演出内容。另一方面,AI决策所生成的“实时”的“无限”的剧情,肯定是不能通过人手去配置的,只能也是通过AI来进行生成。所以AI演绎也是实现动态无限剧情的必然方式。
当然了,目前的“AI演绎”的能力还是有挺多还需完善的地方,但相信随着模型的效果和性能的提高,肯定能够越来越好。
白鲸出海:Demo的剧情表现中AI自主生成具体指的是什么?目前的呈现是否达到了最初的预期?
小北:首先,剧情的实现是兼容人工配置和AI演绎自主生成的,前者的优势是效果可控,而劣势就是需手动配置不能实时生成,而后者的优劣势则和前者刚好相反,优势是无需手动配置能够实现生成,而劣势则是效果不稳定有很大的随机性。
可以根据游戏剧情的重要性分别选用这两种方式,对于玩家刚进入游戏的第一幕【穿越苏醒】剧情我们采用人工配置的方式,因为给玩家的第一印象非常重要,肯定是要效果更可控和效果更高的,然后demo中的高潮和结尾这两个重要情节也是用人工配置。而其他的过渡和补充剧情基本上都是用AI演绎方式来实时生成,例如第二回合的【享受皇帝生活】剧情,这种剧情原本就可以有很大的弹性空间可供AI去发挥。
目前,算是达到最初的预期,我们的人工配置部分,仅仅是为了给游戏一个基础,即让玩家初步认识到这个世界。例如在上古卷轴5中,玩家在最开始必然会被推到断头台,然后一头龙毁掉了处刑,从而让玩家追随最初的线索对这个世界有一个最初的认识。但在那之后,玩家将自由在游戏世界中行动探索,而不再有约束,后续的剧情均来自于AI基于背景与人设的无限拓展。
白鲸出海:如何确保AI在日常剧情生成中的“自由发挥”不会稀释主线张力?
小北:在游戏剧情中,跌宕起伏的剧情,以及玩家的自由度,往往是不能两者兼得的,有些游戏会更注重玩家的自由探索,允许世界因为玩家的选择和行动发生大幅改变。相对的,也有一些游戏只有特定的一条或少数几条剧情线,并要求玩家像闯关一样,只能沿既定剧情线达成结局。
实际上,大部分传统视觉小说,都类似于后者,只是他们将闯关部分也大幅简化甚至完全省去了。但我们的游戏虽然属于视觉小说,但因为AI的使用,更倾向于对前者,即在自由度上提供更多的趣味性。在视觉小说这一品类中,这是AI+视觉小说所独有的长处,也是我们游戏的差异化竞争点。
而对于这种高自由度的游戏,我们不会设计任何主线,即没有什么事是要求玩家必须去完成的。虽然一些人物可能会带来一些有趣的故事,但那也仅仅是游戏中玩家可以选择去了解的一部分,而并非全部。
演绎录屏-加载相关
演绎录屏-表情切换
演绎录屏-资源调用
白鲸出海:大比例的AI演绎自主生成还可能会涉及到用户长时间等待的问题,如何解决?
小北:单次调用的推理时间受限于大模型底层能力,这个目前我们能够调控的空间不大,但趋势肯定是时间更短质量更好的。我们调控更多的是怎么多次调用。
目前Demo中看到的单幕剧情,我们也做过很多次的尝试,大致可分为两种,逐句输出和整幕输出。前者速度更快,但是前后文的连贯性和逻辑性受很大影响,后者速度相对慢点,但是质量更高。目前我们采用的是后者。
在整幕输出的基础上,我们又做了拆分,分为生成文本和调用资源两个模块,简单描述就是先生成整幕文本内容(包含角色对白和旁白),然后逐句进行调用资源的判断(使用什么背景,音乐,特效,角色表情等),呈现给玩家时,当整幕文本生成好且第一句的调用资源判断输出后,就马上推给玩家了,而后的逐句判断会在玩家看剧情过程中边看边输出,目前体验下来,只要玩家不是无脑狂点,而是会逐句看剧情,那么基本上逐句判断会提前完成,不影响体验过程。
另一方面,我们还做了其他优化,例如并行调用,例如多幕串联剧情会提前跑后面的推理,又例如我们会在AI决策中使用深度思考而AI演绎中不使用深度思考,而未来我们还会考虑为每种不同推理专门做对应的模型。推理时长太长会影响玩家体验,过短可能不好把控输出质量,这是需要更长时间去打磨和优化的,但我们团队有信心做得越来越好。
白鲸出海:我们现在用的都是自己的自研模型吗?不同的功能实现分别采用的是什么模型?
小北:是的,目前使用的模型都是我们自研的元象大模型。
具体来说,AI演绎(比如NPC对话、剧情生成)用的是我们MOE泛娱乐专用模型,这个模型的核心优势是能把文字逻辑、情感倾向和场景上下文结合起来——比如NPC说一句话,不仅要符合角色人设,还得带着对应的情绪张力,有记忆有温度,长上下文的记忆能力也是我们模型的优势所在。
AI决策方面,靠的是基于我们自研大模型的Agent模型,它擅长处理不同的角色动态逻辑,这些都不是固定脚本,而是模型实时计算的结果。
白鲸出海:游戏目前验证了玩家的哪些需求?未来的优化方向是什么?
小北:我们游戏主要满足玩家对高自由度剧情游戏的需求。目前市面上主流的Roguelike游戏普遍是重规则轻剧情,而重剧情的角色扮演游戏则是线性剧情或者有限的分支剧情,还没有一款真正意义上的重剧情的Roguelike游戏玩家对这块缺失的需求还是十分渴望的。
而自由度游戏的需求可拆分为三块,一是游戏中的角色是智能的自由的,抛开玩家他们就能够根据人设在世界中进行不同的冒险,另一个是游戏中玩家是自由的,能够根据自己的喜好进行选择,从而又影响其他角色和世界。这两者结合在一起,相辅相成,形成真正意义上的高自由度剧情故事。最后,高自由度的剧情需要转化成脚本演出呈现出来,而这个转化过程是实时生成的,也是高自由度的一部分,相同剧情每次看到的演出内容都是不一样的。
在我们游戏中玩家可以通过与各种npc的交互,提升自己,结交幕僚,搜集宝物,让自己不断变强,应对这些考验,并收获一个个独一无二的故事。例如喜欢谈恋爱的则可以去“收集后宫”,喜欢打仗的,可以去“天下争霸”,甚至喜欢修仙的可以去加入门派“修仙长生”。
目前Demo版本主要验证了玩家对第三部分的需求,即上文提到的AI演绎的内容。未来主要是将前两个部分完善优化,在游戏中跑通,实现出来一个完整的高自由度剧情游戏。
半年攻克多项技术难题,
「昭阳传」如何摸着石头过河?
白鲸出海:「昭阳传」开发周期有多长?
小北:开发周期,加上前期的立项和调研,到目前大约6个月。目前还是处于比较早期的阶段,我们完成了整体设定和基础“演绎AI”的效果,预计今年Q3-Q4会完成“PM AI”和“导演AI”的体验打磨,届时会有一些更有趣的体验展现在「昭阳传」中。
白鲸出海:当前的模型能力足够适配类似的剧情游戏吗?研发过程中的主要卡点是什么?
小北:当前的模型能力在不考虑算力成本和推理时间的前提下,是足够适配的。重点不在模型能力,而是怎么去设计工程调用,怎么去设计每次调用的Prompt。
研发过程中的卡点很多,处处都是卡点都需攻克,很多时候是摸着石头过河。一个印象深刻的难点是实现决策AI中的“PM AI“环节。当PM AI处理数十个角色诉求而这些诉求设计到多人交换时,会出现矛盾决策,例如A计划邀请C去吃中餐,B也同时计划邀请C去吃西餐,那么C最后要接受谁的邀请,而另一个被拒绝的角色又将改变原计划去做其他什么事情。
另外,也会出现决策后事件是否要呈现给玩家的问题,比如A去吃饭这一行为是显性的可以被玩家看到,但如果A想要进行秘密谋反前的准备,那么A的行动是不能被玩家看到的,这时A呈现给玩家的看到的应该是什么呢。没有可借鉴的开发经验,这些都是需要项目组一个个去攻克的难点。
白鲸出海:你们的AI底层技术优势是?
小北:我们从23年开始就推出了十几款不同参数、不同模态的大模型,可以说是为用AI做游戏打了一个很强的地基。在地基之上,我们做AI游戏的尝试就会轻松很多,比如我们自研的长文本模型赋予了不同角色的“深度记忆”,使玩家过往选择持续影响剧情走向;还有个很重要的我们模型有个很大的优势就是听得懂人话、有温度,玩家与AI角色的交流也会更贴近真人。
白鲸出海:大部分AI游戏会有算力的考量,你们是如何平衡算力和游戏体验?
小北:算力方面,我们用Dense模型嫁接MoE框架Post-Train技术,用低训练成本构建出兼顾推理成本与效果的MOE泛娱乐专用模型。
并且,当玩家和NPC聊长天时(比如触发大几十轮剧情对话),传统模型会把所有话都“死记硬背”下来,浪费算力,但我们模型像个“智能倾听者”,先用超长上下文模型记住关键信息,再通过动态推理技术自动过滤掉无关内容,实现成本与效果最优平衡。
白鲸出海:怎么考虑游戏的商业化?
小北:「昭阳传」完整版“AI决策+AI演绎”的模式目前算力成本还挺高的,但行业上大模型的应用趋势是值得期待的,毕竟是全世界都在一起迭代,在已经落地的C端项目中我们可以看到每个月效率都在不断提升而且成本在不断下降。
商业化对于我们现在的阶段还言之尚早,在确认目前这套AI系统可以带来新的gameplay之后,会再接入更多策略、养成系统以及增加AI与这些系统的交互,届时会以一个完整的形态展现给玩家。另外,我们还考虑未来会将游戏的AI模型放到客户端上,尝试使用玩家自己的电脑来进行推理,端上推理的AI游戏也是最后AI+游戏的最终形态。
白鲸出海:元象是一家AI技术公司,为什么在下场做AI应用/游戏上也非常活跃?优势有哪些?
小北:我们的创始人姚星曾创立腾讯AI Lab,我们AI团队也脱胎于此,多年前就已打造出可以和职业选手对抗的王者荣耀AI“绝悟”、围棋AI“绝艺”,可以说是有一定游戏场景下的AI技术积累。同时我们的产品、策划、美术团队都有很强的游戏基因,整个团队呈现“AI+游戏”的组合。
经过技术迭代和积累,游戏AI也从之前的“特定规则下的竞技博弈者”发展到“开放探索的自主行动者”,所以现在做AI游戏其实可以探索的空间更大。在公司的战略下我们核心聚焦在用户的娱乐生活上,其中内容消费(短视频、小说等)、社交、玩游戏占据了大众绝大部分的消遣娱乐时间,因此我们的产品线也从以上三个角度研发除了「昭阳传」外的另外两个产品,AI互动内容平台Saylo、AI社交产品Vibing,这两个产品主要面向海外市场。
白鲸出海:据我们了解,很多玩家可能并不关心游戏的AI含量,最重要还是游戏是要足够好玩的。你们是怎么理解AI对“好玩”这个层面的优化的?
小北:的确,玩家更多关注的是游戏最终呈现出来的结果,并不太关心游戏的实现方式。而对于剧情类游戏,玩家看到的剧情按自由度分线性的,非线性多分支的,以及无限类剧情,前两者可以通过人工配置的方式实现,但是最后的无限类剧情则必须通过AI来实现了。所以玩家看到的是无限剧情,但是背后的支撑就是AI。
另外,AI对“好玩”的优化,就是重构了玩家对“游戏可能性”的认知边界、从“设计师预设的乐趣”到“玩家创造的乐趣”:传统剧情游戏都是策划设计好的,玩家只能选择某一条或几条分支来体验剧情,而《昭阳传》则是玩家与AI共同参与编写的,每个玩家都能创造的故事,是从体验他人人生到编写自我人生的升华。