【来源:虎嗅网】

AI的聊天功能一向被网友们调戏为“人工智障”,网友和他们聊天以找乐子的居多。真的有人会和 AI “交心”吗?

你好,有的。上周一位网友晒出一张截图,是自己身患重病的父亲在去世前夕和与豆包的对话,第一句是“我要去世了,豆包”。

现在的 AI 工具越来越“聪明”,和它聊天时往往还能得到窝心的回复,不少小学生、老年人已经开始把 AI 聊天助手当作朋友。

我们对 AI 的依赖、AI 和我们生活的结合度,正走到历史新高。

发现了吗:过去搜索问题我们会先问百度,现在则会“问问DeepSeek”、“问问夸克”;如果需要做旅游攻略,还可以交给豆包、夸克生成答案。

经过大浪淘沙后,中国海量的 AI 工具还渐渐形成了三条不同的前进路线,上面提到的 DeepSeek、夸克和豆包,正是三类工具的代表产品。

AI 工具的“三国时代”,已经悄悄开始了。

天下三分

说 2025 年是 AI 元年一点都不夸张。

QuestMobile的数据,截至2025年2月,AI原生App月活跃用户(MAU)突破2.4亿,较去年同期净增超1.15亿,也就是说已经有接近 2.5 亿的人接触过 AI 工具。

在商业领域,行业数据显示,2024年中国AI核心产业规模达5784亿元,同比增长13.9%;到了 2029 年,这两个数字还会分别攀升至 1 万亿元和32.1%。

说 DeepSeek、夸克和豆包三分天下,三款软件都拥有 Top 级别的月活是一大原因。

DeepSeek是国内AI 原生App 排名第一的软件,今年 3 月的数据显示月活能达到 1.94 亿;夸克也不遑多让,同期月活达 1.48 亿,去年暑期时夸克的峰值月活更是接近 2 亿;豆包则经历了月活的暴增,从 2024 年的 173 万增长至今年 3 月的 1.1亿,增速达到了 35 倍。

另一方面,在技术路线、应用场景上三个软件刚好又“泾渭分明”。DeepSeek、豆包和夸克,分别代表了底层技术突破、用户体验重构和产业场景深耕三个维度,勾勒出中国AI工具的立体化发展脉络。

三条路线,三个方向

相信天天都在用这三款软件的人不少,但大家有没有想过,为什么夸克豆包没有像 DeepSeek 一样擅长逻辑推理?

夸克的 AI 搜索功能结果,为什么会和DeepSeek 搜出来的有明显的区别?

这正是 DeepSeek、夸克和豆包代表着中国 AI 工具三条不同发展路线的具体表现。

先说大家很熟悉的 DeepSeek。

DeepSeek作为中国AGI领域的代表,其核心竞争力体现在通用大模型的研发与开源生态构建,他们和其他 AI 厂商最大的不同在于专注于底层技术突破,而非商业化。

虽然也有传统模型产品 V3,但在今天提起 DeepSeek 大家最先想起的肯定是推理模型 R1。

既然是“推理模型”,推理能力自然是R1 的优势,它在数学推理、代码生成和复杂任务处理上实现了突破性进展,数学任务上的性能可与OpenAI的O1相媲美。

传统大模型在回答同类型问题时,更容易遇到知识精细度不足与领域适配困难、复杂推理能力缺失、算力消耗与部署成本过高等问题,这都被 DeepSeek R1 一一解决了。

其中的关键是,DeepSeek R1 可以依靠混合专家架构(MoE)实现效率跃升,以强化学习突破数据依赖,借开源生态加速场景渗透,解决数学推理、复杂任务处理场景的各种问题。

技术架构上,强化学习驱动的高效推理带来了大模型训练的“规模效应”革命,对MoE架构进行优化,相比传统全参数模型降低30%的算力消耗,回答专业领域问题时延迟更低,实现“小力出奇迹”。

当然更加惊艳世人的是 DeepSeek R1 首次以长链逻辑与思维可视化的方式,展现了推理模型的特性,它也是全球首个展示完整推导过程的推理模型。

在推理能力的加持下,R1 的复杂任务分解能力大大提升,可逐步拆解跨领域问题。比如在解答高考数学题时,R1会逐步呈现概率计算路径,而传统模型只会直接输出最终结果,用户也可以从推理过程中找出模型的思考漏洞并进行改进。

DeepSeek的技术路线,决定了它更擅长自然语言处理和复杂推理类的问题,在代码生成和编程辅助上也展现出了极强的能力。特别对金融、银行和科研机构来说,DeepSeek 的出现能大大增加数据分析的效率,也算是掀起了一股产效比革命。

而且这种技术路径不仅提升了模型的泛化能力,还通过MIT开源协议降低了开发者的使用门槛,推动AI技术的普惠化。

从行业趋势看,DeepSeek的发展与《2025中国AIGC应用全景图谱报告》中提到的“模型层关键趋势”高度契合。

报告提到,中国大模型的竞争正从“技术有无”转向“代差级领先能力”,而DeepSeek通过混合专家系统(MoE)和多模态技术突破,在模型深度推理能力上确实建立了差异化优势,还成为了全世界学习的对象。

此外,深度求索主张的开源策略与国内厂商“协作创新”的趋势一致,现在还有自称AI 工具的软件没接入 DeepSeek 吗?

DeepSeek,伟大。

然后来谈谈夸克。

夸克和 DeepSeek 的最大不同之处在于,DeepSeek 的网页搜索功能是一种辅助功能,夸克则把 AI 搜索作为了工具的核心。

阿里在定义夸克的时候,将这称为“AI与行业场景的深度融合”。

阿里对夸克的期望很高,把它定位为“AI普惠平台”:以“2亿人的AI全能助手”为品牌核心,依托阿里生态实现“搜索+生成”双向增强,确立了“AI+搜索”“AI+办公”“AI+教育”三大主线。

阿里在打造 AI 时代的夸克时,在“提升搜索效果”上下了非常大的功夫,所以今天的夸克,是这样的:

能搜到几秒前发生的大新闻。夸克可以依托阿里云通义大模型与搜索生态的深度融合,实现 10 秒每次的更新频率,抓取新消息的延迟也降低到了 3 分钟以内。

弄了一个“超级框”。夸克将AI对话、深度搜索、内容生成(PPT、文案)、学术研究等功能全塞了进去,它有点像过去的“百度一下”,不需要分门别类,简化了用户在搜索时的思考成本和操作逻辑。

拥有相对更低的 AI 幻觉。夸克设置了三审三校机制,医疗、法律等专业领域生成需经行业专家审核,结合知识图谱校验,据称可以将医疗问答错误率控制在5%以下。

从结果来看,避开 DeepSeek 和豆包等软件的锋芒,主攻 AI 搜索的夸克是成功的。每月拥有 1.5 亿上下的月活基本奠定了它在 AI 搜索工具的龙头地位,并在去年高考期间靠着填报志愿、成绩分析、职业规划等功能狠狠出圈。

为了助力夸克成功,阿里也是费尽心思。夸克 AI 能力依托于阿里的心血结晶:通义千问大模型。

虽然是一款基于Transformer和MoE架构的、不时髦的非推理类传统大模型,但能力还真挺行。

实际上根据基准测试平台Chatbot Arena的评测榜单,通义Qwen2.5-Max超越DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,是中国非推理模型中最强的。

具体来看,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。

而在LMArena的盲测榜单中,Qwen2.5-Max 的数学推理(如MMLU-Pro、LiveCodeBench)和硬提示(Hard prompts)处理能力分别位列全球第1和第2,超越DeepSeek-V3(排名第8)

夸克正是从通义千问力得到了文本、图片、音频、视频联合解析的多模态融合能力,在一些需要逻辑推理的场景中也可以发挥通义千问数学能力强的优点。

夸克让阿里看到了进军AI 领域的机会,2024 年开始夸克在年度下载量、年度月活两个关键数据上屡创新高,也是疫情以来阿里在C 端增幅最快的产品之一。

或许对轻量化浏览器出身的夸克来说,延续“浏览器”这一历史定位,从搜索路线切入 AI 的 C 端,期待成为DeepSeek、豆包这样的国民级软件,已经是最好选择。

最后,是今天开头那则小故事的主角:火山引擎的豆包

实际上,可能对大多数的用户来说,豆包更加符合他们对 AI 工具的认知。能吟诗作对、能画画做视频,为用户改文案,生成某些平台专属的风格文案……

字节对豆包的定位是“全民AI入口”,主攻消费级市场,创意生成和社交娱乐是它的最大卖点,多模态交互是整个工具的灵魂。

豆包代表了中国AI工具在C端场景的深度渗透。比起 DeepSeek它功能更多;比起夸克,它生图效果更好。

如果你觉得豆包不行,字节还为它安排了两个马仔打手保驾护航:即梦 App主打轻量级的视频和图片生成,可灵则面向专业级的企业用户。

再依托字节的流量生态,AI 产出的视频素材直接给到短视频平台使用,图片素材可以同步到飞书上作为插图,美美实现生态闭环。

为了实现这些创意生成效果,过去豆包 AI依靠Transformer与扩散模型结合的基础架构,结合语音-文本联合建模和视觉生成技术的多模态技术融合,为用户提供多模态功能。

4月17日,豆包发布了全新的1.5深度思考模型,采用了 MoE 架构,总参数 200B、激活参数 20B。

在继续提高多模态能力的同时,豆包1.5 强化了模型的数学、编程、科学和推理能力,测试表现甚至超过DeepSeek-R1、QwQ-32B等国产推理模型,与OpenAI o1、o3-mini-high等模型能力相仿。

随着架构优化、资源分配优化和推理效率的提升,深度思考大模型让豆包的图片生成、视频生成能力进一步升级,不仅支持了“边想边搜”、“视觉理解”等实用能力,豆包文生图 3.0 也将生成图片的最大分辨率提高到了 2k 级别。

依托字节系应用的海量流量,豆包预计还能持续在月活上创新高。哪怕在创意生成的绝对水准方面还没有达到 GPT-4o 的高度,但作为一款使用门槛低、上手简单的国产 AI 软件,豆包完全还可以美美地偏安一隅。

最终,DeepSeek代表的通用大模型、豆包代表的消费级应用、夸克代表的行业解决方案,构成了“基础研究-场景落地-生态协同”的完整链条。

三个 AI 工具都已经各自抢好赛道。夸张点说,只要你需要用 AI 工具,就绕不开上面三个软件里的任意一个。


AI 围城

回过头来,还是不胜唏嘘。去年的今天,主流的 AI 工具搜索的内容、生成的文字都几乎处于不可用状态,当时也不会有人想在工作上用 AI 工具作为辅助,毕竟大概率是会帮倒忙的。

但一年之后,我们身边涌现了各种各样的 AI,不仅查资料的丰富程度、准确程度大幅度提高,AI 制作的头图、插图已经司空见惯。从 DeepSeek 平地惊雷的那一刻起,我们的生活就被深深改变了。

就是,这也不完全是一件好事。

AI 工具泛滥的一大问题是 AI 幻觉问题日益严重,比如大家信赖的 DeepSeek R1,偏偏是众多工具中 AI 幻觉偏高的;其他的 AI 软件虽说各种手段降低了幻觉率,但其实也没好到哪去。

在一部分的测试中, R1 的事实性测试幻觉率高达22.33%,更糟的是一些由幻觉产生的“AI胡说八道”又会成为语料,重新喂回给 AI,形成恶性循环,最终把整个中文互联网都污染了。

哪怕你不用AI,也不知道网上哪些是由 AI 编造的假信息。

|又是一次言之凿凿的胡说八道

另外,开头那个关于豆包的新闻,总让人止不住担忧:老人家宁愿向 AI 告别,也不愿意和家人倾诉。

毕竟远在大洋彼岸的美国,一年前有一位名叫Sewell Setzer 的弗罗里达州男孩,在聊天机器人程序 Character.ai的“怂恿”下选择自杀,年仅 14 岁。现在他的家人还和 AI 软件的公司打着官司,这是一宗“人类和 AI 走得太近”引发悲剧的典型案例。

当 AI 越来越智能,聊天机器人越发像人,我们就像身处由 AI 构筑的围城里。把作品、言论、思想喂给 AI 作为语料,把最后的心情、感觉、心愿留给 AI,会不会终有一天,人类变得和 AI 太“亲近”,又和人类太“疏远”?

在这 AI 三国鼎立的一刻,人类和人工智能之间的关系,开始慢慢变得微妙起来。

本文来自微信公众号:蓝字计划,作者:Hayward