商汤徐立:AI真正迎来规模化爆发阶段 语言与视觉深度融合是突破智能上限的高效路径
【来源:东方财富】
“语言与视觉的深度融合是突破智能上限的高效路径。”
3月24日晚间,在人工智能公司商汤集团股份有限公司(商汤-W,0020.HK)业绩会上,商汤科技董事长兼CEO徐立表示:“我们深信语言与视觉的深度融合是突破智能上限的高效路径。我们基于NEO原生架构,高效实现理解与生成统一,探寻多模态的新‘尺度定律’。这一系列技术突破和智能体AI的深度结合将打开新的应用可能性,赋能全新垂直场景。”
当天,商汤科技发布了全年业绩公告。2025年总收入50.15亿元,同比增长32.9%,创历史新高,增速为近三年最快;净亏损17.82亿元,大幅收窄58.6%;经调净亏损19.56亿元,同比收窄54.3%;下半年息税折旧摊销前利润(EBITDA)3.8亿元,为上市后首次转正。
按业务来看,生成式AI业务收入36.29亿元,同比大幅增长50.98%;视觉AI业务收入10.83亿元,保持平稳;X创新业务收入3.02亿元,同比减少5.92%。
商汤表示,生成式AI业务收入大增主要是由于市场需求持续爆发性增长,以及一体化产业解决方案促进了计算平台、模型及应用的联合商业化;而X创新业务的减少主要归因于智能驾驶业务脱离综合财务报表,随着时间的推移,预期X创新业务的构成会发生演变,未来该特定收入的同比数据比较意义将降低。
商汤科技联合创始人、执行董事、首席科学家林达华也表示,随着春节后OpenClaw的“走红”,带来了Token(词元)消费的显著增长,整个行业也走向了Agentic AI(智能体AI)时代。
林达华指出,纯语言数据已经见顶,语言和视觉的深度融合,将会成为突破AI智力上限的关键路径。在软件AI时代,很多复杂业务场景都会涉及多模态信息综合处理。将智能体的视觉能力和语言处理深度连接,可以显著提升复杂任务的成功率和效率,并且大幅度降低token消耗。商汤此前推出的NEO架构打破了传统拼接架构,进行了底层的多模态原生改造,提升了学习和推理效率,用1/10的数据量就能达到SOTA(最先进,State-Of-The-Art)性能。
据透露,商汤将在今年第二季度发布新版NEO架构,效率还将再提升2-3倍。
商汤科技联合创始人、大装置事业群总裁杨帆也表示,现在上千P(PetaFlops,1P相当于每秒1000万亿次计算速度)甚至几千P的单一集群客户越来越多,商汤的整体算力规模已经达到4.04万P,其中国产算力超过5500P,规模越来越大。
杨帆表示,商汤会利用技术积累,与国产厂商一起不断进行软硬件联合优化,提升性价比,拓展可适用模型范围,让越来越多的公司接受并拥抱国产体系。

对于未来发展规划,徐立表示:“展望2026年,我们看到AI真正迎来了规模化的爆发阶段。商汤也已经做好了准备,接下来的发力点也比较清晰和明确。”
徐立表示,首先要坚持原生多模态的路径,通过技术落高定义AI的新范式和智能的新高度,确立在AI前沿领域的领先地位;其次要深耕产业智能化,打造Agent原生时代的入口,“我们相信AI会从辅助工具进化为真正的生产力,在泛办公、教育、营销、智能终端等这些垂直赛道,我们要抢占入口,实现流量和商业价值的双向爆发”;第三,要把单位智能成本压到极致,依托算力、模型、应用协同要持续降低推理成本,全力推动国产算力从可用走向好用;第四,视觉AI要跑出规模化红利,握紧CV(计算机视觉,Computer Vision)2.0时代的盈利密码,推动业务的规模化扩张和规模化利润;同时,还要坚持海内外双引擎发力,把商汤方案做到AI产业标杆。
徐立最后还指出,要持续兑现“1+X”的生态红利,进一步优化“母舰+子舰”的协同模式,和生态伙伴一起抓住垂直行业爆发带来的增值红利。
3月25日,商汤股价盘中最高涨幅5.76%,达2.02港元/股,截至收盘跌1.57%,报收1.88港元/股。
此外,澎湃新闻还获悉,在即将召开的2026全球开发者先锋大会上,商汤科技将带来基于多模态大模型的智能应用商汤输入法AudioClaw以及AI语音开放平台SenseAudio两项AI语音技术成果。
(文章来源:澎湃新闻)
