这个AI浏览器,替我给女朋友打了“分手电话”
【来源:虎嗅网】
4月份,Genspark超级Agent上线,因为AI PPT的能力小小地出圈了一下。这个时候,Manus正因为AI浏览器爆火。眼下,刚过去两个月,Genspark也推出了自己的浏览器。
实际上这已经是Genspark第二次转变产品思路。在2024年刚推出的时候,Genspark主要的方向还是AI搜索。到2025年的时候,Genspark开始果断放弃AI搜索,转向AI Agent,尽管此时他们已经积累了500万用户。Genspark做出这项决策的最主要原因是他们判断,传统AI搜索流程固定,无法应对复杂任务。
这多少反映了AI行业的快与卷,一旦不及时调转船头改变方向,就很容易落后,例如去年风头很劲的新AI六小龙,今年多少都有些失意。
Genspark公司发展历程|极客公园
Genspark Super Agent的成绩还是很不错的,上线45天其ARR就已经达到了3600万美元。当然,需要指出的是,ARR这个现在AI公司很流行的指标是有些鸡贼的。ARR指的是年度经常性收入,过去常用于衡量SaaS公司的财务状况。我们可以简单把它看成是这家公司一整年的订阅收入,算法也可以简化成“月订阅收入×12个月”。所以Genspark的3600万美元并非实际收入,而是按照当月收入预测出来的全年收入。
如果以Genspark每月25美元(约合180元人民币)的订阅费计算,那就是有约12万人付费订阅了Genspark。
业内认为,Genspark团队是生生靠“卷”做到了反超Manus一步。那么,推出了AI浏览器,会是Genspark团队“逆袭”的重要一步吗?
一、确实是生产力小能手
从能力上看,我会把AI浏览器分为两类。
一类是传统浏览器+AI助手,我称之为“被动式AI浏览器”。这类浏览器通常需要用户主动发起问题。AI所负责的,是信息的检索和归纳,代表就是最近刚刚加上Gemini对话的Chrome。
另一类AI浏览器更加“AI native”,它们有更多的权限访问你的数据,并以此展开更多动作,相当于多了“眼睛”和“手脚”。
像AI搜索、文生图、文生视频这些基础的能力Genspark当然也具备,但它最强大的能力还是在解决复杂问题的能力上。这考验了AI在内部分解问题、制定计划并在最少的监督下逐步执行计划的能力。按照这个思路来看,Genspark颇有一些亮点。
初次打开Genspark,你首先要做的就是让Genspark更了解你,例如昵称、职业、个人资料、你希望Genspark具备的特质等等。这样AI就可以根据你的个人信息给出更个性化、更准确的回复。
但最厉害的是“自动研究”这个按钮,粘贴你的Linkedin、Twitter或者任何跟你个人相关的网页,Genspark就能根据你的历史数据自动生成一份画像。
提交你的社交网络账户,Genspark可以“自动研究”,从而生成更符合你个人的回答
基于“眼睛”和“手脚”的能力,Genspark做了一些其它有意思的功能。
例如Find Best Deal。当你在购物网站看中某款商品时,Genspark会自动搜寻全网最低价,并给出选购建议。
Genspark会把结果输出成一张表格,甚至eBay上的二手价格它也会考虑
还有电话代打。这不是AI自动回复打进来的电话,而是你可以让Genspark去跟真人打电话。官方给出的用法是你可以预定参订或者查询某个商店有没有存活。
但是有的日本用户发明了邪道玩法。一些日本用户用它来打电话辞职——他们不喜欢公司,不想再给公司打电话了;还有一些人用Genspark来跟男朋友或女朋友分手。
不过,比较遗憾的是,受限于网络环境,这些跟“现实世界”交互的功能在中国还无法使用——你没法比较淘宝上的商品,也必须亲自跟女朋友打电话分手。
生产力方面,Genspark的视频总结和PPT能力让我印象非常深刻。对于一些信息密度高的视频,Genspark不但可以总结视频内容,还可以以此为基础生成一份PPT。
例如,我让Genspark根据张小珺在Youtube上的一期播客“94.逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——‘硬件上的暴力美学’”,生成了一份12页的PPT。
可以看到Genspark梳理出了一个非常清晰的结构,有各家公司论文的特点,有对比和分析,还有一个总体的总结。PPT的视觉效果也完全处于可用的状态,不说多么优秀,已经比很多PPT新手强了。而这一切都是AI在短短几分钟之内做到的。尽管我没有完整地听完这个长达两个半小时的播客,但已经很快地大致了解了这3家公司注意力论文的特点。
Genspark总结长视频内容,生成PPT|图片来源:Genspark
与此同时,跟Genspark的另外一个功能“为我下载”联动,输入提示词就可以非常方便的下载视频中提到的论文。
“自动下载”可以直接下载视频中提到的内容|图片来源:Genspark
当然,这份PPT也存在一些问题,例如某些设计元素的过度使用,或者是一些表格上设计得不太讲究。
2023与2024年间距过近,文字部分也存在重叠|图片来源:Genspark
这个时候可以选择使用内置的编辑器修改,或者将PPT导入到Canva、Figma中做更专业的修改。
Genspark生成的PPT可以直接修改|图片来源:Genspark
Genspark在表格方面的能力也很强大。这个功能的官方示例是让Genspark查找20个关于Genspark的YouTube视频、总结观看指标,并突出显示正面和负面的用户评论。可以看到Genspark罗列的数据都非常清晰,负面评论也很有代表性,没有因为涉及自身而有所回避。
Genspark批量分析Youtube视频|图片来源:Genspark
你还可以上传PDF格式的产品报告,让AI自动提取关键数据,并生成相关的洞察分析。
Genspark分析PDF格式产品报告
或者是让Genspark自动比较巴黎、罗马、阿姆斯特丹的7天旅行方案,并生成一个表格。
能考虑到“推荐季节”和“语言难度”,真的很细心了|图片来源:Genspark
收费方面,Genspark提供每天200免费积分,可以试用一些功能,但是对处理复杂任务来说就完全不够了。稍微重度一点的用户,可以订阅每月25美元的套餐,包含了10000积分和所有最新大模型的访问权限。
如果能把25美元定义为“生产力工具的租金”的话,这笔钱就花得值
别心疼订阅费,一些脑子活络的用户已经开始用Genspark赚钱了。一位SEO专家Julian Goldie在Reddit上分享,他用Genspark在15分钟内就构建了一个原本需要3周开发时间的定制SEO工具。第二天,他就交付给了客户,赚了2500美元,可以订阅Genspark 10年。
就在我体验Genspark的过程中,它又推出了AI文档功能,凭一句提示词就可以生成调查问卷、餐厅菜单、简历等等。
至此,Genspark已经完成了PPT、表格、文档这Office三件套的搭建。很显然,Genspark把目标用户瞄准了付费意愿最强的一群人。
AI文档的生成基本涵盖了工作中的各种高频刚需文档
从Genspark的产品形态来看,这是一家快速迭代、同时路线非常明确的公司。
在积累500万用户的时候果断放弃AI搜索,转向复杂任务的解决,因为AI搜索这种简单的能力很容易被淘汰。接着做出超级智能体,秀肌肉的同时也是验证技术方向。到现在接连推出AI的Office三件套,就是面向付费意愿最强的用户,解决他们真实的问题。
当然Genspark也不是没缺点。这应该是一家工程师文化很强的公司,新功能的迭代速度很快。但带来的结果就是界面有些杂乱,或者说不够优雅,例如官网首页大面积的AI播客信息流。
这些“为你推荐”仿佛是门户网站时代的遗产
对于初次进入Genspark的用户来说,他们可能不太知道要做什么。很多好的功能都有一定的学习曲线,需要更好的引导与说明。
而对于更深度的用户而言,历史记录的功能也有些难用。我往往需要经过很多极菜单、打开了好几个网页之后,才能找到某一份AI生成的PPT。
这其中,有一些用户友好的问题可以很快解决掉,但是更根本问题还是指向——AI native的App到底应该是什么样子。这个问题没有答案,整个业界也都在思考。
Genspark总结自己的所有功能
二、为什么是浏览器
AI Agent的之后,AI浏览器已经变成了当下最热门的赛道。Manus、Genspark这类初创公司自不必提,腾讯的QQ浏览器、阿里的夸克、字节的豆包,以及Edge、Chrome这些老牌浏览器,都或多或少在向AI浏览器的形态迁移。
为什么是浏览器?
首先,它是互联网时代的入口。回顾一下历史,入口生意实在是一门好生意,每一个过路的人都自然而然地会上缴过路费,每一个把持着入口的公司在今天都是几万亿市值的科技巨头。互联网时代是拥有IE浏览器的微软、Chrome的谷歌,移动互联网时代是苹果。直到今天,谷歌公司绝大部分收入都还是通过搜索引擎的广告模式带来的。
尽管今天绝大部分用户的注意力已经被手机所攫取,但是回归到生产力领域,桌面平台几乎还是唯一选择。
而新技术——大模型的出现,给新玩家带来了可能性:“也许,我们可以颠覆掉这个领域的巨头Chrome”。
但,我可能还是会继续使用Chrome。
首先是习惯。养成一个习惯需要21天,即使我起心动念想要迁移到某个新浏览器,这21天中的每一秒我都有可能放弃。类似的情况并不是没有发生过,我一度尝试过迁移到Edge、Arc以及Dia。但是当我某一次偶然打开Chrome,那种行云流水的熟悉感又回来之后,Chrome就又变回了我的默认浏览器。
其次,AI行业的变化实在太快了。眼前这个AI浏览器有些功能真的做得很好,但你不知道明年这家公司是不是还活着;下个月是不是会有更强大的竞争对手出现。我的历史数据、插件、账号密码这些都会成为迁移的成本。
但是归根结底,现在的AI浏览器还不够好。不是比Chrome好上一点点,而是破坏式的好,是iPhone对诺基亚的那种好。
与此同时,Chrome也不是诺基亚,它并不差。它的困境,与技术、资金这些都没有关系,而是在于自己的历史包袱。