一个200美元的AI浏览器,想重新教会我“上网”
【来源:虎嗅网】
本文来自微信公众号:极客公园 (ID:geekpark),作者:张勇毅,编辑:靖宇,题图来自:AI生成
AI浏览器的战争开打到今天,从早期的Arc试图重塑交互,到Opera Neon展现的“代理”能力,再到传闻中OpenAI即将推出的浏览器,每一个行业重量级参与者,都在试图重新定义这个我们最熟悉的互联网入口。
本周,以AI搜索引擎著称的Perplexity终于带着他们的答案入场了——Comet,一款自称为“AI Agent原生”的浏览器。
然而,Comet并没有在社交媒体上掀起足够的声量,因为Comet目前还处在仅向Perplexity Max订阅用户以及部分限定邀请码用户开放的阶段(每月订阅费200美元)。后续将通过候补名单(waitlist)的方式逐步扩大用户范围。
幸运的是,极客公园通过邀请码的方式,得以快速体验到Perplexity的这款AI Agent浏览器。
Perplexity CEO Aravind Srinivas对Comet的愿景野心勃勃:“我们构建Comet是为了让互联网做它一直渴望做的事情:放大我们的智能。”Comet的核心理念是“从浏览到思考”(From Browse to thinking)。
听起来很宏大,但Comet究竟能给现有的浏览器使用体验带来什么?它与集成了AI能力的Dia浏览器,或即将拥有Gemini的Chrome有何不同?
凭借AI搜索起家的Perplexity,能凭借Comet将估值再推上新台阶吗?
一、什么是“思考伙伴”
要理解Comet的雄心与它目前的“最长板”,仍然需要从“Perplexity眼中的AI Agent浏览器用户需求是什么”出发。
如果说传统浏览器解决了“访问”信息的问题,那么Comet则试图解决“理解”和“运用”信息的难题。它认为,问题的根源在于,每一个标签页都是一个信息孤岛。而它的解决方案,就是将这些孤岛连接成一个拥有统一智能的大陆。
这个概念体现在Comet的方方面面;它不太像是一个传统的浏览器主页。更像是一部智能手机的桌面,布置着你所需的各种App。
Comet浏览器桌面|图片来源:极客公园
传统浏览器像是一座由无数个独立房间(标签页)组成的庞大建筑,每个房间都存放着不同的信息,你需要亲自跑遍每个房间去收集和整理。而Comet则试图将这座建筑改造成一个拥有统一中枢神经系统的智能体,你只需要站在大厅(Comet助手)里下达指令,这个智能体就会为你跑遍所有房间,带回你想要的一切。这是一种从“空间管理”到“智能委托”的范式转移。
Comet实现其宏大愿景的核心武器,是位于侧边栏的Comet助手(Comet Assistant)。它的魔力,源于两大能力的深度融合:一是超越单一页面的“情境感知”,二是类似我们此前已经在Manus AI看到过的、化信息为行动的“代理执行”。
这种体验不同于以往依赖单一网页信息读取实现AI效果的AI浏览器,Comet的这一能力,有潜力进一步改变我们处理复杂信息流的方式。
想象一下,你正在为购买一台新相机做功课。你的浏览器里打开了若干个标签页:电商网站的商品页面、专业摄影网站的深度评测、YouTube上的上手视频、一篇对比它与竞品的博客文章,以及一个论坛里关于它缺点的讨论帖。在传统工作流中,这势必是一场在不同页面间反复横跳、用大脑或笔记本来记录对比的艰苦战斗。
但在Comet中,这个流程被彻底重构了。
你可以直接向助手提问:“根据我打开的这几个页面,全面总结一下这款相机的优缺点。特别是,它和另一款竞品相比,在视频功能和操控性上各有什么不同?将结果用表格呈现。另外,那篇论坛帖子里用户抱怨的低光画质问题,专业评测网站是怎么看的?”
Comet助手此时扮演的,是一个顶级的专业助理角色|图片来源:极客公园
它能迅速阅读、理解所有页面的内容,包括视频字幕和论坛讨论,然后为你生成一份结构清晰、综合了各方观点的深度报告。这就是“情境感知”的力量,它将孤立的标签页整合为了一个统一的、动态的“浏览会话(Browse Session)”,这个会话就是它的记忆和工作空间。
我不再需要亲自浏览,而是让我的智能Agent代劳|图片来源:极客公园
这种能力不止于消费研究,真正大展身手的场合在于更加复杂的专业知识研究类工作。
假如你正在撰写一份市场分析报告,你的标签页里有一份PDF行业研究、一个Google Sheet数据表格和你的Google Docs报告草稿。你可以直接对Comet下达一系列连续Agent指令:“从那份PDF的第三章中,提取所有关于市场规模和增长率的关键数据,然后填充到我打开的Google Docs文稿中,生成三个核心的战略建议要点。”
在这条连续系列命令中,Comet Assistant能在生成对应的内容之后,以一种AI Agent的方式,帮我以正确的排版填充这份在线文档。
Comet助手能同时读取多个网页信息并操作|图片来源:极客公园
你当然也可以对它提进一步的要求:微调格式、进一步丰富细节,甚至是让它直接帮你想一个标题自动修改。
Comet能够通过同时监听并操作多个网页的方式,来完成更加复杂的任务请求|图片来源:极客公园
为了获取到更加无缝衔接的体验,Comet还会问你索取对应的日程与邮件读取权限,以便获得更加个人化的Agent辅助服务。
Comet在使用开始,就会向用户申请获取各种权限|图片来源:极客公园
除此之外,AI Agent也是Perplexity在Comet中加入的重要能力,Comet允许AI agent直接在本地浏览器执行任务(如批量网页操作、自动化表单、跨平台操作等),无需依赖云端虚拟环境,流程流畅且无需重复登录。
你可以直接向它提起需求,Comet就能自动理解并打开对应的网站,帮你修改个人信息,这就是一开始Comet为什么要索取不少敏感账号权限的原因——但你并不用担心数据泄露的风险,因为这些网页信息编辑操作都是基于本地处理运行。
在这里,Comet已经超越了信息的整合者,化身为工作流的执行者。它不仅帮你“看”,还帮你“做”。
Perplexity Comet最大卖点在于真正做到浏览器级自动化与深度AI集成,让“让AI真正替你上网、做事”成为新一代生产力工具的现实可用场景。
二、AI浏览器的“战略抉择”
从实际体验上来讲,Comet可以说是目前体验最完善的AI Agent浏览器之一,也是继Arc之后,又一次让我产生“将默认浏览器从Chrome切换过来”想法的浏览器。但这真的就意味着Comet能在AI浏览器的浪潮中最终存活下来吗?
面对AI浪潮,市面上的浏览器产品实际上选择了三条截然不同的演化路径。Comet的选择,决定了它的独特定位,也预示了它将面临的挑战。
最普遍和保守的路径,可以称之为“工具增强派”。以集成了Gemini的Chrome和集成了Copilot的Edge为代表,它们的核心逻辑是“浏览器+AI”。AI作为一个强大的新功能被集成进来,让你可以更方便地总结网页、润色文字。这很有用,但浏览器的基本形态和用户的使用习惯并未改变,AI只是一个更好用的新工具。
我们今天看到、Gemini在Chrome中的落地就是这一派的著名代表|图片来源:极客公园
更进一步的,是“代理执行派”。以一些探索性项目为代表,它们让AI能够根据用户的模糊意图,更主动地去操作浏览器,甚至在云端为用户生成报告或应用。在这里,AI的角色从“工具”升级到了“初级助理”,具备了一定的自主性。
而Comet所选择的,是第三条,也是最激进、最富想象力的道路——“环境重构派”。这条路上的探索者认为,在AI时代,AI不应只是浏览器的一个功能,浏览器本身就应该是一个AI环境。它们的目标是彻底重新定义浏览器的形态,将割裂的网页信息流,统一成连续的、可对话的、智能的交互环境。
Perplexity认为,随着人们越来越多地使用AI聊天机器人来获取信息,传统的搜索和浏览模式正在发生改变。Comet旨在抓住这一趋势,通过提供更高效、更智能的AI驱动体验来吸引用户。
因此,Comet坚定地选择成为“环境重构派”,这意味着它对用户的期望,不仅仅是“使用”它,更是“栖息”于其中。它希望用户能改变自己使用互联网的方式,将浏览器视为一个可以深度对话、可以全权委托任务的“思考伙伴”,而不仅仅是一个被动展示信息的窗口。
三、高昂的门票与用户“惯性”
然而,选择最激进的道路,也意味着将直面最陡峭的悬崖。
Comet的发布并非一帆风顺,其策略与理念,都让它陷入了创新者典型的窘境之中。
首先是引发了巨大争议的发布策略。目前,Comet的体验资格,仅对每月支付高达200美元的Perplexity Max订阅用户开放。这让大量每月支付20美元、作为其核心支持者的Pro用户感到了极大的失望甚至“被背叛”。
一位用户在社交媒体上的评论代表了很多人的心声:“完全的情绪过山车……我们以为Pro会是下一个。”虽然Perplexity官方承诺Comet在未来最终会对所有用户免费,但这道“200美元的门票”无疑在早期给它贴上了“精英主义”和“脱离群众”的标签,极大地限制了目前的口碑传播和早期用户生态的建立。
不少用户对 Comet 目前的测试策略表达了愤怒 | 图片来源:Twitter
而比价格争议更深层次的,是关于用户习惯的巨大挑战。The Browser Company在复盘其广受好评的Arc浏览器时,曾坦诚地承认,Arc之所以酷炫但未能实现大规模普及,核心原因在于它“太不同了,有太多新东西要学习,而回报太少”。
这便是AI浏览器界人人闻之色变的“Arc的教训”——它精准地指出了所有“重构派”产品面临的核心矛盾:做得太保守,用户没有理由放弃成熟的Chrome生态;做得太激进,用户则可能因为过高的学习成本,在真正体验到其价值之前就已放弃。
Comet正是这个矛盾的化身。它所提供的“会话式”浏览体验,虽然对某些用户来说可能意味着效率的指数级飞跃,但对于绝大多数习惯了Ctrl+T(新建标签页)、Ctrl+W(关闭标签页)和在标签页间跳跃的用户而言,无异于要求他们学习一种全新的“语言”。Comet必须用无可辩驳的、远超现有工具的价值,来证明这种学习是值得的。
在AI已经如水和电一般渗透到数字生活方方面面的今天,我们用了二十多年的浏览器,究竟应该是什么样子?它应该是一个集成更多AI功能的、更智能的工具?还是一个能彻底解放我们大脑、重塑信息关系的全新数字环境?
Perplexity用Comet给出了他们的答案:浏览器应该是一个能够“重新定义人与信息的关系”的思考伙伴。从技术基础来看,Comet基于开源的Chromium项目开发,这意味着它天生就能兼容绝大多数Chrome扩展,保证了基础体验的稳定性和生态的延续性。这像是它为自己激进的革命理想,上的一道现实主义的“保险”。
但Comet的核心价值,绝不在于它对过去的兼容,而在于它对未来的定义。它所展现的,是下一代互联网入口的清晰雏形:一个前台交互简洁优雅,后台则由强大的AI理解上下文、串联信息、并能主动执行任务的智能环境。
Comet的问世,与其说是一个产品的最终发布,不如说是一次大胆的、向整个行业和所有用户发出的未来提问。
这条路能否走通,不仅取决于Perplexity自身的技术迭代速度和商业策略,更取决于我们——每一个被“标签页地狱”所困的用户——是否已经准备好,去迎接、去学习、去适应这种全新的信息交互方式。它就在那里,像一个来自未来的邀请。而我们是否愿意奋力一跃,去拥抱那个全新的世界,将决定这场宏大的浏览器革命,最终的走向。
Comet浏览器本身,Comet这个单词最常见的含义是名词,指代天文学上的彗星。
或许说明Perplexity希望这款浏览器能像一颗新星一样,在竞争激烈的浏览器市场中迅速崛起并受到瞩目。
但它也会像彗星一样“转瞬即逝”吗?