地表最强编程AI 诞生，Claude4连续自动编程7小时，实测细节惊艳程序员

【来源：虎嗅网】

本文来自微信公众号：APPSO （ID：appsolution），作者：发现明日产品的，原文标题：《地表最强编程 AI 诞生！Claude 4 连续自动编程 7 小时，实测细节惊艳程序员》

就这几天，AI圈像是过年了。

就在刚刚，Anthropic正式发布Claude 4系列模型：Claude Opus 4和Claude Sonnet 4。

没喊口号，没搞长篇论文，这次Claude升级的关键词只有一个：干活。

据Anthropic宣称，Opus 4是目前全球最强的编程模型，能够稳定胜任复杂且持续时间长的任务和Agent工作流。而Sonnet 4则着重强化了编程和推理能力，能更精准地响应用户的指令。

此外，Anthropic还同步推出了以下新功能：

工具辅助的延伸思考（测试版）：Claude模型在进行深入思考时，能够交替使用工具（如网页搜索），以优化推理过程和回复质量

新增模型能力：两款模型可并行使用工具，执行更精确的指令，并在开发者授权下，提升记忆能力，能提取并保存关键信息，保持上下文连贯

Claude Code正式发布：Claude Code现已支持GitHub Actions、VS Code和JetBrains

新的API功能：Anthropic API新增四项功能，包括代码执行工具、MCP连接器、文件API和最长可缓存1小时的提示缓存功能

Claude 4发布，最强编程AI又又双叒叕易主了？

作为Anthropic迄今为止最强大的模型，Opus 4在编程基准测试SWE-bench上拿下了72.5%的高分，在Terminal-bench上也以43.2%领先同行，堪称最会写代码的模型。

Claude Opus 4擅长编程和解决推理类问题。它可以像资深程序员那样拆解问题、修补逻辑、精准debug，甚至连续执行需要数小时的复杂任务。

Anthropic提前让部分客户试用了Opus 4，在Replit的实测中，Opus 4在多文件、大改动的项目中表现出更高准确率。

Block表示在其代号为Goose的Agent中，该模型首次在编辑和调试代码过程中显著提升了代码质量，同时保持了稳定性和性能。

Rakuten使用该模型进行了一项高要求的开源重构任务，连续稳定运行7小时，表现相当出色。Cognition更直接地指出，Opus 4能解决其他模型无法完成的复杂任务，成功处理了多个前代模型没法完成的关键操作。

我试着让Opus 4创建带有动画效果的天气卡片，要求必须展示四种不同的天气状态，每种都有独特的动画效果，结果只用了一次机会就成功生成，效果惊艳。

与Opus 4相比，Sonnet 4不一定是最强，但可能是最合适绝大多数开发者的那个。

和前代Sonnet 3.7相比，它的编程能力、逻辑推理和响应可控性都有明显提升。SWE-bench的成绩直接冲到了72.7%，几乎与Opus 4持平。

虽然Sonnet 4在大多数基准测试不及Opus 4，但它整体更轻巧，也更灵活，聚焦更明确。

我试着让Sonnet 4「创建一个红白机风格的『贪吃蛇』游戏，包含自动演示AI功能，使用纯HTML/CSS/JavaScript实现为单文件」第一次失败了，第二次成功交付，输出质量在线。

因此，也不难理解GitHub选择把它作为新一代Github Copilot的底座模型，Manus说它在处理复杂指令时更清晰、输出格式也更优雅；Sourcegraph指出它更能专注核心问题，写出更有结构的代码。

作为「混合推理模型」，Claude 4系列支持两种模式：一种是接近即时的响应，另一种是深入思考，适用于更复杂的推理任务。

在无需延伸思考的SWE-bench Verified和Terminal-bench评测中，两款模型的表现已属上乘；但一旦启用长思考（最长支持64K token输入），其上限被进一步拉高。在GPQA、MMMLU、AIME等测试中，几乎没有对手：

MMMLU测试中，Opus 4得分87.4%，Sonnet 4也有85.4%；

AIME测试中，两者得分均超33%，远超前代水平。

Anthropic还针对TAU-bench设计了全新推理流程，允许模型执行长达100步的推理任务，模拟零售策略设计、航空调度优化等复杂思维过程。在这种模式下，Claude被鼓励写出完整的思维链条，而不是一上来就直接给出结论。

与此同时，Anthropic也在模型行为上做了进一步优化。

Opus 4和Sonnet 4相较于前代，更不容易走「捷径」或利用逻辑漏洞，在容易诱发AI欺骗行为的测试中，相关问题的发生率下降了65%。

一旦开发者授权模型访问本地文件，Claude不只是看懂文档，还能记住、生成并维护「记忆文件」，把关键信息记下来，形成一个完整的工作记忆。

Anthropic明确指出，未来优秀的AI Agent需要三种能力：

情境智能：不仅理解任务，更理解你是谁、在做什么，甚至为什么做。它能理解组织习惯与个性风格，持续自我优化。

长任务执行能力：能独立完成长流程、复杂结构的任务，甚至与其他人类或AI协作。

真实协作能力：能展开高质量对话、适配你的工作流，并为其行为提供清晰的推理解释。

比如Opus 4在玩《宝可梦》时创建了一份「导航指南」。

最后，在工具层面，Anthropic还引入了一个名为「思维总结」的新功能。该机制会在模型思考路径过长时，自动调用一个更小的模型对思路进行压缩和归纳，使最终呈现的信息更简洁、更清晰。

据称，这项功能只在约5%的复杂任务中被触发，大多数场景中模型的推理链已足够高效，无需简化。

知名博主Dan Shipper也体验了Claude 4系列模型，并给出评价。

他认为Opus在编程中的表现尤为突出，尤其是在Claude Code中，它能够长时间独立完成编程任务，无需干预，且比OpenAI的Codex更强大。

比方说，它成功实现了一个无限滚动功能，尽管需要进一步优化，但效果已接近可发布版本。

写作方面，虽然o3在写作上更强，但Opus是一个出色的编辑工具，它能诚实地编辑文本，不会随便给「好评」，指出问题所在，还能帮忙发掘未曾发现的写作主题和模式。

不过，对于日常任务，Opus的表现反而不如o3。ChatGPT的记忆功能在日常使用中更具粘性和有效性，而Opus仍需在智能性和速度上大幅提升，才能成为日常使用的首选工具。

目前，两款模型均已上线Anthropic API、Amazon Bedrock和Google Cloud Vertex AI平台，支持Pro、Max、Team和Enterprise各版本计划，Sonnet 4甚至向免费用户开放。

价格与前代保持一致：Opus 4每百万token（输入/输出）分别为$15/$75，Sonnet 4为$3/$15。

在AI Agent成为主流生产力工具的当下，Anthropic这两款新模型为不同层级用户提供了明确选项：Opus 4面向极致性能与科研突破，Sonnet 4则面向主流落地与工程效率。

AI模型不仅要聪明，还要耐用、稳健、可控。这也正是Claude Opus 4和Sonnet 4从基础能力到细节机制，从代码场景到长任务执行，所展现出来的一个明确的信号。

Claude Code全面开放，开发者的新「AI助理」值不值得信赖？

几个月前，Anthropic曾以研究预览的形式上线了一款面向开发者的编程工具——Claude Code。如今，这款工具正式向所有开发者开放使用。

从今天起，无论是在命令行终端、常用的IDE，还是你自建的应用后端中，Claude Code将深入嵌入更多真实的开发场景，Anthropic同步发布了Claude Code SDK，帮助开发者基于这一Agent打造自定义工作流和自动化工具链。

其中一项重磅更新，是为VS Code和JetBrains系列IDE推出的测试版扩展。

借助该扩展，Claude可以直接在代码编辑器中提供修改建议，开发者无需跳出熟悉的工作环境，即可快速审阅变更、追踪任务进度。只需在IDE的终端运行一条安装命令，即可启动Claude Code。

除了IDE外，Anthropic还发布了可扩展的Claude Code SDK，方便用户基于Claude Code自行构建Agent和应用程序。

此外，Claude Code也进入了GitHub的深度集成测试阶段。开发者现在可以在Pull Request中@Claude Code，协助处理代码审阅意见、修复CI报错、提交修改等常见任务。只需通过/install-github-app命令即可安装GitHub插件，从此实现「提示即改动」的自动化协作。

在今天的直播环节，Anthropic CPO Mike Krieger表示，随着Claude Code进入规模化应用阶段，「提示缓存」成为另一项被频繁提出的需求。现在，这项能力已正式落地：默认提示缓存TTL为5分钟，高级用户可以将其延长至1小时。

这项升级将显著降低长时间运行Agent任务的成本：最多可减少90%的token成本、缩短85%的响应延迟，使得Claude更适合处理持续交互、多轮推理的复杂任务链。

Claude Code的产品经理在发布会上展示了一个真实的演示任务：使用Claude Code为Excalidraw添加表格组件。这个被「压箱底」很久的功能请求，如今通过Claude，仅用一次提示就被完整实现。

在VS Code中打开项目后，开发者向Claude Code提交了一个清晰的需求描述：希望新增一个支持自定义尺寸、可拖动、风格兼容的表格组件。Claude Code随即生成一份详细的任务清单，依照步骤开始逐步修改项目代码。

得益于IDE的深度集成，开发者可以一目了然地看到每次变更的代码差异（diff），并根据需要选择人工批准，或启用自动接受模式。在演示中，Claude Code还承担了Lint检查、测试运行与PR提交等全部流程，整个实现周期不到90分钟。

最终成果包括新增完整的表格功能、自动生成并通过测试用例、与Excalidraw UI无缝集成、代码质量符合Lint要求，顺利通过构建，所有输出，未经手动编辑，完全由Claude Code独立完成。

例如，当用户在Issue中@Claude，它不仅会回应请求，还能主动创建PR，并持续通过评论更新进度，直到提交完成。这意味着，Claude Code不再局限于本地环境，而成为你在GitHub、Slack或任何支持API的平台上都能调度的「云端代码同事」。

Anthropic还提到，部分客户已用Claude Code SDK构建了更复杂的用例：包括并行运行多个实例来修复不稳定测试、自动提升覆盖率，甚至执行夜间值班时的紧急故障排查。

编程，是AI Agent最现实的落地场景。过去两周，OpenAI推出了Codex，Google亮出了Jules，Anthropic则在凌晨宣布全面开放Claude Code。

三家头部AI公司，几乎在同一时间选择了同一条路径：Agent，要开始上工位了。

这并非巧合。在所有需要「思考+执行」的任务中，编程是最天然适合AI Agent落地的场景：输入输出高度结构化，标准答案明确，工具调用接口丰富，还有大量可复用的开源语料和反馈数据。

更重要的是，它的用户就是最早接受AI的开发者群体。他们习惯自定义、愿意尝鲜、擅长集成，并且具备为好工具付费的能力与意愿。这是一个天然适配Agent产品迭代的应用场。

AI能否替程序员「干活」，可能就是继ChatGPT改变内容创作后的又一次「生产力地震」。真正打响第一枪的，或许正是这次全面开放的Claude Code。

只需要短短十分钟，它就完成了一个过去需要几天、甚至几个迭代周期才能推进的开发任务。这样的改变，也正在不断发生。下一代开发者将从学会写给Agent的第一条指令开始。

在发布会的最后，Anthropic CEO Dario Amodei和CPO Mike Krieger展开了一场炉边谈话，APPSO整理如下：

Mike Krieger：欢迎回到舞台，Dario，接下来我们将进行一对一的对话。欢迎回来，Dario。

Dario Amodei：你好，又见面了，太好了。这就像是一场在全场观众面前的一对一交流，真不错。Claude 4发布了，包括Claude Sonnet 4和Claude Opus 4也都上线了。你对Claude 4模型最兴奋的点是什么？它又如何改变了你对接下来12个月里可能实现的事情的看法？

Dario Amodei：是的，从抽象的角度来说，我最兴奋的一点是，每当有一个新的模型类别推出，你就能用它做更多的事情，对吧？我们会在Claude 4之后继续发布模型，可能会有Claude 4.1，就像我们做过Sonnet 3.5一样。

我认为我们现在仅仅是刚开始探索新一代模型在任务方面的潜力。我觉得模型的「自治」能力会远远超出目前的水平，比如让模型在很长一段时间里自主执行任务，我们现在还只是刚刚起步。我越来越看好模型在网络安全任务中的应用，网络安全其实可以看作是编程任务的一种，但它通常更高阶。

所以我觉得我们可能终于达到了一个可以胜任这类任务的门槛。作为一名前生物学家，我对模型在生物医学和详细科研方面的应用也感到非常兴奋，我认为尤其是Opus会非常擅长这方面的工作。

Mike Krieger：这让我联想到《Machines of Loving Grace》。你觉得Claude 4在整个发展路径中扮演什么角色？我喜欢开玩笑说大家把《Machines of Loving Grace》当作一篇随笔看，而我把它当作未来几年产品路线图。你觉得Claude 4是怎么融入这段旅程的？

Dario Amodei：是的，那篇文章其实有点像我写的产品路线图，但当时我其实并不知道该怎么实现它，然后就说，「好吧，各位，这就是你们要干的事了。」

我们现在越来越多地在生物学领域展开思考，而软件也是这其中的一部分，因为生物学正变得越来越数据驱动。十年前我做生物学时就已经涉及到数据，现在只会更多。我们拥有这些对生物学知识丰富的模型，它们可以帮助写代码。

所以如果你是一名计算生物学家，这些模型真的会加速你的研究进度。我们也有不少客户正在尝试将模型应用到这些任务中，我们稍后会聊到这个。

Mike Krieger：是的，我记得在我们发布MCP后举行的第一次黑客马拉松中，有人把MCP连接到了一个可以作画的绘图仪上，于是Claude就能自由作画了。看它画的东西真的很有趣。这是我第一次意识到MCP不仅仅能连接数字系统，它还能连接现实世界。所以如果MCP能驱动实验设备，那真的很有意思。

Dario Amodei：很快我们就能把Claude接入测谎仪来测试它了，我太喜欢这个点子了。

Mike Krieger：既然有测谎仪，谁还需要可解释性？你之前提到，有一次你确信Claude写的内容是人类写的。还有没有其他类似的突破性时刻，让你意识到这个模型真的不一样？

Dario Amodei：其实当时我自己也不太明白技术细节，但在我们内部，有一次模型发布前几周，有人突然说：「天啊，这个模型居然一次性完成了一个非常复杂的性能优化任务，以前没有哪个模型能做到。」

我想说的是，模型开发过程中总有一种几近迷信的现象——最后关头总是会突然「开窍」。虽然训练过程都是精心规划的，但模型的某些能力就是在最后一刻才展现出来，也许是跟用户的互动方式变了，也许只是最后一点点调优特别关键，也可能是人们对模型的使用方式更熟悉了。

你会发现模型的早期版本大家都摸不着头脑，但到了某个时刻，人们突然说，「这个模型我用着太顺手了。」总有某种「炼金术」似的神奇，在最后时刻发生。

Mike Krieger：《创造力公司》那本书里也讲到Pixar拍电影的过程几乎一模一样，电影在上映前两天都还是一团糟。我觉得我们做模型也是这种感觉，前期效果不佳，直到某个瞬间突然突破，我们迫不及待想让大家用上。

Dario Amodei：这真的说不通，因为训练过程是均匀的，按理说不会是那种「突然成型」的情况。但现实就是这样——在RL曲线上找不到某个点，它就是在最后时刻集成成功了，我也不知道为什么。这是一个真实存在的现象。

Mike Krieger：现场有很多开发者，我们内部也经常在讨论一个问题，那就是在AI快速发展的今天，软件工程这份工作中哪些部分会被AI接管？当我们拥有能执行大量开发工作的自主Agent时，什么会变得更加重要？

Dario Amodei：是的，可能在座很多人都读过Steve Yegge几个月前写的一篇关于初级开发者的博客文章。他还有几篇类似的文章，他甚至来我们公司拜访过。我觉得他对未来发展的描述甚至比我还清楚。他讲到我们正在逐步迈向模型更高的自治性。

我们经历了一个阶段，那时模型主要用于自动补全，现在大家说的是「vibe coding」，而我们正朝着可以派遣Agent执行任务的方向发展。我觉得有了Claude Code，我们会更进一步，未来还会有其他产品界面支持这个方向。

我们正进入一个新世界，开发者可以像管理一支Agent团队一样工作：「你去做这个，你去做那个。」

但我认为人类的持续参与仍然很重要，特别是在质量把控方面，确保Agent执行的是正确的任务、细节也做到位。所以我们在模型本身和周边产品设计上都要关注这些细节，这是非常关键的。

Mike Krieger：我也深有体会。模型让工程部分变得更高效，也让我对工作中那些低效部分更加敏感。比如，我们现在在跨团队协调和制定路线图上花了太多时间，其实应该花更多时间在真正的构建上。

随着开发速度加快，浪费时间的感觉也更加明显。

行业里有个永恒的争论：到底是更大的模型更强，还是更小更精致的架构更有前景？你因「扩展规律」论文而广为人知。你现在怎么看这种极端趋势？预训练是否已经「过时」？还是说它依然是核心？它和后训练之间的关系又是怎样的？

Dario Amodei：我不想讲得太细，但Claude 4系列模型在预训练和后训练方面都有显著进步。我们发现扩展规律在预训练阶段依然有效，同时后训练方面也持续有突破。这两者是互补的，我相信未来我们还会在这两个方向继续取得进展。

我们还会继续扩大模型规模，也就是说，多条技术路径正在同时指数级增长，而它们会相互叠加。

这也是为什么我觉得这个领域会发展得非常快。我喜欢Steve Yegge的那篇文章，是因为他说出了我经常说的话：再过一两年，这些模型可能就已经跟人类平起平坐了。

Mike Krieger：难以置信，Claude 3.7才是今年二月发布的，对吧？

Dario Amodei：是啊，但感觉像是一年前的事了。我知道，这听起来像个「过时的模型」，但其实才过去两个月多一点。时间的尺度正在被压缩。我常说，做AI就像是坐在一艘飞船上，以相对论的速度离开地球——你在飞船上过一天，地球上可能已经过去两天了。

Dario Amodei：你得在一天里接收两天的新闻信息，然后是三天，再接着就是四天……就是这种感觉，我们都在这艘飞船上。

Mike Krieger：这个比喻太贴切了，我之前没听过，但真的很贴切。回到后训练这个话题，我对Claude 4中一个重要的新特性非常感兴趣，那就是「记忆」。模型可以管理自己的记忆，能不能说说为什么这很重要？它让模型具备了哪些能力？对了，重复一下问题：模型可以管理自己的记忆，并处理那些需要长期规划的任务。

Dario Amodei：是的，这点非常有用。我们发现一个特别有趣的例子是在「宝可梦」任务中，模型可以记住自己的状态。当然，这不仅仅适用于宝可梦。

我觉得这很棒，因为模型现在也像人类一样：当我思考时，我会写笔记，然后以后再查看那些笔记；有时我还得做一些中间步骤。模型在推理时也会进行某种程度上的「中间演算」。

但不是所有的推理过程都能塞进一个草稿区里。比如我还会做演示文稿、写不同的文档。所以模型也一样：它需要创建文件、处理这些文件、加载数据，并且能够无缝地交错进行这些步骤。我们现在的一个新功能就是「交错推理+执行行动」。其中一些行动可能包括存储数据、调用数据。

这些模型逐渐具备的能力，正在逐步接近人类拥有的操作能力，我认为这是一个非常正确的方向。

Mike Krieger：在我使用Claude 4的过程中，有一个让我大为震撼的时刻。我们有一个「待办事项清单+草稿区+Claude Code」的组合，看着它一步步处理todo列表，然后在思考过程中还会添加新的任务，把完成的打勾，把不相关的划掉——

这真的模拟得非常像人类自己管理工作和思考的方式。而且它还能交替进行推理和工具使用。

今天早上我在MacStories上看到一篇文章，说Claude被当作一个MCP使用，它在请求VAC和MCP服务器时碰到了速率限制，模型就推理出「我大概是触发了限速，不如试试别的方式」。它能一边推理，一边调整策略，这种工具使用能力非常强大。

我想聊聊「向上的竞赛」（race to the top）这个话题——通常人们认为安全和能力是矛盾的，但你的观点恰恰相反：这两者可以并行发展。这点让我很受启发。

Dario Amodei：这是我加入这个团队的原因之一。我们讲的「向上的竞赛」不仅适用于日常的商业实践，也适用于AI的宏观发展方向。我们跟很多客户沟通过，他们非常关心模型行为的可预测性和可信性。

这也正是我们长期努力的目标之一：确保模型在更广义上能保持与人类意图一致。这两者是相辅相成的。我们也一直希望在合理、负责任的前提下，为社区提供一些工具。比如MCP就是个例子。

我自己也对MCP被大家迅速接受感到惊讶。我们是在去年11月发布的，一开始反响并不大。但三四个月之后，它已经成了事实上的标准。

又一次有那种「坐在太空船上」的感觉——高速离开地球，时间不断加速。你想想以前比如USB之类的标准，或者90年代、2000年代的一些标准，要花几年时间才能被大家接受。但现在，跟其他用MCP的团队交流时，他们也表示不想拖慢这个进程。虽然希望有一些方向指引，但大家觉得「这就像瓶中闪电」，不想错过。

Mike Krieger：我们要确保它成为新协议，成为各个Agent互操作的标准。说到「向上的竞赛」，我很喜欢你写的那篇关于「可解释性紧迫性」的文章。你有神经科学背景，能不能谈谈你怎么看可解释性和机器智能的共同演进？

Dario Amodei：是的，大约十年前，很多人都以为神经科学能指导AI的发展。事实上，现在这个领域有很多前神经科学家，我也不是唯一一个。有些实验室的负责人也有类似背景。

我发现从高层来看，神经科学确实能提供一些灵感。但我不能说，「啊，我们从下丘脑学到的某个机制可以直接用于构建AI模型。」大部分工作其实都是从零开始做的。

但有趣的是，趋势反而是反过来的：我们通过可解释性研究能「看清」模型内部的运作方式。虽然模型和人脑的结构显然不一样，但我们在模型中发现的一些概念模式，有时会在神经科学研究中被「复制」出来。比如Chris Olah团队中的一位研究人员通过模型可解释性发现了视觉系统中的高频和低频特征探测器。

然后过了几年，一位神经科学家在动物大脑中也发现了类似的机制。又比如视觉模型中，会有一条路径更偏向处理颜色，另一条路径则处理亮度或物体边界。这些区分看起来像是世界本身的「自然结构」。任何一种抽象学习系统，不管是人工的还是生物的，都可能得出类似的结论。

Mike Krieger：真的很有趣。我很好奇你们那篇「电路论文」最终会如何影响神经科学领域。那我们来看看5到10年的时间范围，尽管在AI领域，可能「一年就等于五年」。你觉得第一家只有一个人却能创造十亿美元营收的公司，会在什么时候出现？2026年？

Dario Amodei：我觉得没问题。我也想给在座各位一些建议，关于如何用Claude构建未来一年的产品——如何在前沿领域开展建设。

当然，你可以说很多关于模型使用的具体建议。但现在这个「时间加速」的时代，几乎所有建议都会被一句话淹没，甚至只需要两个词：大胆一点。构建一个超出你原本认为可能实现的东西。

即使它现在还无法完全实现，下一代模型就要来了——现在是三个月更新一次，很快可能两个月、一个月就有更新。到今年年底，我可能都要建议：「今天别建任何东西，我们今晚就有新模型发布了。」

Mike Krieger：我之前和一位创业者聊过，他两年前就开始做自动化编程Agent的公司，他尝试过市面上所有模型，但产品始终不太行。直到Claude 3.7发布，他说，「现在我的创业项目终于能跑起来了。」

这说明，一些原本困难的任务，突然就能实现了。

Dario Amodei：有时候「撞墙」也未必是坏事。你把其他部分都准备好了，只差模型这一块。当模型能力到位时，你的系统反而比所需更健壮，这反而是件好事。

所以我虽然总开玩笑说「等下一个模型」，但如果你正在做的事情「几乎」是可行的，而不是遥遥无期的那种，那么坚持撞墙其实是有价值的。

Mike Krieger：我们在内部研究时也遇到类似的事。我们的「高级研究+Claude能力」团队做过一个原型，当时模型对工具使用还不太行。但到了Claude 3.7，尤其是Claude 4，我们发现它在高级研究任务中表现非常好。那是因为我们一路上在尝试、在失败。

Dario Amodei：就像你要把自己的初创公司当成是对下一代模型的「投机性执行」。我非常喜欢这个说法。

Mike Krieger：是的，说得太对了。最后一个问题：对我们这些不是Dario的人来说，很难想象AI在过去几年取得了多么惊人的进展。那么你对接下来一年、以及未来五年最期待的是什么？

Dario Amodei：在接下来一年里，我觉得「代码」这方面会出现很多令人惊艳的进展。

我们现在有了Claude Code、有了编程模型，接下来就是构建「Agent团队」。这会对世界产生很有意思的影响。

我觉得我们其实还没有认真思考过一件事：当「写软件的成本」大幅下降时，经济和商业结构会发生什么？

以前有个默认假设：只有几百万用户的软件才值得开发，或者至少也得有几万用户。你不会为某个活动单独开发一整套软件——最多凑合做个小工具。但如果写一个程序只需要20美分、几秒钟，你就可能说，「我们来做个工具，专门为这个活动服务，调整一下视觉效果。」

Dario Amodei：当软件可以按需、低成本、一次性创建时，整个世界都会不同：开发者的角色、企业的角色、创业公司的角色，乃至用户的体验都会变得不同。而这一切我们现在还没有答案。

从五年时间维度看，我还是要回到生物学。我觉得生物医学不会在一年内彻底革新，因为这领域进展缓慢。但我希望，五年后我们能彻底战胜一些现在仍存在的疾病。

Mike Krieger：我就把这作为今天的收尾吧。可惜我们得结束了，我感觉还可以再聊40分钟。首先感谢Dario今天和我们分享。谢谢你，Dario。也感谢现场和通过直播观看的所有人。

差点忘了，还有一件事。作为对今天所有Code with Claude线下参与者的特别感谢，我很高兴宣布：大家将免费获得高级订阅体验。请注意查收。

我尤其喜欢将Max与Claude Code一起使用，希望你们也能尽情发挥。祝大家在接下来的环节中收获满满，欢迎来到Code with Claude！感谢大家的到来。

Dario Amodei：感谢大家的到来。

欢迎加入APPSO AI社群，一起畅聊AI产品，获取#AI有用功，解锁更多AI新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️邮件标题「姓名+岗位名称」（请随简历附上项目/作品或相关链接）

上班躺平的打工人，下班用健身提神

“校园霸凌者高考分数打折”，韩国把这复仇爽剧变成真的了

春节后“浑身不得劲儿”？你可能确诊了这种“病”

技术面买盘叠加关税与地缘风险，白银创三周新高

上班躺平的打工人，下班用健身提神

AI玩具跻身新潮年货 11只概念股业绩报喜

美伊紧张局势推高油价欧佩克+据悉酝酿4月重启增产

成都「盈嘉赢家」售楼热线|核心地段价值全面解析|新春专属购房福利|最新工程进展与户型详情一览

技术面买盘叠加关税与地缘风险，白银创三周新高

炳叔：买书修道，推荐《全球科技通史》

为什么抑郁的人总担心自己变贫穷？

炳叔：联想全球化之后，公关的七级浮屠

炳叔：你支持的是哪种华为？

技术面买盘叠加关税与地缘风险，白银创三周新高

上班躺平的打工人，下班用健身提神

AI玩具跻身新潮年货 11只概念股业绩报喜

美伊紧张局势推高油价欧佩克+据悉酝酿4月重启增产

成都「盈嘉赢家」售楼热线|核心地段价值全面解析|新春专属购房福利|最新工程进展与户型详情一览

技术面买盘叠加关税与地缘风险，白银创三周新高

上班躺平的打工人，下班用健身提神

AI玩具跻身新潮年货 11只概念股业绩报喜

美伊紧张局势推高油价欧佩克+据悉酝酿4月重启增产

成都「盈嘉赢家」售楼热线|核心地段价值全面解析|新春专属购房福利|最新工程进展与户型详情一览

更多你感兴趣的

你也许感兴趣