首页 产业新闻 Anthropic发布全球最强编码模型Claude 4,可7小时连续编码,网友:离失业又近一步

Anthropic发布全球最强编码模型Claude 4,可7小时连续编码,网友:离失业又近一步

产业新闻 108

    5月23日消息,AI编码模型冠军又易主了!

    Open AI最强竞争对手Anthropic正式发布了下一代Claude模型:Claude Opus 4和Claude Sonnet 4。

    Anthropic称:“Claude Opus 4和Claude Sonnet 4,为编码、高级推理和AI Agent设定新的标准。”

    Claude Opus 4是世界上最好的编码模型,在复杂、长时间运行的任务和Agent工作流上具有持续的性能。

    Claude Sonnet 4是对Claude Sonet 3.7的重大升级,提供了卓越的编码和推理能力,同时更精确地响应指令。

    目前,全球最大代码托管平台GitHub已经宣布,将使用Claude Sonnet 4作为 GitHub Copilot新编码Agent的基础模型。

    Claude 4的发布,是Claude时隔近一年的首次大版本号更新,被Anthropic寄予厚望。

    就在5月初,Google宣布推出Gemini 2.5 Pro Preview(I/O 版),号称显著提升了编码能力。就前端web开发来说,Gemini 2.5 Pro Preview在WebDev Arena排行榜上超越Claude位列第一。

    然而,仅仅过去半个月,Anthropic就带着Claude 4大模型强势袭来,重夺编码世界第一的宝座!

    Claude 4双模型重磅发布

    Anthropic将Claude Opus 4称之为“世界上最好的编程模型”,能在复杂、长时间运行的任务和智能体工作流中表现出稳定的性能。

    Claude Sonnet 4是Claude Sonnet 3.7的重大升级,以编程和推理能力为核心,同时能更精确地响应用户提示词。

    Claude Opus 4和Sonnet 4这两款模型均为混合模型,提供两种模式:即时回复和用于更深入推理的扩展思考(extended thinking)。

    在权威编程基准测试SWE-bench Verified上,开启扩展思考的Claude Opus 4与Claude Sonnet 4的得分分别为79.4%和80.2%,大幅度超越了OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1、Gemini 2.5 Pro等模型。

    在编程、工具使用、视觉推理、数学等领域的基准测试中,这两款模型超越了OpenAI o3,而在多语言问答、研究生级别推理任务上,Claude Opus 4与OpenAI o3得分持平。新模型的智能体能力迎来升级,最高可独立运行7小时,并推出了文件API、提示词缓存等新功能。

    Anthropic还宣布,除了Claude 4两款模型本身强大,他们还提供了一些新的功能和改进:

    扩展思考与工具使用(测试版):这两款模型都可以在扩展思考过程中使用工具,如网络搜索,使Claude能够在推理和工具使用之间灵活切换,从而优化响应质量。

    新的模型能力:两款模型都可以并行使用工具,更精确地遵循指令,并且在开发人员允许访问本地文件时,展现出显著提高的记忆能力,提取和保存关键信息,以保持连续性,并随着时间的推移积累隐性知识。

    Claude Code正式发布:Claude Code现在通过GitHub Actions支持后台任务,并与VS Code和JetBrains进行原生集成,可直接在文件中显示编辑,实现无缝配对编程。

    API新能力:Anthropic API 发布四项新功能,使开发人员能够构建更强大的AI智能体:代码执行工具、MCP连接器、文件API,以及长达一小时的提示词缓存能力。

    现在,Claude通过Anthropic API上的新代码执行工具运行代码,不仅可编写代码,还能够加载数据集、清理数据、生成探索性图表,并实时分析异常情况。在与Claude 4模型结合后,代码执行工具可以处理复杂任务,节省大量时间。

    同时,Claude 4系列模型的自主性进一步提升,Claude 3.7最多可自主运行45分钟,而Claude 4可以独立运行数小时,最高达到7小时。主要是新模型通过管理待办事项列表保持记忆,不会丢失线索。

    目前,Claude Opus 4和Sonnet 4这两款模型都可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。定价与之前的Opus和Sonnet模型保持一致:Opus 4为每百万token15美元/75美元(输入/输出),Sonnet 4为每百万token 3美元/15美元。

    AI代码助手Claude Code正式开放

    Anthropic AI编程助手Claude Code也迎来全面开放,从研究预览转为正式产品。这一编程助手接入了Claude Opus 4模型,能实时映射和解释百万行级别的代码库。

    Claude Code与GitHub、GitLab、VS Code、JetBrains IDE和命令行工具集成,可直接嵌入至开发终端中。Claude Code提供按量计费、每月100美元和每月200美元的3种订阅方案。

    除了接入最新模型之外,Claude Code还推出了多项新功能。Claude Code已经集成进更多开发工作流程中,包括终端,IDE,或者使用Claude Code SDK在后台运行。

    Anthropic推出了新的VS Code和 JetBrains Beta扩展。

    这一举措直接把Claude Code集成到了IDE里,也就是说,它已经和开发者们熟悉的代码编辑器无缝结对。

    Anthropic还发布了一个可扩展的Claude Code SDK,因此开发者可以使用与Claude Code相同的核心AI智能体来构建自己的AI智能体和应用程序。

    Anthropic在GitHub上开源了一个示例项目:用户可以直接在Pull Request和Issue中@Claude,它将自动响应审阅意见、修复错误并添加新功能。

    Claude 4携“不间断编码7小时”关键词强势发布,也引发了国内外程序员的关注,有码农就在社交平台发帖自嘲:每一天都是对码农的现实暴击,离失业又近一步了。