中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

Anthropic全新发布Claude Sonnet 5:性能直逼Opus 4.8 成本优化有新招

2026-07-01来源:快讯编辑:瑞雪

人工智能领域迎来重要进展,Anthropic 正式推出全新模型 Claude Sonnet 5。这款模型被定位为"迄今为止最具 Agent 属性的 Sonnet 系列产品",在自主规划、工具调用和复杂任务执行方面展现出突破性能力。据官方介绍,该模型能够在无需人工干预的情况下使用浏览器、终端等工具,其性能水平已接近此前需要更大规模模型才能实现的自主运行效果。

性能对比数据显示,Sonnet 5 在推理能力、工具使用、编程效率和知识处理等关键维度较前代 4.6 版本有显著提升。在智能体搜索评测 BrowseComp 和计算机操作评测 OSWorld-Verified 中,新模型在中等努力程度下展现出更高的成本效率,高努力程度时部分任务表现可媲美更高端的 Opus 4.8 模型。开发者可根据任务需求灵活调整参数,在性能与成本间取得平衡。

安全评估方面,Sonnet 5 相比前代产品有明显改进。测试表明该模型在拒绝恶意请求和抵御提示注入攻击方面表现更优,幻觉率和谄媚行为发生率均有所下降。在自动化行为审计中,其失当行为率较 4.6 版本降低 37%,但仍略高于 Mythos Preview 和 Opus 4.8 等顶级模型。针对网络安全场景,Anthropic 默认启用了实时防护机制,可有效拦截危险的网络操作请求。

定价策略方面,新模型提供限时优惠方案:即日起至 2026 年 8 月 31 日,输入价格为 2 美元/百万 token,输出价格为 10 美元/百万 token,之后恢复标准定价 3 美元/15 美元。值得注意的是,由于采用全新 tokenizer 技术,相同内容会映射为更多 token(增幅约 10%-35%),官方表示优惠定价旨在保持用户使用成本稳定。为配合高强度任务需求,平台同步上调了 Chat、Cowork 等服务的速率限制。

早期测试者反馈显示,Sonnet 5 在复杂任务处理上表现突出。开发者 Nicolas Bustamante 特别赞赏其浏览器操作能力:"执行速度快且安全性高,提示注入攻击成功率仅 0.93%,远低于同类产品。" 但也有用户认为运行成本偏高,第三方分析指出其单任务成本较前代上涨两倍,比 Opus 4.8 高出 15%,在主流模型中属于较高水平。

技术文档显示,该模型已通过网络安全验证计划认证,在 AWS、Microsoft Foundry 等平台均可使用,Google Vertex 支持预计近期上线。对于需要更高自由度的安全场景,官方推荐使用防护机制更严格的 Opus 4.8 版本。此次更新还修正了 Humanity’s Last Exam 和 OSWorld-Verified 等基准测试的评分标准,Sonnet 4.6 的工具辅助得分从原报告的 46.8% 修正为 34.6%。

工业液位测量避坑指南:西门子7ML5033选型要点与实战场景解析
上海妍溪实业有限公司作为西门子长期核心合作伙伴,其技术团队在调试该系列时,常会强调“有效量程=标称量程-盲区”这一计算原则,建议现场安装务必保留安全余量。该设备内置Modbus RTU通讯协议,这是实现与DC…

2026-07-01

4G走廊吊装数字时钟:无需布线,精准校时,公共区域时间管理新选择
在一些长走廊、大厅或者通道里,墙上不一定有合适的位置挂时钟,但头顶的空间倒是挺宽敞。于是就有了那种从天花板吊下来的数字时钟,人在走廊里远远就能看到。4G走廊吊装数字时钟就是针对这种情况来的——它不需要网线,靠…

2026-07-01

小米新机认证信息曝光:百瓦快充防窥屏,NAS新品众筹预约开启
博主@数码闲聊站近日的一份消息中提到:“2月我已经超前瞻过了,母系迭代新旗舰,Pro系列测试新一代2K级超清显示+防窥显示技术,软硬件支持全方位隐私防护”。 以往的消息显示,小米NAS的目标是打造出最适合…

2026-07-01

国泰中证机器人ETF(159551)6月30日涨5.23%,年内份额规模双降流动性尚可
机器人ETF国泰(159551)成立于2023年11月8日,基金全称为国泰中证机器人交易型开放式指数证券投资基金,基金简称为国泰中证机器人ETF。 规模方面,截止6月29日,机器人ETF国泰(159551)…

2026-07-01

华为鸿蒙HarmonyOS 7第二批开发者测试开启,花粉将获尝鲜机会
IT之家 6 月 30 日消息,博主 @熠熠玩数码 今日发文透露,华为鸿蒙 HarmonyOS 7第二批开发者测试会提供花粉尝鲜资格。博主表示,此次尝鲜的机型会尽量多,但不确保 ALL IN。 据IT之家此…

2026-07-01