关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:011人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

罕见公开 俄"最大"攻击无人机工厂曝光

上观新闻 浏览 2639 07-23

生产全靠外包,这家轮胎企业要来IPO了……

IPO日报 浏览 6275 07-25

媒体:特朗普让闭嘴后 非洲领导人发言不敢超过5分钟

新民周刊 浏览 7895 07-11

高叶哭戏震撼全网,张艺谋15年前预言成真!

乡野小珥 浏览 8225 07-28

列出截止日期 美国想让谈判对象拿出"让步清单"

环球网资讯 浏览 9743 06-04

A股军工榜:超预期的三个逻辑

锦缎研究院 浏览 2138 07-29

暑期档剧综大战:修仙、打拐、姐弟恋……

仙女事件簿 浏览 5642 07-30

饿了么前CEO韩鎏等人受贿 涉案金额达4000余万

红星新闻 浏览 10840 07-26

记者:萨拉戈萨决定加盟塞尔塔,俱乐部间谈判已进入最后阶段

懂球帝 浏览 3027 07-28

殡仪馆回应"6名学生坠入浮选槽溺亡":遗体没有受损

极目新闻 浏览 9868 07-25

北约与俄罗斯军事博弈升级 未来充满不确定性

浏览 7098 07-14

英伟达涨逾4% 股价创历史新高

证券时报 浏览 1116 07-16

特斯拉库存引担忧 密苏里州一停车场停满未售新车

智车情报局 浏览 4662 06-23

图片报:多特正密切关注22岁曼城中场麦卡蒂,转会费预计2300万欧

直播吧 浏览 9794 07-13

广州有批发店售卖"无3C"标记水弹枪:部分冲击力惊人

新快报新闻 浏览 7509 07-13

特朗普与巴基斯坦陆军参谋长谈以伊冲突

环球网资讯 浏览 9681 06-20

“胖改”路上,永辉超市阵痛加剧

斑马消费 浏览 4778 07-16

创下5年来最大跌幅,养老金涨幅降至2%,未来会停涨吗?

数字财经智库 浏览 4943 07-13

监管重锤4200万!上海银行内控“黑洞”为何补不上?

杠杆游戏 浏览 0 08-07

豪门狗血...

越女事务所 浏览 9377 07-14

美国航空一客机发动机起火返航 无人受伤

上观新闻 浏览 274 06-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11