关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01225人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

摩托罗拉Edge 70 Ultra现身Geekbench,处理器或有新情况

IT之家 浏览 42 11-12

重庆用无人机表演库里三分!詹宁斯:他们太疯狂了

直播吧 浏览 1279 08-19

抗日名将吉鸿昌后人回忆外祖父遗书:为时代而牺牲

红星新闻 浏览 3712 08-09

XPPen 推出 Artist Ultra 16 触控手绘屏:UHD AMOLED,16K 压感

IT之家 浏览 148 09-29

超高闭店率,曾经暴利的牙科生意,凉了?

快刀财经 浏览 303 08-12

美国亚利桑那州一小型飞机坠毁 两人受伤

上观新闻 浏览 1418 06-08

美国恼羞成怒 肯尼亚总统:管他呢 必须跟中国好

澎湃新闻 浏览 8208 08-09

她曾追求刘德华至家破人亡,如今怎么样了

除夕烟火灿烂 浏览 92 10-24

新华全媒+丨长春:多维体验共赴“蓝天之约”

海外网 浏览 160 09-21

佛山购药须实名登记!共涉及47种药物

澎湃新闻 浏览 3833 08-05

五万亿的英伟达

诗与星空 浏览 65 11-03

20岁嫁豪门、49岁丧偶、52岁出道成超模,她的人生可太精彩了

LinkFashion 浏览 7714 07-06

冲上热搜的辛芷蕾:不着急、不害怕、不要脸

Yuki女人故事 浏览 211 09-09

号称“租手机赚钱”,知名平台突然爆雷!有员工抵押房产上班两月,套牢130多万元,投资者:我66台iPhone没了

每日经济新闻 浏览 39 11-12

美国大选尘埃落定,特朗普胜选后的未知与挑战

浏览 3545 07-14

空中客车5月交付51架飞机 较去年同期下降4%

财联社 浏览 6129 06-07

老骥伏枥!德转列40+球员今年出场榜:弗鲁米嫩塞门将居首 C罗第3

直播吧 浏览 1249 07-18

7月份核心CPI同比持续回升 PPI环比降幅收窄

界面新闻 浏览 9335 08-10

热爆了!中国机器人企业近100万家、融资超240亿

钛媒体APP 浏览 1375 08-13

辟谣新东方CEO涉关联交易,东方甄选一度涨超14%

第一财经资讯 浏览 241 08-20

男子花9千找熟人修车1年内反复故障 双方都破防:讹诈

极目新闻 浏览 165 09-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11