关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01229人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女网红名下公司涉嫌逃税逾千万被查处 仍在高频次直播

红星新闻 浏览 35 12-11

亚马逊历史新高!道指标普月线六连阳,中概股探底回升

第一财经资讯 浏览 86 11-01

专家:诺贝尔化学奖获奖项目产业化或率先在中国实现

上观新闻 浏览 164 10-09

赵露思内涵风波升级!对接下场骂虞书欣好丑,网友吐槽太不体面

萌神木木 浏览 289 08-19

王力宏方否认新恋情,女子身份曝光是合作方女友,离婚三年仍单身

扒虾侃娱 浏览 203 09-11

731部队原队员揭秘细菌战实施细节

极目新闻 浏览 7208 07-08

胡润百富榜发布!刘永行、朱义、刘永好、刘汉元、张勇排川商前五

红星资本局 浏览 89 10-29

2025世界人工智能大会在沪开幕,规模创历届之最

澎湃新闻 浏览 6670 07-26

中国色特别策划 | 故宫建筑与阙羽重光

时尚COSMO 浏览 58 11-07

即时零售收入同比增12% 阿里猛攻本地生活

北京商报 浏览 190 09-01

对话阿里“贵人”关明生:创业必须想清楚三个问题,否则可能会饿死

中国企业家杂志 浏览 6968 07-25

Scotto:76人任命球员人事副总裁安多尼安兼任G联赛球队总经理

直播吧 浏览 243 08-20

京东再出重拳!联手长安设计开发新能源无人智能化车型以及城市智慧物流

封面新闻 浏览 88 10-21

美俄筹备元首会晤 专家:美无筹码让俄接受停火协议

新民晚报 浏览 1313 08-09

遭美方逼问"台海出事你们会咋办" 日澳当场表示很惊讶

澎湃新闻 浏览 1916 07-14

黄仁勋vs王坚5000字对话实录:告诫年轻人尽快学AI 夸杭州是中国硅谷

态℃ 浏览 4451 07-18

沃特股份2025中报:扣非归母净利增长39.54% 特种材料驱动业绩放量

证券市场周刊 浏览 283 08-23

满大街都是“仙女裙”?这样穿裙子才撩到爆!

Yuki女人故事 浏览 292 08-21

云南外援奥斯卡连续七场联赛参与进球,刷新个人中超最长纪录

懂球帝 浏览 66 11-03

百万粉丝网红小英丈夫被刑拘 夫妻已数月未住村里

红星新闻 浏览 46 11-17

英伟达 CEO 黄仁勋回应大热天穿皮夹克:仅有一套西装未来得及干洗

环球网资讯 浏览 1732 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11