关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01454人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中方是否收到美方延长关税暂停期限的最终决定?外交部回应

界面新闻 浏览 530 08-12

7月3日上市/预售23.58万 小鹏G7首搭3块图灵AI芯片

网易汽车 浏览 2553 07-01

极氪被指卖"0公里二手车"虚增销量 官方:正常商业行为

鲁中晨报 浏览 10255 07-21

让男人上头的“伟哥”,遭遇大败退

花朵财经 浏览 241 11-04

搭载混动系统 新Jeep自由光无伪装谍照曝光

车质网 浏览 434 06-11

一天4瓜!个个离谱

阿纂看事 浏览 262 10-25

哈弗大狗2026款上市 限时权益价9.89万元起

网易汽车 浏览 6152 07-19

宗馥莉被3名自称同父异母弟妹起诉,娃哈哈遗产争夺该咋看?

江瀚视野 浏览 2864 07-17

汽车之家官宣冬季测试真要来了:杜绝充值 喊话陈震愿意来吗

快科技 浏览 276 10-31

腾讯《虚环》《穿越火线:虹》公开实机演示;心动投资AI游戏公司;GPT-5可分钟级生成3D游戏 | 氪游周报8.4-8.10

36氪 浏览 1090 08-10

伊朗外长:美封锁港口是战争行为

环球网资讯 浏览 104 04-22

谷歌 Pixel Watch 4 智能手表抢先看:屏幕峰值亮度 3000 尼特

IT之家 浏览 6125 08-09

美团紧急发文

大象新闻 浏览 283 10-31

摩尔线程五大硬核实力打造“AI工厂”,为大模型训练提速

爱集微 浏览 6595 07-29

斯基拉:内尔森租借合同中含买断条款,满足条件变成强制买断

懂球帝 浏览 2261 07-27

62岁钱小豪移居中山,每日买菜做饭生活简单,称很多朋友住附近

小撇说事 浏览 484 08-27

除了阔腿裤,这条裤子今年最流行!

LinkFashion 浏览 150 03-17

李连杰突然病倒,评论区抓抛妻弃女不放,同是犯错为何他更难宽恕

不八卦会死星人 浏览 427 08-23

联想 ThinkPad P1 2026 AI 元启版 10 月 20 日首销,25999 元起

IT之家 浏览 296 10-13

内娱声明还有可信度吗?

韩小娱 浏览 270 10-14

文森特晒训练照 并引用孙子名言:在混乱中也有机会

直播吧 浏览 325 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11