参考指南

IT之家 8 月 28 日消息，据外媒 Engadget 今日报道，OpenAI 和 Anthropic 共同宣布，同意评估彼此公开系统的安全对齐情况，并共享分析结果。总体来看，两家公司产品各有缺陷，也提供了改进未来安全测试的思路。

Anthropic 表示，它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用，以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示，OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致，但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外，其他测试模型在一定程度上都存在谄媚行为。

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能，旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道，OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀，面临首起不当死亡诉讼。

OpenAI、Anthropic互评：GPT存在谄媚行为，Claude不易出现幻觉”

独家丨“王炸...

为老婆怼网友...

哈马斯证实其...

家族控股，上...

＂95后＂情...

新一代美股散...

希腊主帅：字母哥多次犯规被漏判，他本应获得更多的罚球

你看到的不是奔驰纯电CLA，而是汽车的下一个20年

助贷新规落地调查：单利最低达7.56%，有网贷平台主动降2个点利率“拉客”

摩托罗拉Edge 70 Ultra现身Geekbench，处理器或有新情况

重庆用无人机表演库里三分！詹宁斯：他们太疯狂了

抗日名将吉鸿昌后人回忆外祖父遗书：为时代而牺牲

XPPen 推出 Artist Ultra 16 触控手绘屏：UHD AMOLED，16K 压感

超高闭店率，曾经暴利的牙科生意，凉了？

美国亚利桑那州一小型飞机坠毁两人受伤

美国恼羞成怒肯尼亚总统：管他呢必须跟中国好

她曾追求刘德华至家破人亡,如今怎么样了

新华全媒＋丨长春：多维体验共赴“蓝天之约”

佛山购药须实名登记！共涉及47种药物

五万亿的英伟达

20岁嫁豪门、49岁丧偶、52岁出道成超模，她的人生可太精彩了

冲上热搜的辛芷蕾：不着急、不害怕、不要脸

号称“租手机赚钱”，知名平台突然爆雷！有员工抵押房产上班两月，套牢130多万元，投资者：我66台iPhone没了

美国大选尘埃落定，特朗普胜选后的未知与挑战

空中客车5月交付51架飞机较去年同期下降4%

老骥伏枥！德转列40+球员今年出场榜：弗鲁米嫩塞门将居首 C罗第3

7月份核心CPI同比持续回升 PPI环比降幅收窄

热爆了！中国机器人企业近100万家、融资超240亿

辟谣新东方CEO涉关联交易，东方甄选一度涨超14%

男子花9千找熟人修车1年内反复故障双方都破防：讹诈