参考指南

IT之家 8 月 28 日消息，据外媒 Engadget 今日报道，OpenAI 和 Anthropic 共同宣布，同意评估彼此公开系统的安全对齐情况，并共享分析结果。总体来看，两家公司产品各有缺陷，也提供了改进未来安全测试的思路。

Anthropic 表示，它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用，以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示，OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致，但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外，其他测试模型在一定程度上都存在谄媚行为。

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能，旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道，OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀，面临首起不当死亡诉讼。

OpenAI、Anthropic互评：GPT存在谄媚行为，Claude不易出现幻觉”

罗马诺：费内...

24架F-3...

同济发布全球...

北美观众什么...

视帝扛起大旗...

黎真主党发射...

媒体：高市早苗被批＂日本之耻＂特朗普一来人设绷不住

狩猎者连开数枪枪击老太：2次逃离后充当＂好心人＂送医

博主兜售起号教程直言“可适度编造”

中方是否收到美方延长关税暂停期限的最终决定？外交部回应

7月3日上市/预售23.58万小鹏G7首搭3块图灵AI芯片

极氪被指卖＂0公里二手车＂虚增销量官方:正常商业行为

让男人上头的“伟哥”，遭遇大败退

搭载混动系统新Jeep自由光无伪装谍照曝光

一天4瓜！个个离谱

哈弗大狗2026款上市限时权益价9.89万元起

宗馥莉被3名自称同父异母弟妹起诉，娃哈哈遗产争夺该咋看？

汽车之家官宣冬季测试真要来了：杜绝充值喊话陈震愿意来吗

腾讯《虚环》《穿越火线：虹》公开实机演示；心动投资AI游戏公司；GPT-5可分钟级生成3D游戏 | 氪游周报8.4-8.10

伊朗外长：美封锁港口是战争行为

谷歌 Pixel Watch 4 智能手表抢先看：屏幕峰值亮度 3000 尼特

美团紧急发文

摩尔线程五大硬核实力打造“AI工厂”，为大模型训练提速

斯基拉：内尔森租借合同中含买断条款，满足条件变成强制买断

62岁钱小豪移居中山，每日买菜做饭生活简单，称很多朋友住附近

除了阔腿裤，这条裤子今年最流行！

李连杰突然病倒，评论区抓抛妻弃女不放，同是犯错为何他更难宽恕

联想 ThinkPad P1 2026 AI 元启版 10 月 20 日首销，25999 元起

内娱声明还有可信度吗？

文森特晒训练照并引用孙子名言：在混乱中也有机会