​OpenAI 与 Anthropic 进行首次合作测试,推动 AI 安全标准
2025-08-28

OpenAI与Anthropic首次联手测试AI模型,旨在识别安全盲点并加强行业协作。测试显示,Anthropic模型在不确定时倾向于拒绝回答,而OpenAI模型虽回答更多,但幻觉率较高。双方还关注AI模型的“谄媚”行为,并呼吁更多实验室加入,共同提升AI安全标准。