8月28日,OpenAI与Anthropic宣布,双方近期对彼此的AI模型进行了评估,旨在发现各自测试中可能忽视的问题。两家公司在博客上透露,今年夏季,它们针对对方公开的AI模型进行了安全性、幻觉倾向及“失准”问题(即模型未按预期运行)的测试。这些评估在OpenAI发布GPT-5和Anthropic发布Opus 4.1之前完成。值得注意的是,Anthropic由前OpenAI员工创立。