OpenAI 发布AI 健康系统基础评测体系 HealthBench
2025-05-14

OpenAI近日发布AI健康系统评估标准HealthBench,该体系由262名全球60国医生共建,包含5000个真实健康对话及48562个评分标准,可评测大模型医疗水准。OpenAI用此体系测试了O3、Gemini 2.5 Pro等模型,O3表现最佳。