全球闲置算力训个模型 性能媲美R1
1 周前

全球首个分布式RL训练模型INTELLECT-2正式发布,该模型通过整合全球闲置或分散的计算资源完成强化学习训练,显著降低了训练成本。其性能可与DeepSeek-R1相媲美,在AI领域引起广泛关注。这一创新不仅展现了RL训练的潜力,也为未来AI模型的高效训练开辟了新路径。