美团发布了名为LongCat的开源大语言模型,该模型采用了创新的混合专家(MoE)架构。其核心版本LongCat-Flash拥有560亿参数,推理速度超过每秒100个标记。通过多阶段训练管道和优化策略,LongCat在训练稳定性、扩展性及计算效率方面均表现出色。在多项基准测试中,LongCat的性能与业界领先模型相当,尤其在MMLU、数学推理和通用推理领域表现突出。美团表示,希望通过开源LongCat,推动AI技术发展,并为开发者提供强大的工具。