北京大学彭宇新团队在细粒度多模态大模型上取得系列进展
2 周前

多模态大模型虽在通用任务中表现优异,却缺乏细粒度感知能力。如何兼顾开域泛化能力与细粒度感知能力,是将大模型从聊天助手拓展至自动驾驶、具身智能、医疗影像、工业制造等实际应用领域的关键。针对此问题,北京大学王选计算机研究所彭宇新教授团队近期取得重要进展,包括研发并开源首个细粒度多模态大模型Finedefics,以及发表首篇相关综述论文。