Loading...

美团 EvoCUA 刷新开源 SOTA,会用电脑还会持续进化的智能体!
美团技术团队推出了EvoCUA模型并在Github、Huggingface开源,通过构建可验证数据合成引擎与十万级并发的交互沙盒,将训练范式从传统的“静态轨迹模仿”转变为高效的“经验进化学习”。

美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA!
美团LongCat团队正式对外发布并开源LongCat-Flash-Thinking-2601。作为已发布的LongCat-Flash-Thinking模型的升级版,LongCat-Flash-Thinking-2601在AgenticSearch(智能体搜索)、AgenticToolUse(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,均达到开源模型SOTA水平。

KuiTest:基于大模型通识的 UI 交互遍历测试
美团质效技术部联合复旦大学周扬帆教授团队推出KuiTest——零规则UI功能性异常测试工具。KuiTest通过将“人类预期”直接用作TestOracle,解决了长期以来UI测试Oracle泛化性差的自动化痛点。实验表明,KuiTest异常召回率达86%,误报率仅1.2%,已在执行21万+测试用例,发现百余例有效缺陷,大幅降低人工成本并提升测试覆盖率。

AAAI 2026 | 美团技术团队学术论文精选
AAAI是人工智能领域顶级的国际学术会议,本文精选了美团技术团队被收录的8篇学术论文(附下载链接),覆盖大模型推理、 退火策略、过程奖励模型、强化学习、视觉文本渲染等多个技术领域,希望这些论文能对大家有所帮助或启发。

2025 | 美团技术团队热门技术文章汇总
感谢这一路上,每一位伙伴的并肩前行与坚定支持。今年,美团技术团队在持续深耕中涌现出不少值得分享的实践与开源产品&服务。我们从中精选了18篇具有代表性的技术文章,内容涵盖大模型开源、研发技能、产品服务三大方向。

美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现


大模型剪枝新范式:先浓缩,再剪枝——DenoiseRotator技术解读
美团LongCatInteraction团队联合上海交通大学听觉认知与计算声学实验室,以及香港科技大学的研究者,共同完成了大模型剪枝方法的创新研究,提出了名为DenoiseRotator的新技术。通过首先对参数矩阵进行变换,“将知识和推理能力浓缩到由少量参数组成的子网络内”,“再裁剪掉子网络外的参数”,实现了大模型剪枝的新范式。

LongCat 上线 AI 生图!精准高效,AI 创作不设限
美团LongCat全新上线 AI生图功能,该功能基于LongCat系列模型「LongCat-Image」打造而成。无论是追求高效出图的普通用户,还是需要精准落地创意的专业创作者,LongCat都以“轻量化模型+流畅体验”,让AI生图真正成为人人可用的创作工具。

美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
美团LongCat团队正式发布并开源LongCat-Image模型,通过高性能模型架构设计、系统性的训练策略和数据工程,以6B参数规模,成功在文生图和图像编辑的核心能力维度上逼近更大尺寸模型效果,为开发者社区与产业界提供了“高性能、低门槛、全开放”的全新选择。

AI Coding与单元测试的协同进化:从验证到驱动
AI生成代码质量难以把控!本文分享来自美团的技术实践,三大策略破解AI编程痛点。单测快速验证逻辑正确性,安全网保护存量代码演进,TDD模式精准传递需求。告别「看起来没问题」的错觉,构建AI时代的代码质量保障体系。

欢迎留下您的脚印