Loading...
LongCat-Flash-Lite是一款拥有685亿参数,每次推理仅激活29亿~45亿参数的轻量化MoE模型。通过将超过300亿参数高效用于嵌入层,LongCat-Flash-Lite不仅超越了参数量等效的MoE基线模型,还在与同规模现有模型的对比中展现出卓越的竞争力,尤其在智能体与代码领域表现突出。
2025美团技术年货,「马」上到来
值此马年春节来临之际,我们精选了过去一年美团技术团队微信公众号发布的40多篇优质技术文章,精心汇编成一本500多页的电子书。谨以此作为一份特别的新年礼物,献给每一位热爱技术、持续探索的同学。
多维创新打造强泛化智能体模型,LongCat-Flash-Thinking-2601技术报告发布
LongCat-Flash-Thinking-2601模型创新性地打造了“重思考模式”,通过并行推理与深度总结,实现推理宽度与深度的协同扩展,显著提升复杂交互与多步规划任务中的表现。
美团 EvoCUA 刷新开源 SOTA,会用电脑还会持续进化的智能体!
美团技术团队推出了EvoCUA模型并在Github、Huggingface开源,通过构建可验证数据合成引擎与十万级并发的交互沙盒,将训练范式从传统的“静态轨迹模仿”转变为高效的“经验进化学习”。
美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA!
美团LongCat团队正式对外发布并开源LongCat-Flash-Thinking-2601。作为已发布的LongCat-Flash-Thinking模型的升级版,LongCat-Flash-Thinking-2601在AgenticSearch(智能体搜索)、AgenticToolUse(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,均达到开源模型SOTA水平。
KuiTest:基于大模型通识的 UI 交互遍历测试
美团质效技术部联合复旦大学周扬帆教授团队推出KuiTest——零规则UI功能性异常测试工具。KuiTest通过将“人类预期”直接用作TestOracle,解决了长期以来UI测试Oracle泛化性差的自动化痛点。实验表明,KuiTest异常召回率达86%,误报率仅1.2%,已在执行21万+测试用例,发现百余例有效缺陷,大幅降低人工成本并提升测试覆盖率。
AAAI 2026 | 美团技术团队学术论文精选
AAAI是人工智能领域顶级的国际学术会议,本文精选了美团技术团队被收录的8篇学术论文(附下载链接),覆盖大模型推理、 退火策略、过程奖励模型、强化学习、视觉文本渲染等多个技术领域,希望这些论文能对大家有所帮助或启发。
2025 | 美团技术团队热门技术文章汇总
感谢这一路上,每一位伙伴的并肩前行与坚定支持。今年,美团技术团队在持续深耕中涌现出不少值得分享的实践与开源产品&服务。我们从中精选了18篇具有代表性的技术文章,内容涵盖大模型开源、研发技能、产品服务三大方向。
美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现
大模型剪枝新范式:先浓缩,再剪枝——DenoiseRotator技术解读
美团LongCatInteraction团队联合上海交通大学听觉认知与计算声学实验室,以及香港科技大学的研究者,共同完成了大模型剪枝方法的创新研究,提出了名为DenoiseRotator的新技术。通过首先对参数矩阵进行变换,“将知识和推理能力浓缩到由少量参数组成的子网络内”,“再裁剪掉子网络外的参数”,实现了大模型剪枝的新范式。
