Loading...

LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型
SGLang团队是业界专注于大模型推理系统优化的技术团队,提供并维护大模型推理的开源框架SGLang。近期,美团M17团队与SGLang团队一起合作,共同实现了LongCat-Flash模型在SGLang上的优化。

美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
我们正式发布LongCat-Flash-Chat,并同步开源。LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数560B,激活参数18.6B~31.3B(平均27B),实现了计算效率与性能的双重优化。

美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的“听话”能力
针对大模型知识推理能力与指令遵循能力存在表现差异的现象,为推进指令遵循能力的系统化研究与精准评估,美团M17团队推出全新评测基准Meeseeks,并在GitHub、Huggingface、魔搭社区等开源平台上线。

可信实验白皮书系列08:开放式分析引擎 | 附PDF合集
本篇为《可信实验白皮书》系列的最后一篇内容,主要分享了AB实验分析方法库在美团的实践。同时,我们也为大家准备了一份系列全集的PDF文档,希望能够帮助到更多从事AB实验工作的同学们。

美团智能头盔研发实践系列01:硬件设计篇
本文系《美团智能头盔研发实践》系列的第一篇文章,聚焦硬件设计维度。针对外卖骑手传统头盔佩戴体验不佳等痛点,从安全保障、体验优化、效率提升三大方向切入,详细解析安全防护、多传感器预警、通风减重、长效续航、音频降噪、工艺控制等关键技术,并提炼研发过程中行之有效的设计经验。

美团智能头盔研发实践系列02:软件功能篇
本文系《美团智能头盔研发实践系列》的第二篇文章,围绕智能头盔如何通过主动安全和被动安全相结合的方式有效保护骑手,主要包括智能头盔骑行通话质量强化、智能语音助手、碰撞摔倒监控等三项软件能力。

联合营销生态下的广告机制设计与实践
即时零售行业蓬勃发展,在此生态下美团零售广告成为助力零售商家和品牌商扩大生意规模的重要驱动力。文章首先介绍了在全新业务模式“联合营销”场景下,首创的多协同方参竞拍卖机制算法——“集资拍卖”,然后梳理了集资拍卖在美团的技术发展路径和实践,围绕规则化集资拍卖、模型化集资拍卖、整体集资拍卖进行了展开,最后是一些总结,希望能对大家有所帮助或启发。

ACL 2025 | 美团技术团队论文精选
本文介绍了美团技术团队在国际顶会ACL2025中发表的8篇论文,研究方向覆盖了生成式检索算法、多目标偏好对齐训练、富文本图像理解、搜索词推荐、跨语言迁移能力、多模态数学推理、第三人称任务等技术领域,希望相关研究能给同学们带来一些帮助或启发。

美团开源OIBench与CoreCodeBench:揭示大模型编程能力的真实水平
Meituan-M17团队联合上海交大等机构,分别推出了OIBench(聚焦高区分度算法题评测)与CoreCodeBench(聚焦多场景工程级代码基准)两大数据集,旨在揭示大模型编程能力真实水平,这两大数据集已分别在GitHub和Huggingface上进行开源。

可信实验白皮书系列07:高阶实验工具
本文系《可信实验白皮书》系列的第七篇文章。上一篇我们重点介绍了观察性研究,内容主要包括合成控制法、匹配方法、CausalImpact等几个方面。针对单次实验功效不足、假阳性、策略调优等实验中面临的问题,本篇我们来介绍几个高阶实验工具,重点解读了统合分析、多重比较,同时还有一些拓展与展望。

欢迎留下您的脚印