Loading...
本文介绍了美团技术团队在国际顶会ACL2025中发表的8篇论文,研究方向覆盖了生成式检索算法、多目标偏好对齐训练、富文本图像理解、搜索词推荐、跨语言迁移能力、多模态数学推理、第三人称任务等技术领域,希望相关研究能给同学们带来一些帮助或启发。
美团开源OIBench与CoreCodeBench:揭示大模型编程能力的真实水平
Meituan-M17团队联合上海交大等机构,分别推出了OIBench(聚焦高区分度算法题评测)与CoreCodeBench(聚焦多场景工程级代码基准)两大数据集,旨在揭示大模型编程能力真实水平,这两大数据集已分别在GitHub和Huggingface上进行开源。
可信实验白皮书系列07:高阶实验工具
本文系《可信实验白皮书》系列的第七篇文章。上一篇我们重点介绍了观察性研究,内容主要包括合成控制法、匹配方法、CausalImpact等几个方面。针对单次实验功效不足、假阳性、策略调优等实验中面临的问题,本篇我们来介绍几个高阶实验工具,重点解读了统合分析、多重比较,同时还有一些拓展与展望。
开源 | MeiGen-MultiTalk:基于单张照片实现多人互动演绎
近日,美团推出了音频驱动的多人对话视频生成框架MultiTalk,并在GitHub上开源,首创L-RoPE绑定技术,通过标签旋转位置编码精准解决多音频流与人物错位难题。该框架创新性地采用局部参数训练+多任务学习策略,在保留复杂动作指令跟随能力的同时,实现自适应动态人物定位。只需输入多人音频流、参考图像和文本提示,即可生成口型精准同步、肢体自然的交互视频,可支持影视制作、直播电商等场景的工具升级。
JDK高版本特性总结与ZGC实践
美团信息安全技术团队核心服务升级JDK17后,性能与稳定性大幅提升,机器成本降低了10%。高版本JDK与ZGC技术令人惊艳,且JavaAISDK最低支持JDK17。本文总结了JDK17的主要特性,然后重点分享了JDK17+ZGC在安全领域的一些实践,希望能对大家有所帮助或启发。
可信实验白皮书系列06:观察性研究
本文系《可信实验白皮书》系列的第六篇文章,上一篇我们介绍了准实验,然后重点介绍了双重差分法,包括概述、评估原理及美团的一些实践案例。本篇重点介绍了观察性研究,内容主要包括合成控制法、匹配方法、CausalImpact等几个方面。
可信实验白皮书系列05:准实验
本文系《可信实验白皮书》系列的第五篇文章,上一篇我们围绕随机轮转实验展开,内容主要包括抛硬币随机轮转、完全随机轮转、配对随机轮转等几个实验方法的介绍。本篇我们会介绍准实验,然后会重点介绍双重差分法,包括概述、评估原理及美团的一些实践案例。
可信实验白皮书系列04:随机轮转实验
本文系《可信实验白皮书》系列的第四篇文章,在上一篇我们将重点介绍随机对照实验相关的一些基础知识,以及提高实验功效的一些常见方法。本篇我们将围绕随机轮转实验展开,内容主要包括抛硬币随机轮转、完全随机轮转、配对随机轮转等几个实验的介绍。
可信实验白皮书系列03:随机对照实验
本文系《可信实验白皮书》系列的第三篇文章,第一篇文章我们介绍了为什么要写AB实验白皮书,第二篇文章讲解了AB实验的理论原理及其背后的统计学基础。本篇我们将重点介绍随机对照实验相关的一些基础知识,以及提高实验功效的一些常见方法。
可信实验白皮书系列02:AB实验基础
在上一篇文章中,我们详细阐述了AB实验的概念与其价值,并结合美团的实际情况,探讨了AB实验中常见的挑战及建设经验。本篇作为可信实验白皮书系列的第二章,将重点讲解AB实验的理论原理及其背后的统计学基础。