Loading...

AI工作流在淘宝交易舆情巡检上的探索与实践
再将相关舆情数据结构化后投喂到AI,最后根据我们自定义的业务规则及波动阈值进行舆情预警并进行消息推送,至此完成巡检部分的工作,当然后续还有舆情归因及复盘反馈的环节,但是这个部分的能力我们还在持续建设中,暂时先不。AI负责发现问题、聚合信息、提供建议,而最终的判断和决策权,始终交给业务同学。,来自淘天集团-交易业务技术团队,本团队专注于下单、支付、物流、服务、逆向退款等核心交易链路的技术团队,我们面向亿万用户致力于打造极致流畅、安全稳定的购物体验,为用户和商家的每一次交易行为保驾护航。

ICLR 2026 | 基于概念蒸馏的生成式视频复原算法Vivid-VR
具体来说,给定一个文本-视频对,我们对源视频施加特定强度的噪声,然后使用T2V基座模型,在文本描述的引导下对噪声视频进行去噪重构。我们采用上述过程生成。在生成式视频复原的新范式下,如何利用强大的T2V基座模型修复低质视频,同时避免基座模型在微调过程中“遗忘”原有的生成能力,是学术界关注的焦点。团队兼顾算法创新与工程应用,为视频生产,直播推流,美颜美化,视频特效互动,视频渲染,视频修复、生成,视频编码,视频传输,视频播放等完整链路提供底层音视频技术,保障视频、语音、图片相关业务的流畅度和音画质体验。

AI Coding思考:从工具提效到范式变革,我们还缺什么?
相关的技术资产,无论是生产资料,还是(软件)产品,既有基于物理真相的关系刻画,又有基于架构抽象的、易于人类理解的逻辑表达——本质上是技术资产及其内在关系的语义化、在线化(企业级软件资产图谱),这是企业全局架构视角面临的挑战,在AI时代的研发提效背景下,这件事情变得更为急迫(决定了公司研发效率方面在未来的竞争力)。比如现在PD使用Web形态VibeCoding工具快速生成产品原型,HR用它快速开发一个文化活动的页面,这些场景下程序员的工作完全被代替了,PD的角色职责也发生了变化,这是质变的。

首届淘宝电商AI挑战赛来了!设350万赛事奖项和千万扶持资源
届时,由淘天、千问大模型等背景的产品技术专家、行业运营专家和知名媒体人等组成的专家评审团,将聚焦。此外,主办方还将为获奖者对接业内大咖、创投机构、政府和产业扶持资源,助力。产品的持续落地,电商人在运营提效和经营增长上会迎来越来越多的可喜变化。近期,由浙江省商务厅指导,淘宝开放平台、千问大模型、阿里云联合举办的。产品市场前景、技术能力、创新性和产品实战效果等维度,选拔出。正在重塑电商经营,也已成为商家重构增长的现实选项。月份结合商家出题的结果同步给进入决赛圈的选手,并在。工具进化、生态共赢、商业新生。

AI真人数字人语音对话性能优化实践总结
原始的导购对话流程,基线数据的链路是"ASR→LLM→TTS&A2BS"的三段式结构:ASR识别结束后发起文本请求,获取请求之后,当达到一定的标点符号截断,才会调用TTS和面部动画生成,回传结果之后,再播放音频和面部动画。对于用户而言,最关心的是问完问题之后,多久能够得到数字人的回复。对于整体解决方案,完整的性能监控打点机制是优化的基础,具体实施时,一方面,我们用更合适的模型,端测针对新模型增加输入输出链路,另一方面,端测针对A2BS进行窗口累积和语音表情同步的处理,保障链路的正确性。

从应用架构的视角看退小宝AI助手落地现状
本文从应用架构视角系统分析了AI(尤其是LLM)在实际业务中落地的现状与挑战,以“退小宝AI助手”为典型案例,对比传统Web应用与AI应用在响应时间、输入灵活性、准确性、可用性、成本及嵌入适配性等维度的根本差异,指出AI原生应用(而非简单在旧系统中嵌入AI模块)是更可行路径;进而梳理了AI应用的典型架构演进:从简单调用模型API,到ReActAgent范式,再到以Workflow(工作流)为核心的低代码图结构实现;深入解析了LLM、Message、Tool、RAG、上下文(State)、MCP、微调、可观

设计模式Trustworthy Generation:提升RAG信赖度
在面向一些复杂问题的回答时,可能会检索召回比较多的doc,同时最终结论生成的内容中每个段落,都是结合了多个doc的内容来关联生成的,因此还是会存在模型会生成逻辑错误(不同的内容编排形式可能就会引入重大事实差异)或事实错误(参考的doc太多,上下文一长,容易自我发挥);在我们设计和应用RAG时候的初衷是,为当前用户的query补充相关联的高质量信息,但是有时候随着事情的发展,会有一些事与愿违的情况发生,没有帮助降低模型幻觉,反而助长了模型幻觉产生的可能;:会增加系统复杂度与计算开销,并存在误过滤风险;

【AI Coding】借助cursor实现业务需求全栈交付实践
所以全栈交付的过程中,还是建议去多了解技术栈的基础知识,再搭配AI工具,会更加的游刃有余。到这里,大概明确了问题原因,CSR链路下,在预发环境下,受Feeds接口请求耗时的影响,预加载会失效,只有等待用户翻页,才会继续请求,SSR链路下,没问题。因为首页需要商品去重,首页单品返渠道卡片Feeds的请求和主页Feeds存在时序,cursor一开始实现时,采用双状态:page1Loaded、page2Loaded来分别记录页面的加载状态,但综合来开,最后对状态的使用时机,单个状态即可满足要求,让AI帮忙优化。

一次大文件处理性能优化实录
过去一年主导了多个高价值项目,包括:支撑618、双11、春晚等亿级流量洪峰、构建业界领先的全网价格力体系、承接淘宝全面接入微信支付、搭建集团最大的AI创新平台-ideaLAB,支撑淘宝秒杀等创新业务的高速增长。四大主线,系统性地展示了从初始637秒(Java)到最终3.2秒(新架构)的百倍级优化过程,并提炼出可复用的通用原则(如大缓冲区、字节操作、零分配、原生系统调用等)及进阶解耦架构(IO进程+Processor进程)。通过设置大Socket发送缓冲区(1-16MB)和批量发送,

淘天集团自营技术运营算法团队4年2次荣膺 INFORMS“杰出实践奖”决选荣誉:以策略正则化突破DRL在库存管理中的落地瓶颈
相比之下,本文在充分进行超参数调优的前提下,对DS与传统DRL进行了公平而严格的比较。数据效用:在电商中可用于预测与决策的数据其实十分有限,原因在于经营目标、竞争格局、营销节奏和运营策略快速变化,使大量历史数据失去对未来的预测与泛化能力,因此依赖“大数据+大模型+大算力”的方法往往难以奏效;数字世界与物理世界的超级AI”这一战略愿景,聚焦构建可解释、可泛化、可信赖的智能决策基础设施,在大模型、运筹优化、强化学习等方向不断突破算法边界,加速推动前沿技术向产业级应用的深度赋能。

【淘宝直播数字人互动LLM】告别AI感:基于真人ASR数据的拟人化探索
为了进一步简化线上链路,笔者在前置工作的基础上设计了一个拟人化奖励模型,加入到原有强化学习训练链路中,训练得到对应的拟人化生成模型。传统的方法通过提示词工程让能力更大的模型(Gemini,DeepSeek-r1)自主生成的一定风格的回复,后续基于此数据进行微调,模型自身带有的AI感仍然无法去除。在此基础上,设计拟人化判定模型,将其融入到GRPO训练框架中,进一步简化了整体链路,模型无需改写就可以直接生成拟人化的回复。拟人化的效果很大程度取决于训练数据,无论是网上还是书籍里的数据,其实拟人化的风格都很弱。

Agentic Coding场景下基于职责分离的上下文管理思路分享
需要注意的是部分⽼项⽬或不规范项⽬中可能会存在编码不⼀致的问题,例如utf8和gbk混⽤的情况,如果未使⽤准确的编码读取⽂件内容可能导致注释、⾮英⽂常量⽆法被模型识别导致⽆法正确理解“业务含义”(代码逻辑之外的信息)。在aonecopilot中使⽤了类似的思路,⼤约只会保留最近250次的操作内容,可以右键打开devtools来查看交互的对话内容。输⼊的token也是会计费的,⽤块⼯具读取完整的⽂件内容⽐直接读取完整的⽂件内容会增加多次重复上下⽂的调⽤,导致成本的上升。记得刚刚关闭的⽂件中的关键信息。

如何设计一个AI Agent系统
对于在现有产品基础上引入AI的场景,由于准确率可能还不够完美,需要采用"人机协同"的过渡策略,保留原有交互作为兜底,让用户可以在AI建议和传统操作间灵活切换,逐步建立对AI的信任。真正有价值的知识包含多个层次:显性的文档规范、隐性的专家经验、平台沉淀的案例库、实际操作中发现的边界情况。架构设计时,只有理解业务才能判断哪些环节需要智能、哪些需要确定性,在Prompt工程中,业务理解更是核心:什么是正确的输出格式,哪些边界情况需要特别说明,对业务理解的深度决定了一个Agent架构的潜力。

ICCV25 | 淘宝人脸吸引力预测算法FPEM
在淘宝,每天有数十万的直播间存在美颜需求,人脸的吸引力已成为影响直播用户整体视觉体验的核心变量,通过实时监测确保美颜效果的稳定性,对保障主播和用户的双端体验至关重要。为更好地适配淘宝直播平台的数据场景,我们基于淘宝直播平台的视频,构建了大规模直播场景下的人脸吸引力预测数据集LiveBeauty,包含10,000张图像,涵盖不同美颜算法参数、光照条件、面部表情,并通过专业的主观标注,获取200,000个对应的主观分数的标注数据。从表中可以看出,先前的数据集闭源的较多,开源的数据集则规模偏小。

AI+时代工程师的空间在哪儿——从范式演进看技术机会
本文探讨了AI时代工程师的核心价值与技术机会,指出随着大语言模型(LLM)从GPT-1演进至Agent智能体阶段,工程师的关键角色已从“调用模型”转向“深度挖掘模型潜力”的系统性工程实践。作者通过四阶段范式演进梳理技术脉络指出模型决定智能下限,而工程师对业务场景的拆解能力、系统架构设计能力(流程编排/工具抽象/记忆机制/评测体系)才是决定产品体验上限的关键——AI工程师正从“炼丹师”进化为“系统架构师”与“场景定义者”。前言随着⼤语⾔模型(LLM)从GPT-1进化到如今的Agent智能体时代,我们往

淘宝订单列表体验优化实践
随着闪购业务的上线,订单列表新增一级tab类型,其包含了全部订单、购物、闪购、飞猪等等不同业务场景,支持根据用户的行动轨迹以及订单状态,通过算法首屏直达指定tab。多tab实例架构对推荐流的原有架构产生了很大的影响,在单实例模式的情况下,由于只有一个实例,所以每次切换tab时,都会去重新构建一个推荐流的view加载到订单列表View上。单实例架构下,例如在全部订单tab下立即付款、确认收货后,当前tab会立即刷新的,并且切换tab时,由于单实例架构的销毁重建机制,待付款列表自然也会拿到最新状态的数据。

AI 无障碍 CR 与自动适配实践:从问题洞察到效果验证
在此基础上,未来我们还计划将方案从当前的Web/DX场景扩展到Native页面:我们会针对iOS/Android等原生技术栈,补充针对控件语义、系统辅助功能(如TalkBack/VoiceOver)以及原生导航模式的规则与示例,并基于现有能力继续演进「AI检测+智能修复」链路,为Native代码提供无障碍问题识别、属性自动补全和改造建议;在丰富的业务场景下,通过持续的技术探索创新突破,给数亿用户提供可靠的交易保障、极致流畅的操作交互以及顺滑的购物体验。

<span class=“js_title_inner“>支配树算法原理及鸿蒙工具实践</span>
本文作者灵貎,来自淘天集团-终端平台基础工程团队,团队负责淘宝App基础架构和基础链路业务,致力于通过技术创新和系统优化,打造一个更稳定、更流畅的手机淘宝。_index存储的是strings中的名字index,11673对应的是-subroot-字符串to_node代表的是这条边指向的节点索引,因为内存引用构成是一个有向图,所以还需要知道这条边来自于哪个节点。3.对于⾮根节点n,Dom(n)=n∪(∩Dom(p)),即当前节点n并上所有前驱节点p的⽀配节点的交集。

支配树算法原理及鸿蒙工具实践
本文作者灵貎,来自淘天集团-终端平台基础工程团队,团队负责淘宝App基础架构和基础链路业务,致力于通过技术创新和系统优化,打造一个更稳定、更流畅的手机淘宝。_index存储的是strings中的名字index,11673对应的是-subroot-字符串to_node代表的是这条边指向的节点索引,因为内存引用构成是一个有向图,所以还需要知道这条边来自于哪个节点。3.对于⾮根节点n,Dom(n)=n∪(∩Dom(p)),即当前节点n并上所有前驱节点p的⽀配节点的交集。

淘天业务技术2025年度热门文章盘点
涵盖其底层机制(如Token计算、工具调用、Codebase索引与MerkleTree)、提升对话质量的方法(如规则设置、渐进式开发)、实际应用场景(如代码检索、绘图生成、问题排查),并推荐了结合AI的编码最佳实践,包括文档、注释、命名规范和安全合规,旨在帮助不同经验水平的开发者真正把AI工具用好。通过在生产环境长期采集代码执行数据,生成覆盖率报告并集成到开发环境,团队显著降低了代码冗余(如B应用清理71%的代码),提升了系统可维护性,并总结了技术选型、热部署兼容、插件开发等方面的经验与教训。

欢迎留下您的脚印