Loading...

97.9%采纳率,胶水编程:业务需求出码最佳实践【天猫AI Coding实践系列】
这是一个典型的中后台业务需求,涉及列表、详情、状态机,复杂度适中但细节不少。它们的独立性体现在——答对任何一个,不保证其他三个也对:Agent可以理解需求但违反了团队禁用某依赖的规矩(缺开发规范),可以守规矩但文件组织混乱(缺代码模式),可以结构规整但踩了内部组件的坑(缺领域知识)。中后台需求虽然千变万化,但复杂度的来源是可枚举的:交互表达(非标布局、多弹窗)、数据逻辑(字段联动、状态流转)、后端对接(接口契约、嵌套结构)、业务规则(跨字段校验、计算逻辑)、异常处理(空状态、超时重试)。

拒绝“感觉有效”:用数据证明 AI Coding 的真实团队价值【天猫AI Coding实践系列】
通常是最后一次提交的commit。由于存在多对多关系(一个Task可能关联多个需求),各维度的汇总值不等于实际总消耗,但这种设计更符合业务分析的需要——产品经理关心的是「这个需求花了多少Token」,而不是「这个Token被几个需求共享」。业界有通用的评测基准(如SWE-bench),但通用基准解决不了具体团队的问题——以我们的中后台前端场景为例,存在多解性(同一需求有多种等价实现)、测试成本高(交互类需求难以自动化验证)、过程盲区(只看结果不看Agent是否查阅了正确资料)等核心差异。

知识基座:让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】
该基座不仅让AI在代码生成、Bug修复和需求分析中能精准理解业务上下文,减少幻觉,还通过持续反馈机制实现知识的动态迭代,使AI随着团队使用不断“进化”,最终成为真正懂业务、能落地的智能研发伙伴,显著提升团队整体效能。内部知识存储按业务域进行物理隔离(通用、某跨境电商、业务域A、业务域D、业务域C、业务域B等),确保各业务线知识独立管理。当前已实现的V1指标包括:召回率(有结果查询占比)、零结果率(无结果查询占比)、平均返回数(每次查询返回条数)、知识召回次数(单条知识被引用频次)。

AI Coding前端实践后的复盘总结
通过实践,团队提炼出“人机协同”的最佳工作流:将AI定位为高效助手而非替代者,强调通过优化提示词(Prompt)、建立前端专属知识库及制定严格的代码审查规范来弥补AI的不足,最终实现研发质量与速度的双重提升,为前端团队规模化引入AI辅助开发提供了可复制的方法论。不需要懂高深的AI原理,只要掌握这些技巧,每个人都能成为AICoding的高效使用者。由于没有指定Agent使用相同组件,而是使用模糊的“保持一致”的描述,导致生成的代码仅仅是模仿了参考组件的样式,不仅生成的页面样式不够还原,Agent还会。

软件为何越做越乱?万字长文讲透软件的“复杂性”
本文通过一个电商系统“限时折扣”功能从快速上线到逐渐演变为复杂黑箱的典型案例,深入剖析了软件系统为何越做越乱的根本原因——复杂性的累积。文章指出,复杂性并非源于重大错误,而是由无数看似合理的小妥协(如随意添加开关、复制逻辑、临时补丁)层层叠加所致,最终导致变更放大、认知负荷加重、未知的未知增多。在此基础上,文章对比了“战术性编程”(追求短期交付速度,忽视设计)与“战略性编程”(以长期可维护性为目标,持续投入10%–20%时间优化架构)的本质差异,并系统阐述了管理复杂性的核心方法。作者强调:真正的开发速度来自

用自然语言替代复杂代码
核心价值在于将高理解成本、难维护的硬编码逻辑,转化为可读性强、修改便捷、开箱即用的AI驱动分析流程,并在开发效率、维护成本、响应速度和业务价值上实现显著提升。天猫技术是阿里巴巴旗下专注于电商场景的综合技术团队,不仅服务于自身电商业务增长,也在不断探索如何用AI、大数据、交互技术赋能行业交易、品牌营销与消费者体验,成为全球领先的品质购物平台和技术引擎。AI平台就像一个"AI能力超市",我们选择合适的Agent,填充参数就能用。这种"能力平台化"的思路,才是AI真正赋能业务的方式。

AI工作流在淘宝交易舆情巡检上的探索与实践
再将相关舆情数据结构化后投喂到AI,最后根据我们自定义的业务规则及波动阈值进行舆情预警并进行消息推送,至此完成巡检部分的工作,当然后续还有舆情归因及复盘反馈的环节,但是这个部分的能力我们还在持续建设中,暂时先不。AI负责发现问题、聚合信息、提供建议,而最终的判断和决策权,始终交给业务同学。,来自淘天集团-交易业务技术团队,本团队专注于下单、支付、物流、服务、逆向退款等核心交易链路的技术团队,我们面向亿万用户致力于打造极致流畅、安全稳定的购物体验,为用户和商家的每一次交易行为保驾护航。

ICLR 2026 | 基于概念蒸馏的生成式视频复原算法Vivid-VR
具体来说,给定一个文本-视频对,我们对源视频施加特定强度的噪声,然后使用T2V基座模型,在文本描述的引导下对噪声视频进行去噪重构。我们采用上述过程生成。在生成式视频复原的新范式下,如何利用强大的T2V基座模型修复低质视频,同时避免基座模型在微调过程中“遗忘”原有的生成能力,是学术界关注的焦点。团队兼顾算法创新与工程应用,为视频生产,直播推流,美颜美化,视频特效互动,视频渲染,视频修复、生成,视频编码,视频传输,视频播放等完整链路提供底层音视频技术,保障视频、语音、图片相关业务的流畅度和音画质体验。

AI Coding思考:从工具提效到范式变革,我们还缺什么?
相关的技术资产,无论是生产资料,还是(软件)产品,既有基于物理真相的关系刻画,又有基于架构抽象的、易于人类理解的逻辑表达——本质上是技术资产及其内在关系的语义化、在线化(企业级软件资产图谱),这是企业全局架构视角面临的挑战,在AI时代的研发提效背景下,这件事情变得更为急迫(决定了公司研发效率方面在未来的竞争力)。比如现在PD使用Web形态VibeCoding工具快速生成产品原型,HR用它快速开发一个文化活动的页面,这些场景下程序员的工作完全被代替了,PD的角色职责也发生了变化,这是质变的。

首届淘宝电商AI挑战赛来了!设350万赛事奖项和千万扶持资源
届时,由淘天、千问大模型等背景的产品技术专家、行业运营专家和知名媒体人等组成的专家评审团,将聚焦。此外,主办方还将为获奖者对接业内大咖、创投机构、政府和产业扶持资源,助力。产品的持续落地,电商人在运营提效和经营增长上会迎来越来越多的可喜变化。近期,由浙江省商务厅指导,淘宝开放平台、千问大模型、阿里云联合举办的。产品市场前景、技术能力、创新性和产品实战效果等维度,选拔出。正在重塑电商经营,也已成为商家重构增长的现实选项。月份结合商家出题的结果同步给进入决赛圈的选手,并在。工具进化、生态共赢、商业新生。

AI真人数字人语音对话性能优化实践总结
原始的导购对话流程,基线数据的链路是"ASR→LLM→TTS&A2BS"的三段式结构:ASR识别结束后发起文本请求,获取请求之后,当达到一定的标点符号截断,才会调用TTS和面部动画生成,回传结果之后,再播放音频和面部动画。对于用户而言,最关心的是问完问题之后,多久能够得到数字人的回复。对于整体解决方案,完整的性能监控打点机制是优化的基础,具体实施时,一方面,我们用更合适的模型,端测针对新模型增加输入输出链路,另一方面,端测针对A2BS进行窗口累积和语音表情同步的处理,保障链路的正确性。

从应用架构的视角看退小宝AI助手落地现状
本文从应用架构视角系统分析了AI(尤其是LLM)在实际业务中落地的现状与挑战,以“退小宝AI助手”为典型案例,对比传统Web应用与AI应用在响应时间、输入灵活性、准确性、可用性、成本及嵌入适配性等维度的根本差异,指出AI原生应用(而非简单在旧系统中嵌入AI模块)是更可行路径;进而梳理了AI应用的典型架构演进:从简单调用模型API,到ReActAgent范式,再到以Workflow(工作流)为核心的低代码图结构实现;深入解析了LLM、Message、Tool、RAG、上下文(State)、MCP、微调、可观

设计模式Trustworthy Generation:提升RAG信赖度
在面向一些复杂问题的回答时,可能会检索召回比较多的doc,同时最终结论生成的内容中每个段落,都是结合了多个doc的内容来关联生成的,因此还是会存在模型会生成逻辑错误(不同的内容编排形式可能就会引入重大事实差异)或事实错误(参考的doc太多,上下文一长,容易自我发挥);在我们设计和应用RAG时候的初衷是,为当前用户的query补充相关联的高质量信息,但是有时候随着事情的发展,会有一些事与愿违的情况发生,没有帮助降低模型幻觉,反而助长了模型幻觉产生的可能;:会增加系统复杂度与计算开销,并存在误过滤风险;

【AI Coding】借助cursor实现业务需求全栈交付实践
所以全栈交付的过程中,还是建议去多了解技术栈的基础知识,再搭配AI工具,会更加的游刃有余。到这里,大概明确了问题原因,CSR链路下,在预发环境下,受Feeds接口请求耗时的影响,预加载会失效,只有等待用户翻页,才会继续请求,SSR链路下,没问题。因为首页需要商品去重,首页单品返渠道卡片Feeds的请求和主页Feeds存在时序,cursor一开始实现时,采用双状态:page1Loaded、page2Loaded来分别记录页面的加载状态,但综合来开,最后对状态的使用时机,单个状态即可满足要求,让AI帮忙优化。

一次大文件处理性能优化实录
过去一年主导了多个高价值项目,包括:支撑618、双11、春晚等亿级流量洪峰、构建业界领先的全网价格力体系、承接淘宝全面接入微信支付、搭建集团最大的AI创新平台-ideaLAB,支撑淘宝秒杀等创新业务的高速增长。四大主线,系统性地展示了从初始637秒(Java)到最终3.2秒(新架构)的百倍级优化过程,并提炼出可复用的通用原则(如大缓冲区、字节操作、零分配、原生系统调用等)及进阶解耦架构(IO进程+Processor进程)。通过设置大Socket发送缓冲区(1-16MB)和批量发送,

淘天集团自营技术运营算法团队4年2次荣膺 INFORMS“杰出实践奖”决选荣誉:以策略正则化突破DRL在库存管理中的落地瓶颈
相比之下,本文在充分进行超参数调优的前提下,对DS与传统DRL进行了公平而严格的比较。数据效用:在电商中可用于预测与决策的数据其实十分有限,原因在于经营目标、竞争格局、营销节奏和运营策略快速变化,使大量历史数据失去对未来的预测与泛化能力,因此依赖“大数据+大模型+大算力”的方法往往难以奏效;数字世界与物理世界的超级AI”这一战略愿景,聚焦构建可解释、可泛化、可信赖的智能决策基础设施,在大模型、运筹优化、强化学习等方向不断突破算法边界,加速推动前沿技术向产业级应用的深度赋能。

【淘宝直播数字人互动LLM】告别AI感:基于真人ASR数据的拟人化探索
为了进一步简化线上链路,笔者在前置工作的基础上设计了一个拟人化奖励模型,加入到原有强化学习训练链路中,训练得到对应的拟人化生成模型。传统的方法通过提示词工程让能力更大的模型(Gemini,DeepSeek-r1)自主生成的一定风格的回复,后续基于此数据进行微调,模型自身带有的AI感仍然无法去除。在此基础上,设计拟人化判定模型,将其融入到GRPO训练框架中,进一步简化了整体链路,模型无需改写就可以直接生成拟人化的回复。拟人化的效果很大程度取决于训练数据,无论是网上还是书籍里的数据,其实拟人化的风格都很弱。

Agentic Coding场景下基于职责分离的上下文管理思路分享
需要注意的是部分⽼项⽬或不规范项⽬中可能会存在编码不⼀致的问题,例如utf8和gbk混⽤的情况,如果未使⽤准确的编码读取⽂件内容可能导致注释、⾮英⽂常量⽆法被模型识别导致⽆法正确理解“业务含义”(代码逻辑之外的信息)。在aonecopilot中使⽤了类似的思路,⼤约只会保留最近250次的操作内容,可以右键打开devtools来查看交互的对话内容。输⼊的token也是会计费的,⽤块⼯具读取完整的⽂件内容⽐直接读取完整的⽂件内容会增加多次重复上下⽂的调⽤,导致成本的上升。记得刚刚关闭的⽂件中的关键信息。

如何设计一个AI Agent系统
对于在现有产品基础上引入AI的场景,由于准确率可能还不够完美,需要采用"人机协同"的过渡策略,保留原有交互作为兜底,让用户可以在AI建议和传统操作间灵活切换,逐步建立对AI的信任。真正有价值的知识包含多个层次:显性的文档规范、隐性的专家经验、平台沉淀的案例库、实际操作中发现的边界情况。架构设计时,只有理解业务才能判断哪些环节需要智能、哪些需要确定性,在Prompt工程中,业务理解更是核心:什么是正确的输出格式,哪些边界情况需要特别说明,对业务理解的深度决定了一个Agent架构的潜力。

ICCV25 | 淘宝人脸吸引力预测算法FPEM
在淘宝,每天有数十万的直播间存在美颜需求,人脸的吸引力已成为影响直播用户整体视觉体验的核心变量,通过实时监测确保美颜效果的稳定性,对保障主播和用户的双端体验至关重要。为更好地适配淘宝直播平台的数据场景,我们基于淘宝直播平台的视频,构建了大规模直播场景下的人脸吸引力预测数据集LiveBeauty,包含10,000张图像,涵盖不同美颜算法参数、光照条件、面部表情,并通过专业的主观标注,获取200,000个对应的主观分数的标注数据。从表中可以看出,先前的数据集闭源的较多,开源的数据集则规模偏小。

欢迎留下您的脚印