Loading...

如何设计一个AI Agent系统
对于在现有产品基础上引入AI的场景,由于准确率可能还不够完美,需要采用"人机协同"的过渡策略,保留原有交互作为兜底,让用户可以在AI建议和传统操作间灵活切换,逐步建立对AI的信任。真正有价值的知识包含多个层次:显性的文档规范、隐性的专家经验、平台沉淀的案例库、实际操作中发现的边界情况。架构设计时,只有理解业务才能判断哪些环节需要智能、哪些需要确定性,在Prompt工程中,业务理解更是核心:什么是正确的输出格式,哪些边界情况需要特别说明,对业务理解的深度决定了一个Agent架构的潜力。

ICCV25 | 淘宝人脸吸引力预测算法FPEM
在淘宝,每天有数十万的直播间存在美颜需求,人脸的吸引力已成为影响直播用户整体视觉体验的核心变量,通过实时监测确保美颜效果的稳定性,对保障主播和用户的双端体验至关重要。为更好地适配淘宝直播平台的数据场景,我们基于淘宝直播平台的视频,构建了大规模直播场景下的人脸吸引力预测数据集LiveBeauty,包含10,000张图像,涵盖不同美颜算法参数、光照条件、面部表情,并通过专业的主观标注,获取200,000个对应的主观分数的标注数据。从表中可以看出,先前的数据集闭源的较多,开源的数据集则规模偏小。

AI+时代工程师的空间在哪儿——从范式演进看技术机会
本文探讨了AI时代工程师的核心价值与技术机会,指出随着大语言模型(LLM)从GPT-1演进至Agent智能体阶段,工程师的关键角色已从“调用模型”转向“深度挖掘模型潜力”的系统性工程实践。作者通过四阶段范式演进梳理技术脉络指出模型决定智能下限,而工程师对业务场景的拆解能力、系统架构设计能力(流程编排/工具抽象/记忆机制/评测体系)才是决定产品体验上限的关键——AI工程师正从“炼丹师”进化为“系统架构师”与“场景定义者”。前言随着⼤语⾔模型(LLM)从GPT-1进化到如今的Agent智能体时代,我们往

淘宝订单列表体验优化实践
随着闪购业务的上线,订单列表新增一级tab类型,其包含了全部订单、购物、闪购、飞猪等等不同业务场景,支持根据用户的行动轨迹以及订单状态,通过算法首屏直达指定tab。多tab实例架构对推荐流的原有架构产生了很大的影响,在单实例模式的情况下,由于只有一个实例,所以每次切换tab时,都会去重新构建一个推荐流的view加载到订单列表View上。单实例架构下,例如在全部订单tab下立即付款、确认收货后,当前tab会立即刷新的,并且切换tab时,由于单实例架构的销毁重建机制,待付款列表自然也会拿到最新状态的数据。

AI 无障碍 CR 与自动适配实践:从问题洞察到效果验证
在此基础上,未来我们还计划将方案从当前的Web/DX场景扩展到Native页面:我们会针对iOS/Android等原生技术栈,补充针对控件语义、系统辅助功能(如TalkBack/VoiceOver)以及原生导航模式的规则与示例,并基于现有能力继续演进「AI检测+智能修复」链路,为Native代码提供无障碍问题识别、属性自动补全和改造建议;在丰富的业务场景下,通过持续的技术探索创新突破,给数亿用户提供可靠的交易保障、极致流畅的操作交互以及顺滑的购物体验。

支配树算法原理及鸿蒙工具实践
本文作者灵貎,来自淘天集团-终端平台基础工程团队,团队负责淘宝App基础架构和基础链路业务,致力于通过技术创新和系统优化,打造一个更稳定、更流畅的手机淘宝。_index存储的是strings中的名字index,11673对应的是-subroot-字符串to_node代表的是这条边指向的节点索引,因为内存引用构成是一个有向图,所以还需要知道这条边来自于哪个节点。3.对于⾮根节点n,Dom(n)=n∪(∩Dom(p)),即当前节点n并上所有前驱节点p的⽀配节点的交集。

淘天业务技术2025年度热门文章盘点
涵盖其底层机制(如Token计算、工具调用、Codebase索引与MerkleTree)、提升对话质量的方法(如规则设置、渐进式开发)、实际应用场景(如代码检索、绘图生成、问题排查),并推荐了结合AI的编码最佳实践,包括文档、注释、命名规范和安全合规,旨在帮助不同经验水平的开发者真正把AI工具用好。通过在生产环境长期采集代码执行数据,生成覆盖率报告并集成到开发环境,团队显著降低了代码冗余(如B应用清理71%的代码),提升了系统可维护性,并总结了技术选型、热部署兼容、插件开发等方面的经验与教训。

GenAI输出内容控制的5种设计模式
当前的做法是在prompt中写清楚需要返回的信息的格式,比如是JSON,或者是一些特殊的sql,虽然Anthropic也推荐了这样的做法,但是这个方式不一定能保证结果格式的输出一定能如你所愿,头部的大模型在模型能力上有比较好的调优,可以在更大概率上遵循用户在prompt中约束的指令,但是小一些的模型,在这方面的表现就会比较差,同时不管是头部闭源模型还是一些自己部署的小模型,在输出格式遵循的确定性上,都是有一定的概率;淘宝直播作为全球领先的直播电商平台,正在重新定义人与商品、人与内容的连接方式。

AI工程vs传统工程 —「道法术」中的变与不变
从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在AI工程落地的战场上,我们既未抛弃传统工程的“十八般兵器”,也未盲目迷信AI带来的“新式火器”,而是将二者熔铸为一套既能攻坚克难、又可稳守阵地的复合战法。如果你渴望在真实、高复杂度的业务场景中锤炼AI工程能力,与一群既懂技术又懂业务的伙伴并肩作战,这里将是你理想的舞台。

AI架构师的诞生:AI+传统DDD模式 = 实现开发效率提升75%
根据人工拆解限界上下文部分,从原有me.ele.newretail.contract.v6.domain包下,帮我抽象出商品上下文的类,Repo、Service,类用Domain结尾,Repo用DomainRepo结尾,Service用DomainService结尾,输出成表格,包含方法和属性,就放到当前这个文档最后。从上一步可以看出,AI拆解的限界上下文是基于package结构进行拆分,未能深入分析业务语义,这是AI的薄弱环节,需要人工介入修正。这将成为软件工程的新常态。

天猫超市数据AI实践总结
从知识库概览图中可以看发现,知识库中强依赖知识间的联动,因此每一次修改都需要联动修改很多绑定部分,并且知识库需避免冗余知识,冗余知识会显著增加模型推理相同问题的不确定性和时间,这不是问数所需要的,因此在人工维护的情况下,无疑是巨大维护成本。总结了在构建面向AI的数据知识库中的实践经验,针对数据资产庞杂、语义不统一、维护成本高等问题,提出以“不重构模型、小而精维护、支持灵活扩展”为原则,通过结构化构建指标、实体、属性、表和字段五类知识,并结合图谱召回与Agent框架,实现自然语言到SQL的智能取数。

AI 辅助前端动画开发
AI辅助代码生成在前端领域有两个难点,第一个是DesignToCode(下文检查称D2C),D2C的出发点虽然也是需求文档,但前端拿到的是设计师交付的设计稿,如何将设计软件中的结构化数据映射为准确的前端UI,是目前阶段的一个难点,Pixelator和Figma等团队都在探索。我在Ani平台上看到一个简单的进度条Lottie动画,背景色渐变的动画还挺好看的,我直接录屏交给微动画研发流程,其他物料都没给,AI生成了5步的TodoList,并封装好了动画组件。

从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
我们在前两个版本的时候,Prompt组装,是没有系统性、结构性设计的,这也就导致了过程中出现了一个900多行的超级大的Prompt,它里面各个位置的内容都是比较乱的。其设计理念来源于人类的大脑分区,我们将Agent的逻辑区域分成了:感知区、认知区、表达区、自我评估区、运动区,将不同种类的Act收纳到Area中,让整个架构体系看着更加的清晰,也让相同能力的动作,可以具备相互沟通的可能。单纯的向量数据库检索,不一定能让经验检索变得准确,我们目前正在向图索引的方向探索,让图谱的能力辅助经验的检索与加工。

SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人
高保真、可实时驱动、适用于移动端的3D数字人重建与渲染系统。接收,标志着其在学术与工业界前沿水平的认可。阶段采集策略学习的姿态相关的外表建模仍能⽣成。可动画神经表示以及基于⾼斯表示的⽅案。该工作已被计算机图形学顶级会议。系统对采集到的静态序列和动态序列。淘宝技术—Meta技术团队,淘宝技术—Meta技术团队。我们撰写的针对移动端的⾼保真实。我们提出了针对移动端的⾼保真实。为了尽量减少⽆效⾼斯的冗余计算。所建模的姿态相关的外表建模能够。为移动端数字⼈应⽤提供了可⾏技。姿态相关的外表建模对于跨姿态。

AI编码实践:从Vibe Coding到SDD
动营销等多样化的业务场景,技术团队面临着需求迭代频繁、代码腐化及团队协作度高的问题,如何提升开发效率、保证代码质量、降低维护成本成为我们面临的重要挑战。正是在这样的背景下,我们开始尝试将AI技术融入到日常开发流程中,探索从传统编码到AI辅助编程的转变之路。带着上面的问题,我们开始尝试AgenticCoding模式,通过编写详细的提示词(Prompt),让AI一次性实现整个功能。我们相信,通过持续的探索和实践,一定能找到更适合团队的AI辅助编程模式,进一步提升开发效率和代码质量。

Jimi:打造Java程序员专属的开源ClaudeCode
作为十年Java老鸟,想为Java开源生态贡献绵薄之力,于是便有了本文:https://github.com/Leavesfly/Jimi。本团队主要负责淘宝行业&淘特C端链路的研发工作,包含:搜索推荐、互动游戏、导购、交易等基础服务,在这里可以探索更多AI场景,包含AI代码生成以及用Agent将电商各种场景重新做一遍的机会。首先是坚实的地基(基础设施),然后是稳定的骨架(核心引擎),再是灵活的功能模块(Agent和工具),最后是友好的交互界面(UI)。Agent中最火的是什么,AI-Coding;

2025淘宝直播双11花花乐动画实现方案思考&分享
关键的问题就是这个动画曲线如何获取,拿到了AE的源文件,能看到设计师手动拉的动画曲线,但是我们拿不到具体的值,自然也构建不了准确的动画曲线。关键的问题就是这个动画曲线如何获取,拿到了AE的源文件,能看到设计师手动拉的动画曲线,但是我们拿不到具体的值,自然也构建不了准确的动画曲线。好在这里有具体的值,我们可以反推公式,不过目前还有个更简单的方案,即直接把每一帧的值带入每一帧的渲染,类似算法中“打表”的方式来执行这个动画曲线。一旦首屏的花渲染完成,开始预加载升级时要用的素材和下个等级的素材。

复杂任务AI处理实践:淘宝工程师的实战手记
上游核心表变更时,需要下游逐个查代码确认影响范围。文章总结了一套可复用的方法论——如何将人工操作抽象为"感知-决策-执行"的AI闭环,并通过工单处理、数据治理、基线运维等真实案例,展示从"工具助手"到"智能体"的三种自动化模式。精准:在今年的数据治理中,AI处理了数千张表的治理决策,人工复核了10%高优先级的样本,未发现误删数据的情况,不过发现ai策略过度保守的情况存在。数据治理:查表信息及代码→看血缘关系→读上下游代码→查上下游信息→评估→给出治理方案→输出治理建议JSON。

重构一个类,JVM竟省下2.9G内存?
文章深入分析了原始结构的内存浪费原因,并通过实测对比多种方案,验证了新结构在内存效率和查询性能上的优越性,强调了在大数据量场景下应警惕“通用容器”的隐性成本。正是在这一背景下,我们发现:看似合理的“通用集合嵌套”设计,在十万级商品×万级城市×多标签的规模下,竟成为内存消耗的“沉默杀手”。我们推测,当初的设计者可能是出于“未来扩展性”考虑(例如支持非数字标签),但在当前业务场景下,这种通用性牺牲了巨大的内存效率。在我们的核心业务链路中,存在一个对城市维度下某特定类型商品标签进行动态过滤的关键接口。

AI互动前端开发的思考和实践_
随着AI技术的发展,作者提出一种“规范驱动的AI协同开发”新模式:从“代码复用”转向“规范复用”,即通过制定统一的开发规范(Spec),利用AI按需生成针对具体场景的专用组件。团队在保证业务的同时,以先进的跨端框架和研发模式不断完善自己,打造最极致的体验和工程技术,保障多端设备的适配和稳定运行,并探索端智能等创新机会,通过技术高效驱动业务的良性发展。当AI能够瞬间生成代码时,真正决定交付质量的,不再是某一行语法是否正确,而是我们在需求萌芽之初,是否构建了一套清晰、可演进、可复用的认知框架。

欢迎留下您的脚印