Loading...

从应用架构的视角看退小宝AI助手落地现状
本文从应用架构视角系统分析了AI(尤其是LLM)在实际业务中落地的现状与挑战,以“退小宝AI助手”为典型案例,对比传统Web应用与AI应用在响应时间、输入灵活性、准确性、可用性、成本及嵌入适配性等维度的根本差异,指出AI原生应用(而非简单在旧系统中嵌入AI模块)是更可行路径;进而梳理了AI应用的典型架构演进:从简单调用模型API,到ReActAgent范式,再到以Workflow(工作流)为核心的低代码图结构实现;深入解析了LLM、Message、Tool、RAG、上下文(State)、MCP、微调、可观

设计模式Trustworthy Generation:提升RAG信赖度
在面向一些复杂问题的回答时,可能会检索召回比较多的doc,同时最终结论生成的内容中每个段落,都是结合了多个doc的内容来关联生成的,因此还是会存在模型会生成逻辑错误(不同的内容编排形式可能就会引入重大事实差异)或事实错误(参考的doc太多,上下文一长,容易自我发挥);在我们设计和应用RAG时候的初衷是,为当前用户的query补充相关联的高质量信息,但是有时候随着事情的发展,会有一些事与愿违的情况发生,没有帮助降低模型幻觉,反而助长了模型幻觉产生的可能;:会增加系统复杂度与计算开销,并存在误过滤风险;

【AI Coding】借助cursor实现业务需求全栈交付实践
所以全栈交付的过程中,还是建议去多了解技术栈的基础知识,再搭配AI工具,会更加的游刃有余。到这里,大概明确了问题原因,CSR链路下,在预发环境下,受Feeds接口请求耗时的影响,预加载会失效,只有等待用户翻页,才会继续请求,SSR链路下,没问题。因为首页需要商品去重,首页单品返渠道卡片Feeds的请求和主页Feeds存在时序,cursor一开始实现时,采用双状态:page1Loaded、page2Loaded来分别记录页面的加载状态,但综合来开,最后对状态的使用时机,单个状态即可满足要求,让AI帮忙优化。

一次大文件处理性能优化实录
过去一年主导了多个高价值项目,包括:支撑618、双11、春晚等亿级流量洪峰、构建业界领先的全网价格力体系、承接淘宝全面接入微信支付、搭建集团最大的AI创新平台-ideaLAB,支撑淘宝秒杀等创新业务的高速增长。四大主线,系统性地展示了从初始637秒(Java)到最终3.2秒(新架构)的百倍级优化过程,并提炼出可复用的通用原则(如大缓冲区、字节操作、零分配、原生系统调用等)及进阶解耦架构(IO进程+Processor进程)。通过设置大Socket发送缓冲区(1-16MB)和批量发送,

淘天集团自营技术运营算法团队4年2次荣膺 INFORMS“杰出实践奖”决选荣誉:以策略正则化突破DRL在库存管理中的落地瓶颈
相比之下,本文在充分进行超参数调优的前提下,对DS与传统DRL进行了公平而严格的比较。数据效用:在电商中可用于预测与决策的数据其实十分有限,原因在于经营目标、竞争格局、营销节奏和运营策略快速变化,使大量历史数据失去对未来的预测与泛化能力,因此依赖“大数据+大模型+大算力”的方法往往难以奏效;数字世界与物理世界的超级AI”这一战略愿景,聚焦构建可解释、可泛化、可信赖的智能决策基础设施,在大模型、运筹优化、强化学习等方向不断突破算法边界,加速推动前沿技术向产业级应用的深度赋能。

【淘宝直播数字人互动LLM】告别AI感:基于真人ASR数据的拟人化探索
为了进一步简化线上链路,笔者在前置工作的基础上设计了一个拟人化奖励模型,加入到原有强化学习训练链路中,训练得到对应的拟人化生成模型。传统的方法通过提示词工程让能力更大的模型(Gemini,DeepSeek-r1)自主生成的一定风格的回复,后续基于此数据进行微调,模型自身带有的AI感仍然无法去除。在此基础上,设计拟人化判定模型,将其融入到GRPO训练框架中,进一步简化了整体链路,模型无需改写就可以直接生成拟人化的回复。拟人化的效果很大程度取决于训练数据,无论是网上还是书籍里的数据,其实拟人化的风格都很弱。

Agentic Coding场景下基于职责分离的上下文管理思路分享
需要注意的是部分⽼项⽬或不规范项⽬中可能会存在编码不⼀致的问题,例如utf8和gbk混⽤的情况,如果未使⽤准确的编码读取⽂件内容可能导致注释、⾮英⽂常量⽆法被模型识别导致⽆法正确理解“业务含义”(代码逻辑之外的信息)。在aonecopilot中使⽤了类似的思路,⼤约只会保留最近250次的操作内容,可以右键打开devtools来查看交互的对话内容。输⼊的token也是会计费的,⽤块⼯具读取完整的⽂件内容⽐直接读取完整的⽂件内容会增加多次重复上下⽂的调⽤,导致成本的上升。记得刚刚关闭的⽂件中的关键信息。

如何设计一个AI Agent系统
对于在现有产品基础上引入AI的场景,由于准确率可能还不够完美,需要采用"人机协同"的过渡策略,保留原有交互作为兜底,让用户可以在AI建议和传统操作间灵活切换,逐步建立对AI的信任。真正有价值的知识包含多个层次:显性的文档规范、隐性的专家经验、平台沉淀的案例库、实际操作中发现的边界情况。架构设计时,只有理解业务才能判断哪些环节需要智能、哪些需要确定性,在Prompt工程中,业务理解更是核心:什么是正确的输出格式,哪些边界情况需要特别说明,对业务理解的深度决定了一个Agent架构的潜力。

ICCV25 | 淘宝人脸吸引力预测算法FPEM
在淘宝,每天有数十万的直播间存在美颜需求,人脸的吸引力已成为影响直播用户整体视觉体验的核心变量,通过实时监测确保美颜效果的稳定性,对保障主播和用户的双端体验至关重要。为更好地适配淘宝直播平台的数据场景,我们基于淘宝直播平台的视频,构建了大规模直播场景下的人脸吸引力预测数据集LiveBeauty,包含10,000张图像,涵盖不同美颜算法参数、光照条件、面部表情,并通过专业的主观标注,获取200,000个对应的主观分数的标注数据。从表中可以看出,先前的数据集闭源的较多,开源的数据集则规模偏小。

AI+时代工程师的空间在哪儿——从范式演进看技术机会
本文探讨了AI时代工程师的核心价值与技术机会,指出随着大语言模型(LLM)从GPT-1演进至Agent智能体阶段,工程师的关键角色已从“调用模型”转向“深度挖掘模型潜力”的系统性工程实践。作者通过四阶段范式演进梳理技术脉络指出模型决定智能下限,而工程师对业务场景的拆解能力、系统架构设计能力(流程编排/工具抽象/记忆机制/评测体系)才是决定产品体验上限的关键——AI工程师正从“炼丹师”进化为“系统架构师”与“场景定义者”。前言随着⼤语⾔模型(LLM)从GPT-1进化到如今的Agent智能体时代,我们往

淘宝订单列表体验优化实践
随着闪购业务的上线,订单列表新增一级tab类型,其包含了全部订单、购物、闪购、飞猪等等不同业务场景,支持根据用户的行动轨迹以及订单状态,通过算法首屏直达指定tab。多tab实例架构对推荐流的原有架构产生了很大的影响,在单实例模式的情况下,由于只有一个实例,所以每次切换tab时,都会去重新构建一个推荐流的view加载到订单列表View上。单实例架构下,例如在全部订单tab下立即付款、确认收货后,当前tab会立即刷新的,并且切换tab时,由于单实例架构的销毁重建机制,待付款列表自然也会拿到最新状态的数据。

AI 无障碍 CR 与自动适配实践:从问题洞察到效果验证
在此基础上,未来我们还计划将方案从当前的Web/DX场景扩展到Native页面:我们会针对iOS/Android等原生技术栈,补充针对控件语义、系统辅助功能(如TalkBack/VoiceOver)以及原生导航模式的规则与示例,并基于现有能力继续演进「AI检测+智能修复」链路,为Native代码提供无障碍问题识别、属性自动补全和改造建议;在丰富的业务场景下,通过持续的技术探索创新突破,给数亿用户提供可靠的交易保障、极致流畅的操作交互以及顺滑的购物体验。

<span class=“js_title_inner“>支配树算法原理及鸿蒙工具实践</span>
本文作者灵貎,来自淘天集团-终端平台基础工程团队,团队负责淘宝App基础架构和基础链路业务,致力于通过技术创新和系统优化,打造一个更稳定、更流畅的手机淘宝。_index存储的是strings中的名字index,11673对应的是-subroot-字符串to_node代表的是这条边指向的节点索引,因为内存引用构成是一个有向图,所以还需要知道这条边来自于哪个节点。3.对于⾮根节点n,Dom(n)=n∪(∩Dom(p)),即当前节点n并上所有前驱节点p的⽀配节点的交集。

支配树算法原理及鸿蒙工具实践
本文作者灵貎,来自淘天集团-终端平台基础工程团队,团队负责淘宝App基础架构和基础链路业务,致力于通过技术创新和系统优化,打造一个更稳定、更流畅的手机淘宝。_index存储的是strings中的名字index,11673对应的是-subroot-字符串to_node代表的是这条边指向的节点索引,因为内存引用构成是一个有向图,所以还需要知道这条边来自于哪个节点。3.对于⾮根节点n,Dom(n)=n∪(∩Dom(p)),即当前节点n并上所有前驱节点p的⽀配节点的交集。

淘天业务技术2025年度热门文章盘点
涵盖其底层机制(如Token计算、工具调用、Codebase索引与MerkleTree)、提升对话质量的方法(如规则设置、渐进式开发)、实际应用场景(如代码检索、绘图生成、问题排查),并推荐了结合AI的编码最佳实践,包括文档、注释、命名规范和安全合规,旨在帮助不同经验水平的开发者真正把AI工具用好。通过在生产环境长期采集代码执行数据,生成覆盖率报告并集成到开发环境,团队显著降低了代码冗余(如B应用清理71%的代码),提升了系统可维护性,并总结了技术选型、热部署兼容、插件开发等方面的经验与教训。

GenAI输出内容控制的5种设计模式
当前的做法是在prompt中写清楚需要返回的信息的格式,比如是JSON,或者是一些特殊的sql,虽然Anthropic也推荐了这样的做法,但是这个方式不一定能保证结果格式的输出一定能如你所愿,头部的大模型在模型能力上有比较好的调优,可以在更大概率上遵循用户在prompt中约束的指令,但是小一些的模型,在这方面的表现就会比较差,同时不管是头部闭源模型还是一些自己部署的小模型,在输出格式遵循的确定性上,都是有一定的概率;淘宝直播作为全球领先的直播电商平台,正在重新定义人与商品、人与内容的连接方式。

AI工程vs传统工程 —「道法术」中的变与不变
从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在AI工程落地的战场上,我们既未抛弃传统工程的“十八般兵器”,也未盲目迷信AI带来的“新式火器”,而是将二者熔铸为一套既能攻坚克难、又可稳守阵地的复合战法。如果你渴望在真实、高复杂度的业务场景中锤炼AI工程能力,与一群既懂技术又懂业务的伙伴并肩作战,这里将是你理想的舞台。

AI架构师的诞生:AI+传统DDD模式 = 实现开发效率提升75%
根据人工拆解限界上下文部分,从原有me.ele.newretail.contract.v6.domain包下,帮我抽象出商品上下文的类,Repo、Service,类用Domain结尾,Repo用DomainRepo结尾,Service用DomainService结尾,输出成表格,包含方法和属性,就放到当前这个文档最后。从上一步可以看出,AI拆解的限界上下文是基于package结构进行拆分,未能深入分析业务语义,这是AI的薄弱环节,需要人工介入修正。这将成为软件工程的新常态。

天猫超市数据AI实践总结
从知识库概览图中可以看发现,知识库中强依赖知识间的联动,因此每一次修改都需要联动修改很多绑定部分,并且知识库需避免冗余知识,冗余知识会显著增加模型推理相同问题的不确定性和时间,这不是问数所需要的,因此在人工维护的情况下,无疑是巨大维护成本。总结了在构建面向AI的数据知识库中的实践经验,针对数据资产庞杂、语义不统一、维护成本高等问题,提出以“不重构模型、小而精维护、支持灵活扩展”为原则,通过结构化构建指标、实体、属性、表和字段五类知识,并结合图谱召回与Agent框架,实现自然语言到SQL的智能取数。

AI 辅助前端动画开发
AI辅助代码生成在前端领域有两个难点,第一个是DesignToCode(下文检查称D2C),D2C的出发点虽然也是需求文档,但前端拿到的是设计师交付的设计稿,如何将设计软件中的结构化数据映射为准确的前端UI,是目前阶段的一个难点,Pixelator和Figma等团队都在探索。我在Ani平台上看到一个简单的进度条Lottie动画,背景色渐变的动画还挺好看的,我直接录屏交给微动画研发流程,其他物料都没给,AI生成了5步的TodoList,并封装好了动画组件。

欢迎留下您的脚印