Loading...
最终,文章提出了一套包含Markdown标记、消息传输、UI渲染及事件通信的四层统一协议体系,旨在解决Agent时代下多端一致性、数据实时性及跨团队协作混乱的问题,为构建高效、标准化的卡片式对话系统提供了落地的架构参考。一种可行的组合方式是:在MCPTool层使用MCPApps的绑定机制来管理Tool与UI的映射关系,同时用A2UI的JSONSchema作为UI描述的标准格式——这样既有Tool层的确定性,又有UI层的通用性。这种"自由"的代价是系统迅速碎片化。
淘宝动效解决方案分享
进一步看,动效体系的演进不应只是播放器或渲染技术的优化,更应是覆盖全链路的系统化升级,而AI将在其中发挥越来越重要的作用。本文提出了一套平台化、协议化、工程化的动效解决方案,覆盖设计(AE插件)、编辑(可视化画布SDK)、布局(align/group动态对齐与成组)、播放(H5/Weex跨端统一Player)、压缩(二进制优化)、代码生成(Lottie→Anime.js)及AI辅助(MCP协议动效Agent)全链路,解决碎片化、多端不一致、性能差、维护难等痛点,实现“一次制作、多端复用、智能可控”。
从全量启动到最小核: 手淘外链唤端链路的三次架构演进
对用户来说,体感最差的不只是"慢",还有"乱"——闪屏页长时间停留制造焦虑,首页闪现又消失让人困惑,目标页面的白屏等待更是将耐心消磨殆尽。但我们观察到,在启动任务执行期间,网络I/O能力几乎完全空闲——启动任务主要消耗的是CPU,而资源加载主要消耗的是网络带宽,两者天然适合并行。通过不断的探索和沉淀,我们的外链唤端架构经历了从全量串行到按需裁剪、从被动等待到主动预加载的演进过程,先后落地了标准链路、极简链路和最小核链路三代方案,最终将低端设备的唤端体感耗时从10s压缩到3s。
AI 答疑助手优化实践:从 RAG 到 LightRAG 的全链路升级
在全局性问题上,LightRAG的高级检索虽然不如GraphRAG的GlobalSearch那样有社区摘要的加持,但在我们的场景中已经足够用了——毕竟用户问的80%以上都是具体的技术问题,而非需要鸟瞰全局的综合性提问。当用户问"WebView的离线包加载流程是什么"时,系统首先通过向量相似度找到"WebView"和"离线包"相关的实体节点,然后提取这些节点的Value文本以及它们之间的关系描述,拼装为上下文。根据上一步推理出的每个步骤,分别生成对应的知识库查询关键词组。
告别“伪智能”代码:用 Spec + RAG 打造真正懂你的AI程序员
文章指出,单纯依赖大模型的自然语言理解往往导致代码生成不准确,而通过引入结构化的开发规范(Spec)作为明确指令,并配合RAG技术实时检索项目特有的代码库、文档和最佳实践,可以赋予AI真正的“项目感知力”。这种模式让AI从通用的代码生成器转变为懂业务、懂架构的专属程序员,显著提升了代码生成的准确性、可维护性及与现有系统的融合度,为构建高质量、低幻觉的AI辅助开发流程提供了切实可行的落地方案。(Specification,规范)是对软件系统行为、接口、数据格式或业务规则的精确、无歧义、可验证的描述。
淘宝跨端体验优化 AI 演进之路
在AI重塑终端体验与研发范式的浪潮中,我们正驱动终端智能化创新、构建AI赋能的研发新基建,寻找兼具工程深度与AI思维的伙伴共同定义下一代终端体验。通过知识萃取(文档、群聊、问题排查记录)等进行统一的解决方案&规则驱动沉淀,同时通过思维链学习,让体验优化Agent成为每个跨端同学最懂手淘体验的AI架构师。决JSE问题的采集、问题挖掘、代码修改的负向问题解决闭环。此时的AI基可以完成全托管独立完成采集到分析到修改的全链路体验优化了,也是目前所处的阶段,需要做的是进一步提升评测的分数跟准确性。
淘宝营销会场智能测试平台的AI落地实践
LLM、多模态、Agent在会场领域测试专项中落地通过串联复杂工具,多模态判断起到一定效果,但实际需求测试环节中需求理解、数据构造、测试用例识别(测试内容选择)上更多靠人工辅助判断。会场测试在“所见所得渲染验证、价格一致性、Tab/Feed交互、骨架/快照/终态对比、渠道投放一致性、内容异常发现”等多个维度,传统依赖人工肉眼和脚本、难以覆盖且易遗漏。在AIGC技术爆发、市场剧烈波动、技术栈快速迭代、模型架构多样化的行业背景下,我们在会场AI模型的业务会场测试中进行了一些探索。
从 Vibe Coding 到范式编程:用 Spec 打造淘系交易的 AI 领域专家
本文介绍了从“VibeCoding”向“范式编程”演进的技术路径,核心是通过结构化规范(Spec)驱动AI生成符合企业级标准的代码。文章以淘系交易系统为背景,指出当前AI编程工具因缺乏领域知识、上下文缺失和规范约束,导致生成代码不可靠、难维护;为此提出“范式编程”——将规范置于开发中心,结合知识库、知识点、疑问点机制与AIAgent,构建可沉淀、可复用、可演进的AI领域专家体系,实现从“人写代码”到“人机协同”的范式升级。前言凌晨两点,⼩丫同学盯着屏幕上Cursor⽣成的代码,第三次按下了删除键....
97.9%采纳率,胶水编程:业务需求出码最佳实践【天猫AI Coding实践系列】
这是一个典型的中后台业务需求,涉及列表、详情、状态机,复杂度适中但细节不少。它们的独立性体现在——答对任何一个,不保证其他三个也对:Agent可以理解需求但违反了团队禁用某依赖的规矩(缺开发规范),可以守规矩但文件组织混乱(缺代码模式),可以结构规整但踩了内部组件的坑(缺领域知识)。中后台需求虽然千变万化,但复杂度的来源是可枚举的:交互表达(非标布局、多弹窗)、数据逻辑(字段联动、状态流转)、后端对接(接口契约、嵌套结构)、业务规则(跨字段校验、计算逻辑)、异常处理(空状态、超时重试)。
拒绝“感觉有效”:用数据证明 AI Coding 的真实团队价值【天猫AI Coding实践系列】
通常是最后一次提交的commit。由于存在多对多关系(一个Task可能关联多个需求),各维度的汇总值不等于实际总消耗,但这种设计更符合业务分析的需要——产品经理关心的是「这个需求花了多少Token」,而不是「这个Token被几个需求共享」。业界有通用的评测基准(如SWE-bench),但通用基准解决不了具体团队的问题——以我们的中后台前端场景为例,存在多解性(同一需求有多种等价实现)、测试成本高(交互类需求难以自动化验证)、过程盲区(只看结果不看Agent是否查阅了正确资料)等核心差异。
知识基座:让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】
该基座不仅让AI在代码生成、Bug修复和需求分析中能精准理解业务上下文,减少幻觉,还通过持续反馈机制实现知识的动态迭代,使AI随着团队使用不断“进化”,最终成为真正懂业务、能落地的智能研发伙伴,显著提升团队整体效能。内部知识存储按业务域进行物理隔离(通用、某跨境电商、业务域A、业务域D、业务域C、业务域B等),确保各业务线知识独立管理。当前已实现的V1指标包括:召回率(有结果查询占比)、零结果率(无结果查询占比)、平均返回数(每次查询返回条数)、知识召回次数(单条知识被引用频次)。
AI Coding前端实践后的复盘总结
通过实践,团队提炼出“人机协同”的最佳工作流:将AI定位为高效助手而非替代者,强调通过优化提示词(Prompt)、建立前端专属知识库及制定严格的代码审查规范来弥补AI的不足,最终实现研发质量与速度的双重提升,为前端团队规模化引入AI辅助开发提供了可复制的方法论。不需要懂高深的AI原理,只要掌握这些技巧,每个人都能成为AICoding的高效使用者。由于没有指定Agent使用相同组件,而是使用模糊的“保持一致”的描述,导致生成的代码仅仅是模仿了参考组件的样式,不仅生成的页面样式不够还原,Agent还会。
软件为何越做越乱?万字长文讲透软件的“复杂性”
本文通过一个电商系统“限时折扣”功能从快速上线到逐渐演变为复杂黑箱的典型案例,深入剖析了软件系统为何越做越乱的根本原因——复杂性的累积。文章指出,复杂性并非源于重大错误,而是由无数看似合理的小妥协(如随意添加开关、复制逻辑、临时补丁)层层叠加所致,最终导致变更放大、认知负荷加重、未知的未知增多。在此基础上,文章对比了“战术性编程”(追求短期交付速度,忽视设计)与“战略性编程”(以长期可维护性为目标,持续投入10%–20%时间优化架构)的本质差异,并系统阐述了管理复杂性的核心方法。作者强调:真正的开发速度来自
用自然语言替代复杂代码
核心价值在于将高理解成本、难维护的硬编码逻辑,转化为可读性强、修改便捷、开箱即用的AI驱动分析流程,并在开发效率、维护成本、响应速度和业务价值上实现显著提升。天猫技术是阿里巴巴旗下专注于电商场景的综合技术团队,不仅服务于自身电商业务增长,也在不断探索如何用AI、大数据、交互技术赋能行业交易、品牌营销与消费者体验,成为全球领先的品质购物平台和技术引擎。AI平台就像一个"AI能力超市",我们选择合适的Agent,填充参数就能用。这种"能力平台化"的思路,才是AI真正赋能业务的方式。
AI工作流在淘宝交易舆情巡检上的探索与实践
再将相关舆情数据结构化后投喂到AI,最后根据我们自定义的业务规则及波动阈值进行舆情预警并进行消息推送,至此完成巡检部分的工作,当然后续还有舆情归因及复盘反馈的环节,但是这个部分的能力我们还在持续建设中,暂时先不。AI负责发现问题、聚合信息、提供建议,而最终的判断和决策权,始终交给业务同学。,来自淘天集团-交易业务技术团队,本团队专注于下单、支付、物流、服务、逆向退款等核心交易链路的技术团队,我们面向亿万用户致力于打造极致流畅、安全稳定的购物体验,为用户和商家的每一次交易行为保驾护航。
ICLR 2026 | 基于概念蒸馏的生成式视频复原算法Vivid-VR
具体来说,给定一个文本-视频对,我们对源视频施加特定强度的噪声,然后使用T2V基座模型,在文本描述的引导下对噪声视频进行去噪重构。我们采用上述过程生成。在生成式视频复原的新范式下,如何利用强大的T2V基座模型修复低质视频,同时避免基座模型在微调过程中“遗忘”原有的生成能力,是学术界关注的焦点。团队兼顾算法创新与工程应用,为视频生产,直播推流,美颜美化,视频特效互动,视频渲染,视频修复、生成,视频编码,视频传输,视频播放等完整链路提供底层音视频技术,保障视频、语音、图片相关业务的流畅度和音画质体验。
AI Coding思考:从工具提效到范式变革,我们还缺什么?
相关的技术资产,无论是生产资料,还是(软件)产品,既有基于物理真相的关系刻画,又有基于架构抽象的、易于人类理解的逻辑表达——本质上是技术资产及其内在关系的语义化、在线化(企业级软件资产图谱),这是企业全局架构视角面临的挑战,在AI时代的研发提效背景下,这件事情变得更为急迫(决定了公司研发效率方面在未来的竞争力)。比如现在PD使用Web形态VibeCoding工具快速生成产品原型,HR用它快速开发一个文化活动的页面,这些场景下程序员的工作完全被代替了,PD的角色职责也发生了变化,这是质变的。
首届淘宝电商AI挑战赛来了!设350万赛事奖项和千万扶持资源
届时,由淘天、千问大模型等背景的产品技术专家、行业运营专家和知名媒体人等组成的专家评审团,将聚焦。此外,主办方还将为获奖者对接业内大咖、创投机构、政府和产业扶持资源,助力。产品的持续落地,电商人在运营提效和经营增长上会迎来越来越多的可喜变化。近期,由浙江省商务厅指导,淘宝开放平台、千问大模型、阿里云联合举办的。产品市场前景、技术能力、创新性和产品实战效果等维度,选拔出。正在重塑电商经营,也已成为商家重构增长的现实选项。月份结合商家出题的结果同步给进入决赛圈的选手,并在。工具进化、生态共赢、商业新生。
AI真人数字人语音对话性能优化实践总结
原始的导购对话流程,基线数据的链路是"ASR→LLM→TTS&A2BS"的三段式结构:ASR识别结束后发起文本请求,获取请求之后,当达到一定的标点符号截断,才会调用TTS和面部动画生成,回传结果之后,再播放音频和面部动画。对于用户而言,最关心的是问完问题之后,多久能够得到数字人的回复。对于整体解决方案,完整的性能监控打点机制是优化的基础,具体实施时,一方面,我们用更合适的模型,端测针对新模型增加输入输出链路,另一方面,端测针对A2BS进行窗口累积和语音表情同步的处理,保障链路的正确性。
从应用架构的视角看退小宝AI助手落地现状
本文从应用架构视角系统分析了AI(尤其是LLM)在实际业务中落地的现状与挑战,以“退小宝AI助手”为典型案例,对比传统Web应用与AI应用在响应时间、输入灵活性、准确性、可用性、成本及嵌入适配性等维度的根本差异,指出AI原生应用(而非简单在旧系统中嵌入AI模块)是更可行路径;进而梳理了AI应用的典型架构演进:从简单调用模型API,到ReActAgent范式,再到以Workflow(工作流)为核心的低代码图结构实现;深入解析了LLM、Message、Tool、RAG、上下文(State)、MCP、微调、可观
