阿里 - 创始之翼

AI Coding 长文分享：如何真正把工具用起来，从原理到实践
涵盖其底层机制（如Token计算、工具调用、Codebase索引与MerkleTree）、提升对话质量的方法（如规则设置、渐进式开发）、实际应用场景（如代码检索、绘图生成、问题排查），并推荐了结合AI的编码最佳实践，包括文档、注释、命名规范和安全合规，旨在帮助不同经验水平的开发者真正把AI工具用好。我们不只可以粘代码、图片进去，还可以让模型参考网页、Git历史、当前打开的文件等，这些IDE类的工具支持的比较好，因为是在IDE环境里面，而CLI在终端中，限制就要多一些（但更灵活）。

我的研发实践：高准确率AICoding工作流设计
在Agent框架选择上，一般我们在IDE或者cli中直接使用的都是单一Agent，单一LLMAgent可以通过工具、记忆、规划执行，很好的完成我们诸如：代码变更的诉求，如果我们的工作流有且仅有代码修改时，这样的架构无疑是最高效的，但是，我们也必须看到单一Agent有几个问题：工具太多可能导致选择复杂，上下文变得过于庞大，以及任务可能需要专业化。技术是帮助业务解决问题的手段，业务的形态，技术的使用是多样的，但是沉淀解决问题的能力，抽象解决问题的方法是不会变的。应该是，你想让这个方向变成未来的趋势吗？

一次AI驱动的淘宝客户端需求开发实战
提供清晰和明确的prompt描述，在提供给AICoding任务尽可能是你能预期输出，给出明确构建描述的任务，当你的Prompt不能指向一个明确的Coding产物时，可能带来的就是无尽的再次沟通成本，带来的提效时长，在一次次反复补充信息中，逐渐消耗成0甚至不如我自己干了。尝试对收集中的问题，提供了一些解决的建议，截取如下。这样的开发方式，除了提升了Coding的效率，同时也能一定程度上降低客户端开发时，双端的不一致问题(逻辑差异，消息名不一致，技术方案差异等等)，减少了方案不一致导致后需问题的可能性。

天猫行业中后台前端研发Agent设计
实践验证表明，这种策略带来了显著的投资回报：不仅实现了70%的代码查询延迟降低，系统的松耦合设计还确保了各组件的独立演进和优化能力。更严重的是API变更带来的认知偏差问题，已有工具的API可能已发生重大更新（如TailwindCSSv4的breakingchanges），模型对废弃方法和新增特性的把握存在准确性问题。无论是传统的VSCode、IntelliJIDEA，还是新兴的AI增强型IDE如Cursor、Windsurf，它们的核心关注点依然停留在代码编写、调试和基础的智能提示层面。

初探：从0开始的AI-Agent开发踩坑实录
作为决策者：让AI做决策，意味着它需要对环境有深刻的理解，甚至具备一定程度的“常识”，在已知的模型能力下，往往和高质量的prompt和上下文强相关。我们的任务，就是在理解这些工具的边界和特性的基础上，遇到问题，分析问题，并用最恰当的方式去解决问题。面对这种不确定性，需要更精细的策略，例如Few-short，即好的例子，清晰的逻辑链条和工具使用指南，迭代式优化等等。在那个瞬间，我脑海里闪过的一个宏大的图景——一个全能的应用部署agent，好吧冷静下来，还是聚焦于一个小的开始，k8s部署物的自动生成。

AI 动画辅助实现的方案与实践
通过AI驱动的精准推荐、场景化表达与动态策略调控，我们为用户创造更自然、更智能的购物旅程，为营销业务提供高效、敏捷的技术支撑，助力淘宝构建以用户为中心的全域营销技术体系。这两个工具将非结构化的视觉动画转化为可编程、高性能、易维护的前端实现，显著降低了开发门槛，使原本耗时数小时的动画开发流程缩短至几分钟，实现了从设计到代码的高效落地。基于AI技术自动生成并优化SVG动画代码，尤其针对路径变形、形变动画等复杂场景，实现关键帧间的平滑过渡，输出轻量、可维护的动画代码，大幅降低开发门槛。

从Prompt到Context：为什么Think Tool是形式化的必然？
上面说的很多，其实重演了软件工程的历史，对可靠性、可验证性、可扩展性和可维护性的需求是完全相同的。这块的设计提升的效果非常的明显，在几个案例上都达到了明显的提效，甚至比R1的预先的思考更有效，这种玩法就是把思考这个行为从一种隐式的、不可观测的过程，转变为系统执行迹线中一个显式的、结构化的、可验证的动作。首先在这里说到的语言，并不是严格按照上面的谱系语言分级，也不是编程语言，这里指的是整个人类的自然语言，而这里的编译器指的是LLM，相当于是LLM来编译人类的语言产生结果，这之间自然是存在类似的形式化分级。

产品经理也能“开发”需求？淘宝信息流从需求到上线的AI端到端实践
每个代码仓库相关的资料，存放在代码仓库特定路径下的markdown文件，在任务执行过程中可选择特定的上下文，由代码的所有开发者共同维护，同样可适用于Cursor或Jules等编程工具，包含目录结构、仓库工作流、技术栈等。有了强大的一个AI编码工具Codex，也有了需要执行的任务（提示词），我们如何指挥大模型进行正确的修改呢？团队在保证业务的同时，以先进的跨端框架和研发模式不断完善自己，打造最极致的体验和工程技术，保障多端设备的适配和稳定运行，并探索端智能等创新机会，通过技术高效驱动业务的良性发展。

一位淘宝工程同学的大模型LoRA微调尝试
通过AI驱动的精准推荐、场景化表达与动态策略调控，我们为用户创造更自然、更智能的购物旅程，为营销业务提供高效、敏捷的技术支撑，助力淘宝构建以用户为中心的全域营销技术体系。结果表明，LoRA能以极低的计算成本让通用大模型有效学习业务知识，显著提升其在特定任务中的表现，真正实现“让大模型懂业务”，推动AI从“可用”走向“好用”。从智能客服到内容生成，从代码辅助到推荐系统，大模型正以前所未有的速度渗透到互联网技术的各个领域，成为驱动创新的核心引擎。），在不改变主干模型的前提下，仅通过训练少量新增参。

Claude Code 深度拆解：一个顶级AI编程工具的核心架构
整个ClaudeCode的核心资产，他这个cli效果这么好除了是因为强大的模型，也是因为有很强大的工具，例如有一个特别强大的bashtool的工具，可以调用shell里面的所有命令，也包含agenttool，可以发挥更强大的能力。际的使用过程中，ClaudeCode是一个比较通用的智能体，他输出的代码也比cursor简练很多，更像是一个熟悉整个项目的高级程序员，研究和学习这个框架对于开发自己的Agent至关重要，本篇文章会详细介绍ClaudeCode的设计模式和核心。

多模态AI质检：身份核验场景实践
针对用户上传身份证时常见的图片问题，项目通过引入阿里云百炼平台的多模态模型，在OCR识别失败时进行智能检测与反馈，提供对客友好的提示文案，从而引导用户重新上传合格照片。上线后，相关指标表现出积极变化，OCR失败用户的再次失败率（OCR失败用户中再次识别仍失败的比例）有所下降，申请转化率有所提升。将“珠海”识别为“上海”。通过大模型提示词的增强优化，无需对每个场景进行大规模定制，用于多种类型的证件上传场景即可快速扩展功能，为更多业务场景赋能，未来结合工作流或智能体编排，将进一步提升可维护性和功能扩展能力。

基于智能体的自适应资损防控体系 - 淘工厂实践（二）
基于这些数据，Agent能够自动生成具体的监控建议，明确指出需要监控的具体对象、最佳监控时机、适用的监控类型，以及具体的监控值指标。正如我们在测试领域所践行的理念——"Withgreatpowercomesgreatresponsibility"，当我们拥有了AI这样强大的工具，更应该思考如何用它来创造更大的价值，守护每一分应得的收益，为业务的健康发展保驾护航。”的问题，新范式中，我们的Agent结合上文智能化提取到的知识，对用户输入的“小程序-下单积分玩法”需求文档，展开分析。

AI赋能前端开发提效实践：以长颈鹿接入为例
面对Weex/Muise架构限制、跨端兼容难题及分散的文档体系，作者转变传统开发模式，构建结构化、可被AI理解的研发知识库，并结合项目级编码规范与RAG技术，实现AI在组件开发、埋点集成、支付对接等环节的高效协同。但该项目积累的开发规范、组件模板与AI提示工程经验，在后续迁移至778红包项目时实现了高效复用，显著缩短了开发周期，提效成果得以充分释放。每天有较多用户在手淘搜索：天猫超市卡，经与搜索团队沟通，可在搜索长颈鹿场景下，直接透传猫超卡充赠组件，提升用户转化，给用户提供最直接的猫超卡充值服务。

让你的大模型读懂二方包
另外理论上可以考虑直接把这个api的网页导出到markdown形式试一试，只不过我看了网页里面还嵌套了语雀文档，语雀文档中再去叙述出参里面代表了什么，而且网页里面的信息我看了一下和实际二方包也不符，比如要传入的订单id，网页中显示是long，实际二方包是传入的long[]，所以就放弃了。生成的代码质量和准确率飙升，连。近期有一个需求中需要查询用户订单状态，这个功能本身很简单，是一个经典的依赖下游场景，需要读取交易订单二方包的代码逻辑，并分析出入参出参的含义，并判定用户指定的订单是否已经进入终态。

基于《架构现代化》浅谈架构共鸣
但其实，其厚度是不一样的。这样的认知下，架构应该是架构师，团队TL，领域专家大家一起共创和共识的结构，案例的输入既有上面的用户动线，业务策略比较偏问题域的部分，也有具体的实现案例，反射出问题域讨论未考虑到点。因为这样的过程，我们还是需要可以“沉淀的部分”，这是架构活动本身重复的抽象，是“架构”的“架构”。所以，当我们进入一个新的环境的时候，虽然看到的是系统复杂度，流程复杂度等一系列需要适应和学习的门槛，但是背后还是这个领域的“厚度”，其解决的问题需要涉及的相关方较多，概念的抽象和维护压力也很大。

AI审核工程实践：淘宝极有家破损包赔项目思考
有18笔人审单多次重试，也没有成功。AI智能人审能够结合自动化规则，并利用大模型的多模态、推理、概括等能力，识别用户上传的商品照片和订单信息是否相符，解析物流信息和聊天记录，综合判断佐证材料是否充分，最后给出保险理赔建议。27个FP分类结果中，6个和审核尺度相关，10个需要人工根据经验判断是质量原因还是物流原因，商品订单和照片不一致的6个案例中，有4个也可以理赔通过。剔除额度问题的审核单，理赔通过的概率有80%，因此不能以简单的准确率来衡量模型的效果，可以考虑模型标注可能破损的地方，提高人审效率和可信性。

AI Agent工程化融合：分享我的实践经验和选型技巧
问题在于SSE的整个通讯过程都需要依赖SSE长链接，一旦出现网络毛刺（短暂中断），那么MCPServer向MCPClient发送的数据就会丢失，并且MCPServer无法感知到数据的丢失。举一个通俗的例子，把MCPClient想象成DVD播放器，DVD播放器可以放入不同的碟片（MCPServer），不同的碟片有不同的内容（能力），但肯定不能向DVD播放器中放入磁带（不符合MCP的Server）。对于不同的报表场景，定时时间、具体的网页操作、要关注的指标、联系人等都各不相同。

HSF 序列化不可变集合类型问题原因分析
由于hessian2在序列化时仅序列化了tag字段，所以反序列化java.util.CollSer实例完成后，只有tag字段值为1，表示List，但是没有元素，即array字段为null，由于java.util.CollSer实现了readResolve方法，在反序列化完成后会调用它，但是由于array字段为null，所以抛出InvalidObjectException异常，反序列化失败。根据报错信息，原因是HSF不支持序列化/反序列化不可变集合类型。

分享一下我对好代码的理解
商业能力扩展、域扩展，在执行回收结果的时候，会遍历实现的插件，并结合回收规则，进行及时的熔断。于每一步棋来说，我们只能看到局部的影响（受限于我们能想到后面几步），当我们事后站在全局的角度看，有可能的“平平无奇”的一步却起着关键性的作用。闭原则，在面向对象编程领域中，规定“软件中的对象（类，模块，函数等等）应该对于扩展是开放的，但是对于修改是封闭的”，这意味着一个实体是允许在不改变它的。我们渐渐从单一的完成任务，开始思考如何更好地完成任务，从短期的设计开始考虑长期的感受，从单一的指标开始考虑更多的因素，

深入聊聊RAG
日常我们会比较多的把RAG当成一个黑盒，输入是我们沉淀的文档，输出可能是整个AI应用反馈的最终结果（如下图所示），这样的方式下，我们可能可以收获一定的初期收益，但是当要持续优化或者扩展使用场景的时候，可能会缺乏评估和应对的方式，比较难去定位问题，因此也不太能说清楚当下链路的诉求，最后所对应的action也可能会偏离比较大。），中文的处理可以找相应的中文embedding模型，但是不是所有语言都有对应的编码模型，因为语种太多，同时如果一些语种对应的数据语料太少，不足以训练这样的一个模型。

欢迎留下您的脚印

Leave a Comment Cancel reply 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

阿里

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款