Loading...

Jimi:打造Java程序员专属的开源ClaudeCode
作为十年Java老鸟,想为Java开源生态贡献绵薄之力,于是便有了本文:https://github.com/Leavesfly/Jimi。本团队主要负责淘宝行业&淘特C端链路的研发工作,包含:搜索推荐、互动游戏、导购、交易等基础服务,在这里可以探索更多AI场景,包含AI代码生成以及用Agent将电商各种场景重新做一遍的机会。首先是坚实的地基(基础设施),然后是稳定的骨架(核心引擎),再是灵活的功能模块(Agent和工具),最后是友好的交互界面(UI)。Agent中最火的是什么,AI-Coding;

2025淘宝直播双11花花乐动画实现方案思考&分享
关键的问题就是这个动画曲线如何获取,拿到了AE的源文件,能看到设计师手动拉的动画曲线,但是我们拿不到具体的值,自然也构建不了准确的动画曲线。关键的问题就是这个动画曲线如何获取,拿到了AE的源文件,能看到设计师手动拉的动画曲线,但是我们拿不到具体的值,自然也构建不了准确的动画曲线。好在这里有具体的值,我们可以反推公式,不过目前还有个更简单的方案,即直接把每一帧的值带入每一帧的渲染,类似算法中“打表”的方式来执行这个动画曲线。一旦首屏的花渲染完成,开始预加载升级时要用的素材和下个等级的素材。

复杂任务AI处理实践:淘宝工程师的实战手记
上游核心表变更时,需要下游逐个查代码确认影响范围。文章总结了一套可复用的方法论——如何将人工操作抽象为"感知-决策-执行"的AI闭环,并通过工单处理、数据治理、基线运维等真实案例,展示从"工具助手"到"智能体"的三种自动化模式。精准:在今年的数据治理中,AI处理了数千张表的治理决策,人工复核了10%高优先级的样本,未发现误删数据的情况,不过发现ai策略过度保守的情况存在。数据治理:查表信息及代码→看血缘关系→读上下游代码→查上下游信息→评估→给出治理方案→输出治理建议JSON。

重构一个类,JVM竟省下2.9G内存?
文章深入分析了原始结构的内存浪费原因,并通过实测对比多种方案,验证了新结构在内存效率和查询性能上的优越性,强调了在大数据量场景下应警惕“通用容器”的隐性成本。正是在这一背景下,我们发现:看似合理的“通用集合嵌套”设计,在十万级商品×万级城市×多标签的规模下,竟成为内存消耗的“沉默杀手”。我们推测,当初的设计者可能是出于“未来扩展性”考虑(例如支持非数字标签),但在当前业务场景下,这种通用性牺牲了巨大的内存效率。在我们的核心业务链路中,存在一个对城市维度下某特定类型商品标签进行动态过滤的关键接口。

AI互动前端开发的思考和实践_
随着AI技术的发展,作者提出一种“规范驱动的AI协同开发”新模式:从“代码复用”转向“规范复用”,即通过制定统一的开发规范(Spec),利用AI按需生成针对具体场景的专用组件。团队在保证业务的同时,以先进的跨端框架和研发模式不断完善自己,打造最极致的体验和工程技术,保障多端设备的适配和稳定运行,并探索端智能等创新机会,通过技术高效驱动业务的良性发展。当AI能够瞬间生成代码时,真正决定交付质量的,不再是某一行语法是否正确,而是我们在需求萌芽之初,是否构建了一套清晰、可演进、可复用的认知框架。

代码染色&无效代码清理
但实际做代码下线并非容易,仅凭业务逻辑决策代码清理费时费力,还容易误删在使用的业务代码,因此非常需要工具来辅助做代码的清理,这就是基于代码执行染色和覆盖分析做代码下线方案的背景。离线方案的缺点在于,考虑到插桩代码运行存在性能损耗,如果不是所有在线机器都部署采集,每次部署就需要至少打出两份部署包:插桩版本的包和不做插桩的包,将插桩包部署到需要采集的机器,非插桩包部署到其它机器,这种分别部署的方式增加了部署调度的复杂性。自定义的方式对理解和实践插桩过程很有帮助,比较方便自定义的方式处理采集的数据,但存在问题。

交易订单表如何做索引优化
本文首先以淘天电商交易订单表线上一条非典型慢SQL的深入剖析为切入点,示范如何系统地分析与排查慢SQL;接着详尽归纳了索引分类、B+Tree与B‑Tree的结构差异、B+Tree高度估算方法、EXPLAIN与QueryProfile等诊断工具的使用,以及索引下推与排序的执行流程等索引优化理论;最后结合日常实践经验,提出了适用于大规模线上集群的索引变更SOP,并总结了常见的慢SQL成因与相应的解决策略。前言交易订单表(tcorder)用于存储集团电商的在线订单记录,该表近60个字段

页面搭建方案(TurboUIBuilder)在穿搭星球的实践
本文介绍了手淘穿搭星球业务在面对快速迭代和极致用户体验需求时,从初期Weex方案转向Native技术栈,并基于微服务架构设计了TurboUIBuilder这一可视化页面搭建平台。该方案通过三层结构实现页面布局的结构化与动态化,结合DX动态组件、keypath数据绑定协议和内置核心服务(如布局、数据、埋点等),提升了开发效率30%-50%,实现了双端一致性、体验优化开箱即用(如无极缩放转场、多媒体浏览)以及页面的远程动态更新。同时,依托Skyline模板发布平台,支持高效、安全的模板管理与AB测试,最终形成了

从0到1:天猫AI测试用例生成的实践与突破
随着大模型的不断演进,测试行业基于AI也在做不同程度的探索,在agent智能体生成方面,基本使用的是prompt+RAG的方式,构建特定业务的需求分析/测试用例生成/数据构造智能体等。其中从用例设计到最终的回归约占据了QA70%的时间,在当下对于质量要求高,版本节奏快,人力成本缩减的前提下,急需借助大模型来辅助测试设计,建设相关的智能化工具。目前在实践中主要问题还是集中在PRD质量不高;营销解决方案,导购场域,交易结算,多部门协作,中后台,如何针对不同业务类型做用例生成的适配和应用,也是面临的难题之一。

让AI打出丝滑连招:编码-部署-自测-改bug
在AI辅助编程的实践中,即使需求理解、方案设计、代码生成都很顺利,AI写出的代码仍不可避免地存在各种小问题。

别让故障复盘流于形式:用AI挖掘每一次“跌倒”的价值
而复盘是让这次故障价值最大化的核心节点,一方面准确深度发现当前系统的风险,并推动当下系统存在的风险闭环解决,同时举一反三将未发生故障&存在同样风险的系统实现真正的故障规避,另一方面复盘的结果也应该作为一种数据资产在后续的稳定工作中产出更有实质性的帮助,比如丰富稳定性工作的方向和方式,再比如经验不足的研发可以从过去的故障中学习故障树FTA路径,以及恢复手段和关键决策。我们决定推翻标签限制的关注点生成架构,借鉴人工复盘思路,从五个域出发(架构,测试,编码,变更,应急),根据上下文先提出关键问题,再尝试回答。

AI Coding 长文分享:如何真正把工具用起来,从原理到实践
涵盖其底层机制(如Token计算、工具调用、Codebase索引与MerkleTree)、提升对话质量的方法(如规则设置、渐进式开发)、实际应用场景(如代码检索、绘图生成、问题排查),并推荐了结合AI的编码最佳实践,包括文档、注释、命名规范和安全合规,旨在帮助不同经验水平的开发者真正把AI工具用好。我们不只可以粘代码、图片进去,还可以让模型参考网页、Git历史、当前打开的文件等,这些IDE类的工具支持的比较好,因为是在IDE环境里面,而CLI在终端中,限制就要多一些(但更灵活)。

我的研发实践:高准确率AICoding工作流设计
在Agent框架选择上,一般我们在IDE或者cli中直接使用的都是单一Agent,单一LLMAgent可以通过工具、记忆、规划执行,很好的完成我们诸如:代码变更的诉求,如果我们的工作流有且仅有代码修改时,这样的架构无疑是最高效的,但是,我们也必须看到单一Agent有几个问题:工具太多可能导致选择复杂,上下文变得过于庞大,以及任务可能需要专业化。技术是帮助业务解决问题的手段,业务的形态,技术的使用是多样的,但是沉淀解决问题的能力,抽象解决问题的方法是不会变的。应该是,你想让这个方向变成未来的趋势吗?

一次AI驱动的淘宝客户端需求开发实战
提供清晰和明确的prompt描述,在提供给AICoding任务尽可能是你能预期输出,给出明确构建描述的任务,当你的Prompt不能指向一个明确的Coding产物时,可能带来的就是无尽的再次沟通成本,带来的提效时长,在一次次反复补充信息中,逐渐消耗成0甚至不如我自己干了。尝试对收集中的问题,提供了一些解决的建议,截取如下。这样的开发方式,除了提升了Coding的效率,同时也能一定程度上降低客户端开发时,双端的不一致问题(逻辑差异,消息名不一致,技术方案差异等等),减少了方案不一致导致后需问题的可能性。

天猫行业中后台前端研发Agent设计
实践验证表明,这种策略带来了显著的投资回报:不仅实现了70%的代码查询延迟降低,系统的松耦合设计还确保了各组件的独立演进和优化能力。更严重的是API变更带来的认知偏差问题,已有工具的API可能已发生重大更新(如TailwindCSSv4的breakingchanges),模型对废弃方法和新增特性的把握存在准确性问题。无论是传统的VSCode、IntelliJIDEA,还是新兴的AI增强型IDE如Cursor、Windsurf,它们的核心关注点依然停留在代码编写、调试和基础的智能提示层面。

初探:从0开始的AI-Agent开发踩坑实录
作为决策者:让AI做决策,意味着它需要对环境有深刻的理解,甚至具备一定程度的“常识”,在已知的模型能力下,往往和高质量的prompt和上下文强相关。我们的任务,就是在理解这些工具的边界和特性的基础上,遇到问题,分析问题,并用最恰当的方式去解决问题。面对这种不确定性,需要更精细的策略,例如Few-short,即好的例子,清晰的逻辑链条和工具使用指南,迭代式优化等等。在那个瞬间,我脑海里闪过的一个宏大的图景——一个全能的应用部署agent,好吧冷静下来,还是聚焦于一个小的开始,k8s部署物的自动生成。

AI 动画辅助实现的方案与实践
通过AI驱动的精准推荐、场景化表达与动态策略调控,我们为用户创造更自然、更智能的购物旅程,为营销业务提供高效、敏捷的技术支撑,助力淘宝构建以用户为中心的全域营销技术体系。这两个工具将非结构化的视觉动画转化为可编程、高性能、易维护的前端实现,显著降低了开发门槛,使原本耗时数小时的动画开发流程缩短至几分钟,实现了从设计到代码的高效落地。基于AI技术自动生成并优化SVG动画代码,尤其针对路径变形、形变动画等复杂场景,实现关键帧间的平滑过渡,输出轻量、可维护的动画代码,大幅降低开发门槛。

从Prompt到Context:为什么Think Tool是形式化的必然?
上面说的很多,其实重演了软件工程的历史,对可靠性、可验证性、可扩展性和可维护性的需求是完全相同的。这块的设计提升的效果非常的明显,在几个案例上都达到了明显的提效,甚至比R1的预先的思考更有效,这种玩法就是把思考这个行为从一种隐式的、不可观测的过程,转变为系统执行迹线中一个显式的、结构化的、可验证的动作。首先在这里说到的语言,并不是严格按照上面的谱系语言分级,也不是编程语言,这里指的是整个人类的自然语言,而这里的编译器指的是LLM,相当于是LLM来编译人类的语言产生结果,这之间自然是存在类似的形式化分级。

产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
每个代码仓库相关的资料,存放在代码仓库特定路径下的markdown文件,在任务执行过程中可选择特定的上下文,由代码的所有开发者共同维护,同样可适用于Cursor或Jules等编程工具,包含目录结构、仓库工作流、技术栈等。有了强大的一个AI编码工具Codex,也有了需要执行的任务(提示词),我们如何指挥大模型进行正确的修改呢?团队在保证业务的同时,以先进的跨端框架和研发模式不断完善自己,打造最极致的体验和工程技术,保障多端设备的适配和稳定运行,并探索端智能等创新机会,通过技术高效驱动业务的良性发展。

一位淘宝工程同学的大模型LoRA微调尝试
通过AI驱动的精准推荐、场景化表达与动态策略调控,我们为用户创造更自然、更智能的购物旅程,为营销业务提供高效、敏捷的技术支撑,助力淘宝构建以用户为中心的全域营销技术体系。结果表明,LoRA能以极低的计算成本让通用大模型有效学习业务知识,显著提升其在特定任务中的表现,真正实现“让大模型懂业务”,推动AI从“可用”走向“好用”。从智能客服到内容生成,从代码辅助到推荐系统,大模型正以前所未有的速度渗透到互联网技术的各个领域,成为驱动创新的核心引擎。),在不改变主干模型的前提下,仅通过训练少量新增参。

欢迎留下您的脚印