Loading...
上面说的很多,其实重演了软件工程的历史,对可靠性、可验证性、可扩展性和可维护性的需求是完全相同的。这块的设计提升的效果非常的明显,在几个案例上都达到了明显的提效,甚至比R1的预先的思考更有效,这种玩法就是把思考这个行为从一种隐式的、不可观测的过程,转变为系统执行迹线中一个显式的、结构化的、可验证的动作。首先在这里说到的语言,并不是严格按照上面的谱系语言分级,也不是编程语言,这里指的是整个人类的自然语言,而这里的编译器指的是LLM,相当于是LLM来编译人类的语言产生结果,这之间自然是存在类似的形式化分级。
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
每个代码仓库相关的资料,存放在代码仓库特定路径下的markdown文件,在任务执行过程中可选择特定的上下文,由代码的所有开发者共同维护,同样可适用于Cursor或Jules等编程工具,包含目录结构、仓库工作流、技术栈等。有了强大的一个AI编码工具Codex,也有了需要执行的任务(提示词),我们如何指挥大模型进行正确的修改呢?团队在保证业务的同时,以先进的跨端框架和研发模式不断完善自己,打造最极致的体验和工程技术,保障多端设备的适配和稳定运行,并探索端智能等创新机会,通过技术高效驱动业务的良性发展。
一位淘宝工程同学的大模型LoRA微调尝试
通过AI驱动的精准推荐、场景化表达与动态策略调控,我们为用户创造更自然、更智能的购物旅程,为营销业务提供高效、敏捷的技术支撑,助力淘宝构建以用户为中心的全域营销技术体系。结果表明,LoRA能以极低的计算成本让通用大模型有效学习业务知识,显著提升其在特定任务中的表现,真正实现“让大模型懂业务”,推动AI从“可用”走向“好用”。从智能客服到内容生成,从代码辅助到推荐系统,大模型正以前所未有的速度渗透到互联网技术的各个领域,成为驱动创新的核心引擎。),在不改变主干模型的前提下,仅通过训练少量新增参。
Claude Code 深度拆解:一个顶级AI编程工具的核心架构
整个ClaudeCode的核心资产,他这个cli效果这么好除了是因为强大的模型,也是因为有很强大的工具,例如有一个特别强大的bashtool的工具,可以调用shell里面的所有命令,也包含agenttool,可以发挥更强大的能力。际的使用过程中,ClaudeCode是一个比较通用的智能体,他输出的代码也比cursor简练很多,更像是一个熟悉整个项目的高级程序员,研究和学习这个框架对于开发自己的Agent至关重要,本篇文章会详细介绍ClaudeCode的设计模式和核心。
多模态AI质检:身份核验场景实践
针对用户上传身份证时常见的图片问题,项目通过引入阿里云百炼平台的多模态模型,在OCR识别失败时进行智能检测与反馈,提供对客友好的提示文案,从而引导用户重新上传合格照片。上线后,相关指标表现出积极变化,OCR失败用户的再次失败率(OCR失败用户中再次识别仍失败的比例)有所下降,申请转化率有所提升。将“珠海”识别为“上海”。通过大模型提示词的增强优化,无需对每个场景进行大规模定制,用于多种类型的证件上传场景即可快速扩展功能,为更多业务场景赋能,未来结合工作流或智能体编排,将进一步提升可维护性和功能扩展能力。
基于智能体的自适应资损防控体系 - 淘工厂实践(二)
基于这些数据,Agent能够自动生成具体的监控建议,明确指出需要监控的具体对象、最佳监控时机、适用的监控类型,以及具体的监控值指标。正如我们在测试领域所践行的理念——"Withgreatpowercomesgreatresponsibility",当我们拥有了AI这样强大的工具,更应该思考如何用它来创造更大的价值,守护每一分应得的收益,为业务的健康发展保驾护航。”的问题,新范式中,我们的Agent结合上文智能化提取到的知识,对用户输入的“小程序-下单积分玩法”需求文档,展开分析。
AI赋能前端开发提效实践:以长颈鹿接入为例
面对Weex/Muise架构限制、跨端兼容难题及分散的文档体系,作者转变传统开发模式,构建结构化、可被AI理解的研发知识库,并结合项目级编码规范与RAG技术,实现AI在组件开发、埋点集成、支付对接等环节的高效协同。但该项目积累的开发规范、组件模板与AI提示工程经验,在后续迁移至778红包项目时实现了高效复用,显著缩短了开发周期,提效成果得以充分释放。每天有较多用户在手淘搜索:天猫超市卡,经与搜索团队沟通,可在搜索长颈鹿场景下,直接透传猫超卡充赠组件,提升用户转化,给用户提供最直接的猫超卡充值服务。
让你的大模型读懂二方包
另外理论上可以考虑直接把这个api的网页导出到markdown形式试一试,只不过我看了网页里面还嵌套了语雀文档,语雀文档中再去叙述出参里面代表了什么,而且网页里面的信息我看了一下和实际二方包也不符,比如要传入的订单id,网页中显示是long,实际二方包是传入的long[],所以就放弃了。生成的代码质量和准确率飙升,连。近期有一个需求中需要查询用户订单状态,这个功能本身很简单,是一个经典的依赖下游场景,需要读取交易订单二方包的代码逻辑,并分析出入参出参的含义,并判定用户指定的订单是否已经进入终态。
基于《架构现代化》浅谈架构共鸣
但其实,其厚度是不一样的。这样的认知下,架构应该是架构师,团队TL,领域专家大家一起共创和共识的结构,案例的输入既有上面的用户动线,业务策略比较偏问题域的部分,也有具体的实现案例,反射出问题域讨论未考虑到点。因为这样的过程,我们还是需要可以“沉淀的部分”,这是架构活动本身重复的抽象,是“架构”的“架构”。所以,当我们进入一个新的环境的时候,虽然看到的是系统复杂度,流程复杂度等一系列需要适应和学习的门槛,但是背后还是这个领域的“厚度”,其解决的问题需要涉及的相关方较多,概念的抽象和维护压力也很大。
AI审核工程实践: 淘宝极有家破损包赔项目思考
有18笔人审单多次重试,也没有成功。AI智能人审能够结合自动化规则,并利用大模型的多模态、推理、概括等能力,识别用户上传的商品照片和订单信息是否相符,解析物流信息和聊天记录,综合判断佐证材料是否充分,最后给出保险理赔建议。27个FP分类结果中,6个和审核尺度相关,10个需要人工根据经验判断是质量原因还是物流原因,商品订单和照片不一致的6个案例中,有4个也可以理赔通过。剔除额度问题的审核单,理赔通过的概率有80%,因此不能以简单的准确率来衡量模型的效果,可以考虑模型标注可能破损的地方,提高人审效率和可信性。
AI Agent工程化融合:分享我的实践经验和选型技巧
问题在于SSE的整个通讯过程都需要依赖SSE长链接,一旦出现网络毛刺(短暂中断),那么MCPServer向MCPClient发送的数据就会丢失,并且MCPServer无法感知到数据的丢失。举一个通俗的例子,把MCPClient想象成DVD播放器,DVD播放器可以放入不同的碟片(MCPServer),不同的碟片有不同的内容(能力),但肯定不能向DVD播放器中放入磁带(不符合MCP的Server)。对于不同的报表场景,定时时间、具体的网页操作、要关注的指标、联系人等都各不相同。
HSF 序列化不可变集合类型问题原因分析
由于hessian2在序列化时仅序列化了tag字段,所以反序列化java.util.CollSer实例完成后,只有tag字段值为1,表示List,但是没有元素,即array字段为null,由于java.util.CollSer实现了readResolve方法,在反序列化完成后会调用它,但是由于array字段为null,所以抛出InvalidObjectException异常,反序列化失败。根据报错信息,原因是HSF不支持序列化/反序列化不可变集合类型。
分享一下我对好代码的理解
商业能力扩展、域扩展,在执行回收结果的时候,会遍历实现的插件,并结合回收规则,进行及时的熔断。于每一步棋来说,我们只能看到局部的影响(受限于我们能想到后面几步),当我们事后站在全局的角度看,有可能的“平平无奇”的一步却起着关键性的作用。闭原则,在面向对象编程领域中,规定“软件中的对象(类,模块,函数等等)应该对于扩展是开放的,但是对于修改是封闭的”,这意味着一个实体是允许在不改变它的。我们渐渐从单一的完成任务,开始思考如何更好地完成任务,从短期的设计开始考虑长期的感受,从单一的指标开始考虑更多的因素,
深入聊聊RAG
日常我们会比较多的把RAG当成一个黑盒,输入是我们沉淀的文档,输出可能是整个AI应用反馈的最终结果(如下图所示),这样的方式下,我们可能可以收获一定的初期收益,但是当要持续优化或者扩展使用场景的时候,可能会缺乏评估和应对的方式,比较难去定位问题,因此也不太能说清楚当下链路的诉求,最后所对应的action也可能会偏离比较大。),中文的处理可以找相应的中文embedding模型,但是不是所有语言都有对应的编码模型,因为语种太多,同时如果一些语种对应的数据语料太少,不足以训练这样的一个模型。
Jsonnet 一种“新”的Json数据转换工具
这个优化后的AST将会在sjsonnet内部进行缓存,后续针对同一个输入的jsonnet脚本,将直接返回这个优化后的AST,从而避免了重复解析和优化的过程,这也是sjsonnet性能非常好的原因之一。该场景虽然很好的满足了项目的需求,但是对于更加灵活的场景却显得有点捉襟见肘。onlanguage),主要用于:生成数据(json、yaml、ini等),同时,jsonnet也是json的超集,一个合法的json就是一个合法的jsonnet程序,并且带有完整的IDE和。
一位Cursor深度用户的原理探析与实验验证
用Cursor久了,在写完提示词按下回车的那一刻,我们能猜到这个任务是否能被Cursor自动完成。用本文所讲的原理来分析,如果有个任务,能在较短的提示词中被直接描述清楚,或是让Cursor有线索在几步之内找到所需的上下文,那这样的任务就很有希望能被自动完成。接下来,我们在CursorIDE中做若干操作,观察Cursor后台服务和大模型的交互过程。从Cursor的提示词中,我们能看到它能使用工具的列表。仅用如此普通的工具,就能取得如此惊艳的效果,基模的能力至关重要。
淘宝购物车拖拽功能的思考与实践
本文深入剖析了购物车拖拽功能的技术实现路径,在复杂业务场景下通过精细化控制、合理架构分工与细节体验打磨,实现了高效、稳定、流畅的用户交互体验。功能演示拖拽演示Weexdemo购物车场景为什么需要拖拽?▐2.1购物车功能&分组与拖拽的关系购物车作为用户准备购买的商品集合,承担着展示+管理的功能。上述管理操作都是针对单一商品,为了丰富对于所有购物车商品的管理形式,在iCart版本新增了和店铺并列的分组概念。允许用户把不同店铺内的不同商品放置在同一个区块内,提升勾选、凑单、结算的效率。
MNN LLM Chat iOS 流式输出优化实践
团队在端智能、端云协同、商品三维重建、真人三维重建、3D引擎、XR引擎等方面有着深厚的技术积累,先后发布深度学习引擎MNN、商品三维重建工具ObjectDrawer、3D真人数字人TaoAvatar、端云协同系统Walle等。最终,我们通过底层增加缓冲输出,中层合并更新请求,UI层提供视觉缓冲——这三层配合实现了从技术优化到体验优化的完整覆盖,提升整体性能和体验效果。综上,结合三层的优化,通过以上多层协同优化方案,我们成功地将一个卡顿、生硬的文字输出体验转变为流畅、自然的现代化AI交互界面。
万字长文解码如何玩转Prompt(附实践应用)
在AI技术迅猛发展的今天,如何与大型语言模型高效“对话”已成为释放其潜力的关键。本文深入探讨了提示词工程(PromptEngineering)这一新兴领域,系统解析了从基础概念到高级技巧的完整知识体系,并结合“淘宝XX业务数科Agent”和科研论文深度学习两大实战案例,揭示了高质量提示词如何将AI从“工具”升级为“智能协作者”。无论你是初学者还是实践者,都能从中掌握让AI真正为你所用的核心方法论。引言:新范式下的“对话”艺术与科学我们正身处一个由大型语言模型驱动的AI新纪元。从GPT-4到Deepseek
大模型驱动SPU
本文围绕SPU(标准化产品单元)的演进与挑战,系统分析了当前SPU在定义、生产、审核和数据治理方面存在的核心问题,如SPU定义与商品类目强耦合、数据质量不及预期、审核效率仍有提升空间、存在同质化数据等。为应对这些问题,文章重点介绍了通过引入AI/大模型技术,在SPU生产、审核与治理链路中的实践成果,包括算法生成SPU、机审辅助、外包审核流程优化及数据质量提升,并推动了商品托管等应用场景落地。针对产品信息不完整问题,在现有属性不调整情况下,将商品属性、服务属性、资质属性均纳。收敛新增权限,建设新品发布。