Loading...

多模态AI质检:身份核验场景实践
针对用户上传身份证时常见的图片问题,项目通过引入阿里云百炼平台的多模态模型,在OCR识别失败时进行智能检测与反馈,提供对客友好的提示文案,从而引导用户重新上传合格照片。上线后,相关指标表现出积极变化,OCR失败用户的再次失败率(OCR失败用户中再次识别仍失败的比例)有所下降,申请转化率有所提升。将“珠海”识别为“上海”。通过大模型提示词的增强优化,无需对每个场景进行大规模定制,用于多种类型的证件上传场景即可快速扩展功能,为更多业务场景赋能,未来结合工作流或智能体编排,将进一步提升可维护性和功能扩展能力。

基于智能体的自适应资损防控体系 - 淘工厂实践(二)
基于这些数据,Agent能够自动生成具体的监控建议,明确指出需要监控的具体对象、最佳监控时机、适用的监控类型,以及具体的监控值指标。正如我们在测试领域所践行的理念——"Withgreatpowercomesgreatresponsibility",当我们拥有了AI这样强大的工具,更应该思考如何用它来创造更大的价值,守护每一分应得的收益,为业务的健康发展保驾护航。”的问题,新范式中,我们的Agent结合上文智能化提取到的知识,对用户输入的“小程序-下单积分玩法”需求文档,展开分析。

AI赋能前端开发提效实践:以长颈鹿接入为例
面对Weex/Muise架构限制、跨端兼容难题及分散的文档体系,作者转变传统开发模式,构建结构化、可被AI理解的研发知识库,并结合项目级编码规范与RAG技术,实现AI在组件开发、埋点集成、支付对接等环节的高效协同。但该项目积累的开发规范、组件模板与AI提示工程经验,在后续迁移至778红包项目时实现了高效复用,显著缩短了开发周期,提效成果得以充分释放。每天有较多用户在手淘搜索:天猫超市卡,经与搜索团队沟通,可在搜索长颈鹿场景下,直接透传猫超卡充赠组件,提升用户转化,给用户提供最直接的猫超卡充值服务。

让你的大模型读懂二方包
另外理论上可以考虑直接把这个api的网页导出到markdown形式试一试,只不过我看了网页里面还嵌套了语雀文档,语雀文档中再去叙述出参里面代表了什么,而且网页里面的信息我看了一下和实际二方包也不符,比如要传入的订单id,网页中显示是long,实际二方包是传入的long[],所以就放弃了。生成的代码质量和准确率飙升,连。近期有一个需求中需要查询用户订单状态,这个功能本身很简单,是一个经典的依赖下游场景,需要读取交易订单二方包的代码逻辑,并分析出入参出参的含义,并判定用户指定的订单是否已经进入终态。

基于《架构现代化》浅谈架构共鸣
但其实,其厚度是不一样的。这样的认知下,架构应该是架构师,团队TL,领域专家大家一起共创和共识的结构,案例的输入既有上面的用户动线,业务策略比较偏问题域的部分,也有具体的实现案例,反射出问题域讨论未考虑到点。因为这样的过程,我们还是需要可以“沉淀的部分”,这是架构活动本身重复的抽象,是“架构”的“架构”。所以,当我们进入一个新的环境的时候,虽然看到的是系统复杂度,流程复杂度等一系列需要适应和学习的门槛,但是背后还是这个领域的“厚度”,其解决的问题需要涉及的相关方较多,概念的抽象和维护压力也很大。

AI审核工程实践: 淘宝极有家破损包赔项目思考
有18笔人审单多次重试,也没有成功。AI智能人审能够结合自动化规则,并利用大模型的多模态、推理、概括等能力,识别用户上传的商品照片和订单信息是否相符,解析物流信息和聊天记录,综合判断佐证材料是否充分,最后给出保险理赔建议。27个FP分类结果中,6个和审核尺度相关,10个需要人工根据经验判断是质量原因还是物流原因,商品订单和照片不一致的6个案例中,有4个也可以理赔通过。剔除额度问题的审核单,理赔通过的概率有80%,因此不能以简单的准确率来衡量模型的效果,可以考虑模型标注可能破损的地方,提高人审效率和可信性。

AI Agent工程化融合:分享我的实践经验和选型技巧
问题在于SSE的整个通讯过程都需要依赖SSE长链接,一旦出现网络毛刺(短暂中断),那么MCPServer向MCPClient发送的数据就会丢失,并且MCPServer无法感知到数据的丢失。举一个通俗的例子,把MCPClient想象成DVD播放器,DVD播放器可以放入不同的碟片(MCPServer),不同的碟片有不同的内容(能力),但肯定不能向DVD播放器中放入磁带(不符合MCP的Server)。对于不同的报表场景,定时时间、具体的网页操作、要关注的指标、联系人等都各不相同。

HSF 序列化不可变集合类型问题原因分析
由于hessian2在序列化时仅序列化了tag字段,所以反序列化java.util.CollSer实例完成后,只有tag字段值为1,表示List,但是没有元素,即array字段为null,由于java.util.CollSer实现了readResolve方法,在反序列化完成后会调用它,但是由于array字段为null,所以抛出InvalidObjectException异常,反序列化失败。根据报错信息,原因是HSF不支持序列化/反序列化不可变集合类型。

分享一下我对好代码的理解
商业能力扩展、域扩展,在执行回收结果的时候,会遍历实现的插件,并结合回收规则,进行及时的熔断。于每一步棋来说,我们只能看到局部的影响(受限于我们能想到后面几步),当我们事后站在全局的角度看,有可能的“平平无奇”的一步却起着关键性的作用。闭原则,在面向对象编程领域中,规定“软件中的对象(类,模块,函数等等)应该对于扩展是开放的,但是对于修改是封闭的”,这意味着一个实体是允许在不改变它的。我们渐渐从单一的完成任务,开始思考如何更好地完成任务,从短期的设计开始考虑长期的感受,从单一的指标开始考虑更多的因素,

深入聊聊RAG
日常我们会比较多的把RAG当成一个黑盒,输入是我们沉淀的文档,输出可能是整个AI应用反馈的最终结果(如下图所示),这样的方式下,我们可能可以收获一定的初期收益,但是当要持续优化或者扩展使用场景的时候,可能会缺乏评估和应对的方式,比较难去定位问题,因此也不太能说清楚当下链路的诉求,最后所对应的action也可能会偏离比较大。),中文的处理可以找相应的中文embedding模型,但是不是所有语言都有对应的编码模型,因为语种太多,同时如果一些语种对应的数据语料太少,不足以训练这样的一个模型。

Jsonnet 一种“新”的Json数据转换工具
这个优化后的AST将会在sjsonnet内部进行缓存,后续针对同一个输入的jsonnet脚本,将直接返回这个优化后的AST,从而避免了重复解析和优化的过程,这也是sjsonnet性能非常好的原因之一。该场景虽然很好的满足了项目的需求,但是对于更加灵活的场景却显得有点捉襟见肘。onlanguage),主要用于:生成数据(json、yaml、ini等),同时,jsonnet也是json的超集,一个合法的json就是一个合法的jsonnet程序,并且带有完整的IDE和。

一位Cursor深度用户的原理探析与实验验证
用Cursor久了,在写完提示词按下回车的那一刻,我们能猜到这个任务是否能被Cursor自动完成。用本文所讲的原理来分析,如果有个任务,能在较短的提示词中被直接描述清楚,或是让Cursor有线索在几步之内找到所需的上下文,那这样的任务就很有希望能被自动完成。接下来,我们在CursorIDE中做若干操作,观察Cursor后台服务和大模型的交互过程。从Cursor的提示词中,我们能看到它能使用工具的列表。仅用如此普通的工具,就能取得如此惊艳的效果,基模的能力至关重要。

淘宝购物车拖拽功能的思考与实践
本文深入剖析了购物车拖拽功能的技术实现路径,在复杂业务场景下通过精细化控制、合理架构分工与细节体验打磨,实现了高效、稳定、流畅的用户交互体验。功能演示拖拽演示Weexdemo购物车场景为什么需要拖拽?▐2.1购物车功能&分组与拖拽的关系购物车作为用户准备购买的商品集合,承担着展示+管理的功能。上述管理操作都是针对单一商品,为了丰富对于所有购物车商品的管理形式,在iCart版本新增了和店铺并列的分组概念。允许用户把不同店铺内的不同商品放置在同一个区块内,提升勾选、凑单、结算的效率。

MNN LLM Chat iOS 流式输出优化实践
团队在端智能、端云协同、商品三维重建、真人三维重建、3D引擎、XR引擎等方面有着深厚的技术积累,先后发布深度学习引擎MNN、商品三维重建工具ObjectDrawer、3D真人数字人TaoAvatar、端云协同系统Walle等。最终,我们通过底层增加缓冲输出,中层合并更新请求,UI层提供视觉缓冲——这三层配合实现了从技术优化到体验优化的完整覆盖,提升整体性能和体验效果。综上,结合三层的优化,通过以上多层协同优化方案,我们成功地将一个卡顿、生硬的文字输出体验转变为流畅、自然的现代化AI交互界面。

万字长文解码如何玩转Prompt(附实践应用)
在AI技术迅猛发展的今天,如何与大型语言模型高效“对话”已成为释放其潜力的关键。本文深入探讨了提示词工程(PromptEngineering)这一新兴领域,系统解析了从基础概念到高级技巧的完整知识体系,并结合“淘宝XX业务数科Agent”和科研论文深度学习两大实战案例,揭示了高质量提示词如何将AI从“工具”升级为“智能协作者”。无论你是初学者还是实践者,都能从中掌握让AI真正为你所用的核心方法论。引言:新范式下的“对话”艺术与科学我们正身处一个由大型语言模型驱动的AI新纪元。从GPT-4到Deepseek

大模型驱动SPU
本文围绕SPU(标准化产品单元)的演进与挑战,系统分析了当前SPU在定义、生产、审核和数据治理方面存在的核心问题,如SPU定义与商品类目强耦合、数据质量不及预期、审核效率仍有提升空间、存在同质化数据等。为应对这些问题,文章重点介绍了通过引入AI/大模型技术,在SPU生产、审核与治理链路中的实践成果,包括算法生成SPU、机审辅助、外包审核流程优化及数据质量提升,并推动了商品托管等应用场景落地。针对产品信息不完整问题,在现有属性不调整情况下,将商品属性、服务属性、资质属性均纳。收敛新增权限,建设新品发布。

淘宝交易前端AI生码技术的创新实践
DesigntoCode是一种通过设计稿(Done、PSD、MasterGO、Sketch等)生成代码(html、css)的技术,理想的状态下,前端工程师可以靠它从繁杂的设计稿UI实现中解放出来,更多精力可以投入到其它对业务更重要项目中。为了彻底解决这个问题,我们想从设计稿拿到750px的图片,直接进行上传,这是我们选择开发一个设计稿插件的原因之一。设计稿的复制功能,再去钉钉粘贴下载,最后去OneDay图片缩放插件进行缩放,这样获得的图片可以解决手动截图导致的边框问题,但是还是需要我们进行缩放,

Web Agent大对决:你的AI浏览器理想型,会是哪一个?
可以看到除ChatGPTAgent外,其他三款产品均未参与或公布标准化基准测试结果,ChatGPTAgent以90分的总分领先,Fellou获得52分位居第二,而Comet和Dia的评分均低于20分,反映了严重的数据透明度不足问题,反映了WebAgent行业在评测标准化方面的不成熟。团队支撑的业务能力覆盖电商全链路,从产业分析到智能运营决策,从商家经营自动化到生态创新,从行业消费者体验提升到产业链模式创新,覆盖了服饰、快消、消电、企业服务等各个行业,构建着智能驱动的商业革新引擎。

基于智能体的自适应测试系统 - 淘工厂实践
我们需要让他在这个流程中承担什么任务/解决哪类问题(角色定位),在原有基础上具备哪些专业知识(知识库)、如何解释手头任务并布置给他(提示词)、如何正确的思考并接受反馈改进(提示词)、可以使用的工具及资源(工具调用),随着时间推移,他经历的多了、收录过往的case多(补充沉淀知识库),这位应届生也会变得越来越专业,能力越来越强。从执行结果、过程日志分析提炼,结合部分人工标注结果,评估分析、并实现经验回流和用例沉淀,回补到各域以及对抗助手的正负向向知识库,同时,不断沉淀该域的用例,自我完善。

聊聊AI Coding
VibeCoding,翻译是“氛围编码”(感觉蛮贴切),本质上是一种我们使用AI能力进行编码的方式,在这个模式下,我们把AI当成一个回答问题的机器,我们描述我们的诉求,让它帮我们写一段可运行的符合诉求的代码,如果产出的版本有问题(不符合诉求或者是运行错误),我们会根据相关的反馈(编译器、运行时错误、诉求差异点描述)重新调整我们的prompt,让AI进行迭代优化,直到解决问题为。更高效的做法是,对这个问题做一定的解读,可以a、针对该问题通过进一步的提问来帮助AI快速定位和解决;可能有一些不同的声音;

欢迎留下您的脚印