Loading...
此外,Transformer的权重矩阵包括Attention模块里用于计算query,key,value的Wq,Wk,Wv以及多头attention的Wo,以及MLP层的权重矩阵,LoRA只应用于Attention模块中的4种权重矩阵,而且通过消融实验发现同时调整Wq和Wv会产生最佳结果。提升模型在正样本上的概率(优化模型在正样本上的概率大于参考模型在正样本上的概率),降低模型在负样本上的概率(优化模型在负样本上的概率小于参考模型在负样本上的概率)。
当我们在谈多端一码时,我们在谈论什么
文章从背景问题出发,详细阐述了KMP的核心技术特性,并结合直播业务的实际场景,分享了从技术预研到复杂业务落地、再到架构迁移的完整经验。随着直播技术业务的不断迭代,直播各端业务代码以及架构差异变得愈发明显,同时双端不平衡的开发资源也加剧了这种差异的产生。如何解决这些差异,首先映入脑海里的自然是一些已经较为成熟的跨平台方案,例如Flutter、Weex(2.0)和DX等等,但是这些跨平台方案实际上在直播业务中都有过各种尝试,因为各自的一些特性以及直播业务的特殊性,最后都没能实现多端一码的目标。
淘宝直播组件调度、复用和治理
直播间组件的加载都是比较耗时的。前面我们说到过组件治理的一个方向是组件渲染的优化,目的是通过优化视图布局层级,使用更稳定、优化的布局方式,提升组件上屏渲染的性能。是指组件本身的复用(组件对象和组件对应视图View的复用)以及组件内部元素的复用(比如基于列表RecyclerView组件的RecyclerView.ViewHolder,DXView的复用等等)上面我们说到直播间组件加载的三段式中,组件的注册和组件视图创建并不是每次上下滑都会执行的,因为存在直播间组件的复用。
淘宝Java工程师的LLM开发实践
Embedding是一种强大的技术,它能够将高维、稀疏的离散数据,如文本、图像、用户行为等,映射到低维、稠密的连续向量空间。而切分后的小块文本更易于进行索引和检索,能够加速检索阶段的相似度计算。在这些领域中,使用Fine-Tuning(微调)技术可能是一个更为合适的选择,通过微调可以使模型更好地适应特定领域的需求,提高模型在该领域的性能和准确性。在这一阶段,首先会将用户输入的query发送给向量数据库进行相似度检索,然后把检索到的内容输入给LLM进行总结生成,最后将最终的结果返回给用户。
CursorRules:AI编程助手规则调优实战
它可不是简单的配置文件,更像是你给AI助手量身定做的"行为规范手册",或者说是孙悟空头上的那个"紧箍咒"——当然,咱这是友好的、为了高效合作的"咒"。但现在,Cursor更推荐用新的方式(老方法未来可能不支持了哦):在项目根目录下创建一个.cursor文件夹,然后在里面再建个rules文件夹,最后把你的规则分门别类写在不同的.mdc文件里,比如python.mdc管Python的事,react.mdc管React的事。一般来说,项目特定规则的"威力"更大。
淘天⾃营质量技术AI智能体的实践和思考
我们积极探索前沿技术,持续技术创新和突破,用AI驱动质量革新,保障亿级系统可靠性,提升系统的稳定性和安全性,让用户享受更好的服务体验,让商家更高效、低成本地运营。文章详细阐述了AI智能体的整体架构设计、核心能力(如工具调度、数据查找、链路诊断等)、具体实施方案及其应用效果,并展望了未来在AI赋能质量技术领域的规划与发展方向。注意⼯具语义描述,⼯具的基础信息能够准确⽀持⽤户查找、使⽤他的所有场景,并且能够区别其他相似⼯具。常⻅有2种接⼊⽅式,⽅案1⽆法做到通⽤,本⽂重点介绍⽅案2的实现。
JianYi: 淘宝家装行业的分割&抠图系统
一支专注于通过AI和3D技术驱动商业创新的技术团队,依托大淘宝丰富的业务形态和海量的用户、数据,致力于为消费者提供创新的场景化导购体验,为商家提供高效的场景化内容创作工具,为淘宝打造围绕家的场景的第一消费入口。我们不断探索并实践新的技术,通过持续的技术创新和突破,创新用户导购体验,提升商家内容生产力,让用户享受更好的消费体验,让商家更高效、低成本地经营。在抠图的后处理阶段,我们摒弃传统的腐蚀和膨胀方法,采用联通域合并和最小集提取技术来过滤噪声,确保抠图结果更清晰准确。
浅谈团队代码风格/结构一致性
我所在的团队,一部分职责是开发维护直播业务中主播直播售卖商品的时候的CPS佣金体系,完成消费者点击商品的行为跟踪,以及下单后把订单归因到主播,以及后续的计费、扣佣过程。轮子是2022.06开始造的,作为技术演进的项目,推进方式上主要是两个点:新的服务、应用直接采用规范的代码模式,老的应用和服务,随着业务需求的演进和人力情况逐步迭代。当然也可以做复杂的编排。珠玉在前,所以去解决前面提到的问题,很好的思路就是在应用中以某个框架形式的代码约束,统一代码分层风格,并逐步推广到域内的多个应用,实现规模化的效果收益。
淘天自营前端开发的AI增效实践总结
目前鸿雁AICoder的主要用户仍然是前端开发同学,但随着文本大模型和多模态大模型的发展,输入口语化的描述,就能得到优质的文档/原型图,也能够为其他领域的工作提效。从最开始功能独立的AI工具到融合开发生态的AI插件,再到包罗万象的AI平台,什么才是最适合我们、最适合业务、最适合真正落地的方案呢。在AI重塑生产力的时代浪潮中,技术团队始终在探索效率的边界。与鸿雁ABC工作台深度集成,实现“一站式”开发到投产,模块、迭代、仓库、代码都有了,你需要做的只是点点按钮,改改细节。
MCP入门指南:大模型时代的USB接口
类似于USB接口对计算机的作用,MCP为人工智能提供了一种通用的连接方式,能无缝整合数据源、工具和上下文信息,从而显著增强AI的能力。作为"大模型时代的USB接口",MCP提供了一种标准化的方法,使AI能够访问各种数据源、利用多样化的工具,并在更丰富的上下文中工作。MCP作为一个开放且标准化的协议,在连接AI与外部世界方面具有革命性意义,不仅提升了AI的功能边界,还为开发者和用户提供了前所未有的便利。对于开发者而言,MCP简化了集成过程,减少了重复工作,并提供了更安全、更可控的方式来增强AI功能。
亿级流量下的前端高可用架构实践:淘宝春节许愿主互动
在上面的视频中我们可以看到,在我们的玩法中,用户一共有30个心愿,在用户许完所有愿望之前,可以不停地循环需要,所以对应的我们的灯笼动画的执行也是一个循环的过程,整个过程可以拆解为几个阶段:灯笼入场、心愿选择、心愿编辑、完成心愿选择,灯笼飞去中间、玩法点亮灯。主玩法动画交互链路复杂,一共有100+动画元素,包括(spine、lottie、css、视频等不同类型),在不同的业务流程中,需要对不同的动画元素进行按序组合,保证在同一个动画流程中不同动画的执行顺序。
2025淘宝春晚互动小游戏技术方案揭秘
渲染会被中断,从而出现灯不见的情况,并且我们本次春晚为了保障灯笼的清晰度,使用的灯的素材也是高画质,尺寸非常大,尽可能没有压缩,所以在渲染灯时,会更容易出现内存不足情况。的物理引擎,但是由于本次场景中,碰撞的场景不多,并且我们追求极致性能和体验,所以我们本次小游戏的实现中没有使用物理引擎,而是采用更轻量的方案实现,每帧计算碰撞情况。年春节主互动的技术实现,揭秘春晚互动背后复杂的前端方案如何应对高并发与跨端协同的技术挑战,并通过万字长文全面解读春节主互动前端技术的演进与升级。然后,对网格中的每个顶点进行。
读书笔记:淘宝十年产品与技术演进史
打折不是促销,而是立减。“考古”是一个很有意思的事情,因为可以通过一些材料,去回想当时人们的生活环境,遇到的问题,以及如何解决,可以了解前人的智慧,汲取力量。到2008年初,整个主站系统(有了机票、彩票系统之后,把原来的系统叫做主站)的容量已经到了瓶颈,商品数在一个亿以上,PV在2.5亿个以上,会员超过了5000万个。这时Oracle的连接池数量都不够用了,数据库的容量到了极限,即使上层系统加机器也无法继续扩容,只有把底层的基础服务继续拆分,从底层开始扩容,上层才能扩展,才能容纳以后三五年的增长。
MNN LLM:让你手机本地也能跑 DeepSeek R1 还能支持多模态
modelscope用户可以下载后指定config文件运行,例如./mlsserve-c/Users/songjinde/.cache/modelscope/hub/MNN/DeepSeek-R1-1.5B-Qwen-MNN/config.json。下载完成后,记得在~/.mnnmodels文件夹下找到找到配置文件,设置config.json中的backend为合适的backend,例如mac上建议设置backend为`metal`。
AI驱动研发效率在中后台的实践
除了日常的研发辅助类的工具(如:Cursor,Copilot类产品)以外,希望能针对业务特色的痛点和专属场景,在现有流程上进行定制,不仅仅是辅助编码,更是的研发模式的升级和和扩展。我们统计了团队内部的同学在一线业务需求研发的过程中,研发流程各个阶段的耗时比例,统计的方式主要是通过一线开发同学的主观反馈,因为一个需求研发过程并不是连贯的,大部分的同学手里同时都在做多个需求,并且也会由于各种客观原因,比如需求发生调整,业务以来信息还没有准备完成,人员抽调等等,很难进行精确的时效统计。
2025 AI驱动研发工具对比丨独立测评
这一类的产品AI驱动的全栈Web开发工具,主要是将大模型与浏览器内开发环境集成,适合新手或喜欢简洁界面的用户,提供直观易懂的操作界面,有的产品专注于UI设计实现,便于快速完成产品原型设计,非常适合前端开发者和设计师。相信绝大部分的开发者接触的第一款AI研发工具都是copilot,在第一次使用时候带来的那种震撼的感觉,但是随着时间的发展,copilot似乎没有很好的维持自己的先发优势,开源的竞品在产品力和出码效果上都紧追不舍。其基于浏览器的环境简化了工作流程,尽管它可能面临非常复杂的项目的限制。
基于AIGC技术的营销短视频生产方案及业务实践
在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流。我们需要解决的问题是将冗长的5-10分钟直播看点视频高效转化为更精简、更具吸引力的短视频,同时结合商品的丰富信息,例如主图、主图视频及其他相关可用素材,以进一步增强视频的营销效果。对此,我们结合了视频画面信息,以进行更精细的裁剪。
淘宝质量保障之主动预警能力建设
接着,文章介绍了预警流程的设计,借鉴。部分开发在配置平台中配置了时间字段,因此时间过期也是需要预警的问题,这个核心解法是通过全量扫描制定应用的配置平台配置中的关键字,如time,date等,发现配置的Key和value中存在此字段,就解析对应的值,来检查是否满足过期告警时间。在业务的质量保障过程中,主动预警是较为重要的一项,可以帮助我们提前发现问题,尤其是权益过期,库存耗尽,资源位过期等问题,等到监控发现时再恢复,再快也快不过提前预警,因此,我们探索在业务各个方面实现主动预警监控的能力。
基于Flow-matching的扩散模型原理解读
虽然我们不在此证明该公式,但可以从物理直观上理解:在微观层面上,空气中每一点处的空气分子的运动方向和速度是随机的(可以用一个随机微分方程描述),但是在宏观上可以用统一的“风速场”进行描述(可以用常微分方程描述)。在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流。描述了变换过程中空间伸缩的程度。
虚拟线程/有栈协程对于Java的意义
但是java的虚拟线程并不是完美的,假设有某种场景,使得虚拟线程挂载在载体线程上,而无法卸载(称之为pin),而此时,虚拟线程调用了阻塞IO被阻塞,那么载体线程也将会被阻塞。后来随着多核技术的兴起,Linux也提供了多线程的能力,这时“绿色”线程的劣势就暴露出来了,它本质上还是只能使用操作系统的单核进行并发,无法充分利用多核进行并行操作,并且所有的线程阻塞、调度逻辑都需要由java实现,而不能使用操作系统的能力。同理,在协程中,关键问题就在于怎么存储、恢复、切换协程的上下文。