Loading...

读书笔记:淘宝十年产品与技术演进史
打折不是促销,而是立减。“考古”是一个很有意思的事情,因为可以通过一些材料,去回想当时人们的生活环境,遇到的问题,以及如何解决,可以了解前人的智慧,汲取力量。到2008年初,整个主站系统(有了机票、彩票系统之后,把原来的系统叫做主站)的容量已经到了瓶颈,商品数在一个亿以上,PV在2.5亿个以上,会员超过了5000万个。这时Oracle的连接池数量都不够用了,数据库的容量到了极限,即使上层系统加机器也无法继续扩容,只有把底层的基础服务继续拆分,从底层开始扩容,上层才能扩展,才能容纳以后三五年的增长。

MNN LLM:让你手机本地也能跑 DeepSeek R1 还能支持多模态
modelscope用户可以下载后指定config文件运行,例如./mlsserve-c/Users/songjinde/.cache/modelscope/hub/MNN/DeepSeek-R1-1.5B-Qwen-MNN/config.json。下载完成后,记得在~/.mnnmodels文件夹下找到找到配置文件,设置config.json中的backend为合适的backend,例如mac上建议设置backend为`metal`。

AI驱动研发效率在中后台的实践
除了日常的研发辅助类的工具(如:Cursor,Copilot类产品)以外,希望能针对业务特色的痛点和专属场景,在现有流程上进行定制,不仅仅是辅助编码,更是的研发模式的升级和和扩展。我们统计了团队内部的同学在一线业务需求研发的过程中,研发流程各个阶段的耗时比例,统计的方式主要是通过一线开发同学的主观反馈,因为一个需求研发过程并不是连贯的,大部分的同学手里同时都在做多个需求,并且也会由于各种客观原因,比如需求发生调整,业务以来信息还没有准备完成,人员抽调等等,很难进行精确的时效统计。

2025 AI驱动研发工具对比丨独立测评
这一类的产品AI驱动的全栈Web开发工具,主要是将大模型与浏览器内开发环境集成,适合新手或喜欢简洁界面的用户,提供直观易懂的操作界面,有的产品专注于UI设计实现,便于快速完成产品原型设计,非常适合前端开发者和设计师。相信绝大部分的开发者接触的第一款AI研发工具都是copilot,在第一次使用时候带来的那种震撼的感觉,但是随着时间的发展,copilot似乎没有很好的维持自己的先发优势,开源的竞品在产品力和出码效果上都紧追不舍。其基于浏览器的环境简化了工作流程,尽管它可能面临非常复杂的项目的限制。

基于AIGC技术的营销短视频生产方案及业务实践
在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流。我们需要解决的问题是将冗长的5-10分钟直播看点视频高效转化为更精简、更具吸引力的短视频,同时结合商品的丰富信息,例如主图、主图视频及其他相关可用素材,以进一步增强视频的营销效果。对此,我们结合了视频画面信息,以进行更精细的裁剪。

淘宝质量保障之主动预警能力建设
接着,文章介绍了预警流程的设计,借鉴。部分开发在配置平台中配置了时间字段,因此时间过期也是需要预警的问题,这个核心解法是通过全量扫描制定应用的配置平台配置中的关键字,如time,date等,发现配置的Key和value中存在此字段,就解析对应的值,来检查是否满足过期告警时间。在业务的质量保障过程中,主动预警是较为重要的一项,可以帮助我们提前发现问题,尤其是权益过期,库存耗尽,资源位过期等问题,等到监控发现时再恢复,再快也快不过提前预警,因此,我们探索在业务各个方面实现主动预警监控的能力。

基于Flow-matching的扩散模型原理解读
虽然我们不在此证明该公式,但可以从物理直观上理解:在微观层面上,空气中每一点处的空气分子的运动方向和速度是随机的(可以用一个随机微分方程描述),但是在宏观上可以用统一的“风速场”进行描述(可以用常微分方程描述)。在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流。描述了变换过程中空间伸缩的程度。

虚拟线程/有栈协程对于Java的意义
但是java的虚拟线程并不是完美的,假设有某种场景,使得虚拟线程挂载在载体线程上,而无法卸载(称之为pin),而此时,虚拟线程调用了阻塞IO被阻塞,那么载体线程也将会被阻塞。后来随着多核技术的兴起,Linux也提供了多线程的能力,这时“绿色”线程的劣势就暴露出来了,它本质上还是只能使用操作系统的单核进行并发,无法充分利用多核进行并行操作,并且所有的线程阻塞、调度逻辑都需要由java实现,而不能使用操作系统的能力。同理,在协程中,关键问题就在于怎么存储、恢复、切换协程的上下文。

音频生成技术探索与淘宝域实践
在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。此外,收集的数据质量对于最终合成语音的效果有着决定性的影响,优质的训练数据对于模型的效果至关重要。但是,随着规模的增大数据集的质量也出现了一定程度的下降,数据集中出现了噪音、多人对话的音频。这样的交叉验证进一步保障了转录文本的准确性。

淘宝客户端动态化页面搭建
而且由于需要携带的信息变多,协议包大小也会有所增加。业务可以通过LifecycleManager.registerLifecycle注册页面的生命周期监听器,对外暴露的生命周期包括系统生命周期(AndroidonCreate/onDestroy,iOSdidAppear/disAppear等),以及自定义的一些页面生命周期切面,比如网络请求、数据处理、预加载等切面。虽然页面整体布局方式大致一致,但是各个版本之间的代码基本是割裂的,如果需要升级协议,每次的工作量都是巨大,而且切流过程也是比较复杂。

技术人的大模型应用初学指南
基于已有开源大模型进行微调训练,如果采用预训练的方式对模型的所有参数都进行训练微调,由于现有的开源模型参数量都十分巨大,如最新千问72B模型(qwen/Qwen1.5-72B-Chat)有720亿参数,对所有的参数都进行处理,那GPU资源成本会非常高,可能高达数百万每年,为了解决这个问题,社区提出了大模型微调的概念:PEFT(Parameter-EfficientFine-Tuning),即对开源预训练模型的所有参数中的一小部分参数进行训练微调,最后输出的结果和全参数微调训练的效果接近。

AI赋能:大模型创新的模板生成与内容填充
在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。图3-3展示给定一个非表格类模板,以及两个充电宝的商品信息,模型首先会对提供的HTML模板进行分析,从给定的商品信息中提取模板填充所需要的素材(标题、副标题、段落标题和正文)等,然后进行准确的、自适应的内容填写。

淘宝直播AI提效探索的一些心得
这个案例取自服务端代码生成项目上,其实内部的aonecopilot在通用任务上做的非常好用了,官方统计的采纳率也达到了25%,是个非常不错的codecopilot的产品,但是对于业务侧的开发来说,这类copilot生成的代码,属于基础实现代码,因为不太能很好的结合当前业务下沉淀的服务、方法来做代码生成,因此我们需要把这部分所谓的服务、方法、工具等接口信息和使用case给到LLM,它才能结合这样的context去做最终代码的生成;随着你继续预测更多的词,这些小比例的错误会累积起来,出错的可能性也会增加。

多模态自动布局技术发展及其在淘内内容场的应用
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。第一篇《淘宝内容AI团队2024年8...

MLLM在电商域互动内容生产的实践
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。第一篇《淘宝内容AI团队2024年8...

大模型时代的视频动静态封面生产方案及业务实践
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...

淘宝全新图生视频大模型“淘宝法象”,助力商家降本增效
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...

大模型时代的内容分析Agent解决方案与业务实践
一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AI...

视频级虚拟试衣技术在淘宝的产品化实践
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...

多模态人物视频驱动技术回顾与业务应用
一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AI...

欢迎留下您的脚印