Loading...

机器学习40讲-10:特征预处理
显然,空间标识算法将所有的数据点都映射到高维空间的球面上,这个映射和标准化或者归一化的不同之处在于它处理的对象并不是所有样本的同一个特征,而是同一个样本的所有特征,让所有样本呈现一致的尺度。二是出现频率最高的特征取值的出现频率应该在出现频率次高的特征取值频率的20倍以上,如果有90个样本的特征取值为1,4个样本的特征取值为2,其余取值的样本数目都在4个以下,这样的特征就可以被删除了。可如果把(身高,体重)的二元组看作二维空间上的点的话,代表我自己的点显然和代表S码的点之间的欧式距离更近。

数组第K大数字求解:单核/多核算法设计-Java
算法时间复杂度空间复杂度适用场景快速选择O(n)最优O(1)大数据量、追求极致性能小根堆O(nlogk)O(k)数据量中等、代码简洁单核首选:快速选择算法O(n)最优,小根堆O(nlogk)简洁易用多核首选分治并行+快速选择,自动适配CPU核心数,大数据量下效率最大化Java实现要点:线程池管理线程、子数组TopK剪枝、最终快速选择归并结果边界处理:数组长度≤核心数时自动降级为单核算法,避免冗余开销t=Q239。

机器学习40讲-09:实验设计
这个假设在实际的学习任务中显然并不总是成立的,埃塞姆·阿帕丁(EthemAlpaydin)在他的《机器学习导论》(IntroductiontoMachineLearning,3rdEdition)中提到,在主成分分析的预处理与$K$近邻分类的级联算法中,主成分数目的每个选择都给后面的$K$近邻定义出一个全新的输入空间,这会使$K$近邻的最优超参数出现变化——在10维输入中计算出的最优近邻数目未必适用于15维的输入。机器学习的目标是模拟数据的内在生成机制,取得较低的泛化误差和较强的预测精度。

机器学习40讲-08:模型的评估指标
分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​https://www.captainai.net/troubleshooter用训练数据集拟合出备选模型的参数,再用验证数据集选出最优模型后,接下来就到了是骡子是马牵出来溜溜,也就是模型评估的阶段了。模型评估中使用的是测试数据集,通过衡量模型在从未出现过的数据上的性能来估计模型的泛化特性。为简便起见,我将以二分类任务为例来说明度量模型性能的不同指标。二分类任务是最重要也最基础的机器学习任务,其最直

机器学习40讲-07:模型的验证方法
上图就是一个典型的过拟合例子:黑点代表的离散数据可以看成是满足线性关系的原始数据和随机噪声的叠加,受噪声的影响,即使是生成数据的直线也不能完全拟合数据,总归存在一定的残留误差。定性而论,模型在训练集上的精度不能太低。做老师的都知道,一次考试中的学生成绩应该是近似满足正态分布的,所以在评估教学效果时,学生样本的构成就至关重要:如果选的都是成绩较好的学生,那他们在自习室自学的效果可能还比上课更好;由于每一轮中选择的验证集都互不相同,每一轮验证得到的结果也是不同的,$k$个结果的均值就是对泛化性能的最终估计值。

区块链是怎么实现的-通俗版,不讲难懂术语
数据打包成区块区块用指纹环环相扣成链全网机器同步存完整账本全网共同投票验证合法性密码学保证身份和交易安全合在一起=区块链t=Q239人工智能教程​​​​​https://www.captainai.net/troubleshooter。

区块链原理-大白话极简版
分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​​​​把原理拆成。

大白话讲智能合约
分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​​​。

大白话讲区块链
区块链=分布式、不可改、公开透明、无中介的数据库账本技术。不是只有虚拟币,虚拟币只是区块链的一种应用。t=Q239人工智能教程https://www.captainai.net/troubleshooter。

机器学习40讲-06:模型的设计准则
如果把不同模型看成一个班级里的不同学生,不同问题看成考试时的不同科目,NFL定理说的就是在这个班里,所有学生期末考试的总成绩都是一样的,既然总成绩一样,每一科的平均分自然也是一样的。模型的复杂度越高,其方差也就越高。奥卡姆剃刀是人类思维的一种直观的体现,你我在不经意间都会用到它:当看到1,2,4,8这几个数时,对下一个出现的数字,你的第一反应一定是16,因为这一系列数字里蕴含的最简单的规律是等比数列关系,而不是什么包含十几二十个参数的高阶多项式,这个复杂的结果直接被头脑中的那把剃刀无意识地砍掉了。

机器学习40讲-05:模型的分类方式
所以在参数模型的学习中,算法的任务就是求出这些决定概率特性的参数,只要参数确定了,数据的统计分布也就确定了,即使未知的数据无穷无尽,我们也可以通过几个简单的参数来确定它们的性质。需要注意的是,“非参数模型”不是“无参数模型”,恰恰相反,非参数模型意味着模型参数的数目是不固定的,并且极有可能是无穷大,这决定了非参数模型不可能像参数模型那样用固定且有限数目的参数来完全刻画。相比之下,参数模型具有全局的特性,所有数据都满足统一的全局分布,这就像履至尊而制六合得到的扁平化结构,一组全局分布的参数支配着所有的数据。

模拟消息队列的消费逻辑-Java
***消费消息*@returntrue表示消费成功,false表示失败需重试*/"这个消费模型具备生产级可靠性:分区有序保证业务正确性、重试+死信处理异常、背压机制防止下游被打垮。同时提供了一套完整的测试策略覆盖功能、并发、性能和混沌场景。更重要的是,这个设计是可观测的——暴露了关键的metrics,方便监控和容量规划。t=Q239人工智能教程​​​​​https://www.captainai.net/troubleshooter。

设计一个限流器(Rate Limiter)-Java
分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​​​这是一个,重点突出:并发安全、可测试性、策略灵活度、性能考量,以及如何验证它。这里提供两种经典实现,并说明各自的适用场景。

解析金融时间序列数据-Java
分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​​这是一个,重点突出:时间处理精确性、数据完整性校验、修正数据处理、内存效率、以及可测试性设计。

程序设计-有一个实时交易系统,成交价格会持续写入。现在需要你设计一个模块,能够:实时接收新的成交价,在任意时刻快速返回当前成交价的中位数
分享一个大牛的人工智能教程。希望你也加入到人工智能的队伍中来!

SQL-表 order(id, user_id, amount, status, created_at),status 含 SUCCESS。写一个SQL,查询每个用户最近一笔成功的订单记录
分享一个大牛的人工智能教程。希望你也加入到人工智能的队伍中来!外层查询筛选出编号为1的记录,即每个用户最近的一笔成功订单。为每个用户的订单按时间倒序编号,最近的一条编号为1。

测试用例设计-微信发红包P0P1测试用例
分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​针对微信发红包功能,为核心功能(必须跑通,否则阻塞发布),为重要功能(需覆盖主流异常与边界)。。

RPC、HTTP、WebSocket的区别
用RPC:在你控制的后端服务之间,需要高性能、强类型、低延迟的内部调用。例如:一个订单服务调用用户服务。选gRPC。用HTTP:对外提供API,需要通用、简单、防火墙友好、无状态。例如:手机App请求新闻列表、浏览器加载网页。选RESTfulAPI。用WebSocket:需要服务端随时主动推送数据或进行双向实时交互。例如:在线客服、多人在线游戏、股票K线图。不要用HTTP轮询,浪费资源且不及时。

程序设计-二进制字符串操作计数
分享一个大牛的人工智能教程。希望你也加入到人工智能的队伍中来!人工智能教程​​​​​​。

程序设计-构造零和唯一绝对值数组
分享一个大牛的人工智能教程。希望你也加入到人工智能的队伍中来!人工智能教程​​​​​。

欢迎留下您的脚印