网站首页 randomstate 第3页
-
谷歌的时间序列预测的基础模型TimesFM详解和对比测试
TimesFM是一个为时间序列数据量身定制的大型预训练模型——一个无需大量再训练就能提供准确预测的模型。TimesFM有2亿参数,并在1000亿真实世界时间点上进行了训练。可以允许额外的协变量作为特征。在本文中,我们将介绍模型架构、训练,并...
2024-10-11 btikc 技术文章 2 ℃ 0 评论 -
孤立森林(Isolation Forest)的异常检测及Python示例
在最近的一个项目中,我研究了一个手机应用用户的数据聚类问题。目标是根据用户的行为对他们进行分类,有可能使用K-means聚类。然而,在检查数据之后,发现一些用户表现出异常行为——他们是异常值。许多机器学习算法在不考虑离群值时,其性能会受到影...
2024-10-11 btikc 技术文章 2 ℃ 0 评论 -
机器学习,KMeans聚类分析详解 kmeans聚类分析基本步骤
来源:数据STUDIO作者:Jim大量数据中具有"相似"特征的数据点或样本划分为一个类别。聚类分析提供了样本集在非监督模式下的类别划分。聚类的基本思想是"物以类聚、人以群分",将大量数据集中相似的数据样本区分...
2024-10-11 btikc 技术文章 2 ℃ 0 评论 -
OpenAI提出Reptile:可扩展的元学习算法
近日,OpenAI发布了简单元学习算法Reptile,该算法对一项任务进行重复采样、执行随机梯度下降、更新初始参数直到习得最终参数。该方法的性能可与MAML(一种广泛应用的元学习算法)媲美,且比后者更易实现,计算效率更高。元学习是学习...
2024-10-11 btikc 技术文章 2 ℃ 0 评论 -
《一天一图学Python可视化》|第8天:更优雅地观察数据分布
我们知道,在描述单个变量时,我们可以使用箱线图、直方图、核密度估计图等将数据的分布给绘制出来。想要学习更多可视化知识的话,可以到我的历史文章中查阅更多分享,比如《从零开始学Python可视化》系列、《7天学会Python最佳可视化工具Sea...
2024-10-11 btikc 技术文章 4 ℃ 0 评论 -
平行集成/bagging-Random Forest随机森林
一、平行集成ParallelensemblelearningBagging:bootstrapaggregating的缩写(有放回采样)在从样本中抽样给classifier或者predictor来训练集成模型里面的单个模型...
2024-10-11 btikc 技术文章 4 ℃ 0 评论 -
《一天一图学Python可视化》|第8天:一行代码观察数据分布
我们知道,在描述单个变量时,我们可以使用箱线图、直方图、核密度估计图等将数据的分布给绘制出来。想要学习更多可视化知识的话,可以到我的历史文章中查阅更多分享,比如《从零开始学Python可视化》系列、《7天学会Python最佳可视化工具Sea...
2024-10-11 btikc 技术文章 2 ℃ 0 评论 -
决策树原理以及sklearn中决策树的参数详解
开篇决策树(DecisionTree)是最流行的机器学习算法之一。决策树可以解决分类(classification)和回归分析(Regression)的问题。sklearn中可以仅仅使用几行代码就可以完成决策树的建立。但是,这对于真正想从...
2024-10-11 btikc 技术文章 2 ℃ 0 评论 -
如何使用 Python 进行超参调参和调优
本文最初发布于rubikscode.com网站,经原作者授权由InfoQ中文站翻译并分享。围绕模型优化这一主题发展出来的许多子分支之间的差异之大往往令人难以置信。其中的一个子分支叫做超参数优化,或超参数调优。...
2024-10-11 btikc 技术文章 2 ℃ 0 评论 -
《一天一图学Python可视化》|用等高线图高效观察双变量集中趋势
很多朋友应该见过等高线图,它可以轻易地将两个变量的分布给表现出来。我们之前学习过使用jointplot()来表现双变量数据分布,不过今天,我们将学习一下如何使用基于核密度估计的等高线图来表现双变量数据分布。我们先来看看代码和图形效果:imp...
2024-10-11 btikc 技术文章 4 ℃ 0 评论
- 控制面板
- 网站分类
- 最新留言
-