网站首页 > 技术文章 正文
一、什么是中心极限定理
在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。然后把这 m 组抽样分别求出平均值, 这些平均值的分布接近正态分布。设从均值为μ、方差为
(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值
的抽样分布近似服从均值为μ、方差为
的正态分布。
中心极限定理告诉我们,当样本量足够大时,样本均值的分布慢慢变成正态分布,就像下图:
二、Python实例
2.1 生成均匀分布的掷骰子随机数
生成在半开半闭区间[low,high)上离散均匀分布的整数值,即1-6的均匀分布
import numpy as np
import seaborn as sns
data = np.random.randint(1, 7, 10000)
sns.distplot(data)
多次掷一个骰子的均匀分布
可以看到1-6的点数是比较均匀的分布的【注意,每一次运行的图都不一样的哦】
2.2 抽取一组数据
通过以下程序来从data中随机抽取一组数
sample1 = []
for i in range(0, 10):
rnd = int(np.random.random() * len(data))#0-9999的随机数生产
sample1.append(data[rnd])
print(sample1)
返回结果:[2, 3, 2, 1, 1, 4, 2, 1, 5, 3]
2.3 抽取1000组数据
我们在生产的随机数中,一次抽取50个作为一组并计算它的平均值,共抽取1000次,得到1000个平均值,然后通过seaborn的distplot看着1000个数值的分布。
samples = []
s_mean = []
for i in range(0, 1000):
sample = []
for j in range(0, 50):
rnd = int(np.random.random() * len(data))#0-9999的随机数生产
sample.append(data[rnd])#循环50次的结果存放在samples
s_mean.append(np.mean(sample))#得到的50次sample的平均数放到s_mean后,重新循环第二次的50次循环,samples清空
sns.distplot(s_mean)
三、重要性和注意
当采样的数量接近无穷大时,我们的抽样分布就会近似于正态分布。这个统计学基础理论意味着我们能根据个体样本推断所有样本。结合正态分布的其他知识,我们可以轻松计算出给定平均值的值的概率。在理论上保证了我们可以用只抽样一部分的方法,达到推测研究对象统计参数的目的。
其中要注意的几点:
- 总体本身的分布不要求正态分布:掷一个骰子是平均分布,最后每组的平均值也会组成一个正态分布。
- 样本每组要足够大,但也不需要太大:取样本的时候,一般认为每组大于等于30个,即可让中心极限定理发挥作用。
推荐文章:
- SPC控制图的样品子组大小为什么建议4或者5
- SPC判异规则系列一:1个点远离3倍标准差 的概率和原因
- 最全面的SPC分析报告
- 用Python实现Minitab的正态概率图
- 全网第一个讲清楚CPK如何计算的,Step by step,Excel和Python同时实现
推荐我们的SPC产品给大家,下面是我们产品的特点。
- 简易SPC1.1全功能介绍
- 【SPC应用案例-1】设备实时数据SPC监控看板
- 【SPC应用案例-2】精准诊断:各种不合格品原因分析的SPC应用案例
- 【SPC应用案例-3】区分不同来源的材料的同一检测项目SPC分析
- 一次性不到2w的价格
- 服务器授权,一次性授权,没有每年授权费用
- 不限用户数量,不限检测点数量,不限看板数量
- 一键直出全面SPC分析报告
- 控制图实时自动更新
- 全面支持SPC各种控制图
- 全面支持标准SPC的异常判断规则
- 支持各种自定义判异规则
- 任意创建包含任意检测项目控制图的页面(看板),最适合车间大屏使用
- 看板支持控制图和直方图
- 配色方案
- 各种小工具以及CPK小工具
- 包含各种灵活功能:异常点特殊标记、异常点排除/备注、正态性检验、分布拟合等
- 企业内网服务器部署,基于浏览器,无需安装客户端
- 接口同步数据,解决做控制图手动整理数据的麻烦
- 开放的API接口,增加外部数据接口,可以无需同步数据明细即可编制控制图
还有一点是,我们的产品是部署在客户公司内网服务器的,数据安全可靠。
如果你想进一步了解这个SPC,你可以加我们的微信。
猜你喜欢
- 2024-09-25 果断收藏!python数据分析入门学习笔记(下)
- 2024-09-25 「机器学习」支持向量机分类 支持向量机 知乎
- 2024-09-25 数据可视化之箱线图详细介绍 箱线图绘制步骤
- 2024-09-25 简单的统计学:如何用Python计算扑克概率
- 2024-09-25 Python进行数据预处理 python如何做数据处理
- 2024-09-25 Distribution is all you need:这里有12种做ML不可不知的分布
- 2024-09-25 如何使用 Qdrant DB 创建基于向量的电影推荐系统?
- 2024-09-25 如何可视化卷积网络分类图像时关注的焦点
- 2024-09-25 感知机:教程,实现和可视示例 感知机定义
- 2024-09-25 数据处理中的“归一化”到底是什么?Talk is cheap,show me the code
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)