网站首页 > 技术文章正文

干货|数十个统计学术语,一文秒懂，涨薪升职必备的硬核知识!

btikc 2024-10-16 08:16:20 技术文章 12 ℃ 0 评论

当进行数据分析时，理解以下统计学常见术语将有助于更好地解释和解读数据：

样本：从总体中选出的一部分数据。

总体：研究对象的全部数据。

参数：总体的特征数值，如总体均值、总体标准差等。

统计量：用于描述样本特征的数值，例如样本均值、样本标准差等。

P值:表示观察到的数据或更极端情况在原假设为真的情况下出现的概率。当P值小于显著性水平 (0.05或0.01)，可以认为结果是显著的

R2:衡量回归模型拟合程度的统计指标，越接近1表示模型对观测数据的拟合效果越好。

X2:卡方统计量的简称，用来表示卡方分布中的一个具体的观测值，一般来说，卡方统计量越大，观察到的数据与期望数据之间的差异越大。

VIF值:用于检测自变量之间多重共线性程度，一般来说，VIF值大于10被认为存在较为严重的多重共线性。

F值:用于方差分析(ANOVA) 中，表示组间方差与组内方差的比值。通过与F分布的临界值进行比较，以判断组间差异是否显著。

t值:用于检验参数的显著性，特别是在学生t检验和回归分析中使用。t值表示参数估计值与其标准误差的比值，与t分布的临界值进行比较以判断参数的显著性。

方差:各变量值与其平均数离差平方的平均数。

标准差:方差的平方根。数值越大，表示数据点与均值之间的差异程度越大，数据集的离散程度也越高

标准误:标准差除以样本量的平方根。表示估计值与真实值之间的平均偏差，用于衡量估计值的精确程度

自由度:表示在计算统计量时可以自由变动的观测值数量

相关系数:衡量两个变量之间相关关系的强度和方向。接近1表示正相关，接近-1表示负相关，0表示无线性相关。

显著性水平:用于判断统计推断的可靠性，通常使用的显著性水平是0.05或0.01。

显著差异:指观察到的差异在统计上是显著的，即不太可能是由随机因素引起的。

一致性: 随着样本量的增大，估计量的值越来越接近被估总体的参数。

假设检验:用于验证关于总体参数的假设，包括零假设和备择假设

F检验：判断是否存在显著的线性关系

原假设:假设没有观察到的效应、差异或关联。通常将其表示为Ho。原假设是需要进行推翻或拒绝的假设。

备择假设:与原假设相反。假设观察到的效应、差异或关联是存在的。备择假设是用来支持或接受的假设。

置信度:对于估计值或统计结果的可信程度或精度的度量。

置信区间:由样本统计量所构造的总体参数的估计区间。

95%置信度:表示对于估计值或统计结果的可信程度，有95%的把握认为真实值落在置信区间内。

交互作用:一个因素和另一个因素联合产生的对因变量的附加效应。

拟合优度检验:对多个总体比例是否等于其期望概率的检验。当期望概率相同时，表现为对多个总体比例是否相等的检验。

转载自公众号 SPSSPRO