原文: https://machinelearningmastery.com/critical-values-for-statistical-hypothesis-testing/
如果不是标准的话,使用 p 值来解释统计假设检验的结果是常见的。
并非所有统计测试的实现都返回 p 值。在某些情况下,您必须使用替代方法,例如临界值。此外,在估计群体观测的预期间隔时使用临界值,例如在公差间隔中。
在本教程中,您将发现临界值,它们重要的原因,它们的使用方式以及如何使用 SciPy 在 Python 中计算它们。
完成本教程后,您将了解:
- 统计假设检验的例子及其可以计算和使用临界值的分布。
- 如何在单尾和双尾统计假设检验中使用准确的临界值。
- 如何计算 Gaussian,Student's t 和卡方分布的临界值。
让我们开始吧。
统计假设检验临界值的温和介绍 Steve Bittinger 的照片,保留一些权利。
本教程分为 4 个部分;他们是:
- 为什么我们需要关键价值观?
- 什么是关键价值?
- 如何使用临界值
- 如何计算临界值
许多统计假设检验返回用于解释检验结果的 p 值。
某些测试不返回 p 值,需要另一种方法来直接解释计算的测试统计量。
通过统计假设检验计算的统计量可以使用来自检验统计量分布的临界值来解释。
统计假设检验的一些例子及其可以计算临界值的分布如下:
- Z-Test :高斯分布。
- T 检验:T 分布。
- 卡方 Test :卡方分布。
- ANOVA :F 分布。
在为分布中的预期(或意外)观察定义间隔时,也使用临界值。在量化估计的统计量或间隔(例如置信区间和容差区间)的不确定性时,计算和使用临界值可能是合适的。
临界值是在人口分布和概率的背景下定义的。
来自群体的观察值,其具有等于或小于具有给定概率的临界值的值。
我们可以用数学方式表达如下:
Pr[X <= critical value] = probability
其中Pr
是概率的计算,X
是来自群体的观察,critica_value
是计算的临界值,_ 概率 _ 是选择概率。
使用数学函数计算临界值,其中概率作为参数提供。对于大多数常见分布,无法通过分析计算该值;相反,它必须使用数值方法估算。从历史上看,在统计教科书的附录中提供预先计算的临界值表是常见的,以供参考。
临界值用于统计显着性检验。概率通常表示为重要性,表示为小写希腊字母 alpha(a),它是反转概率。
probability = 1 - alpha
计算临界值时使用标准 alpha 值,由于历史原因选择并且由于一致性原因而不断使用。这些 alpha 值包括:
- 1%(alpha = 0.01)
- 5%(alpha = 0.05)
- 10%(alpha = 0.10)
临界值提供了将统计假设检验解释为 p 值的替代和等效方法。
计算的临界值用作解释统计检验结果的阈值。
超过临界值的群体中的观察值通常被称为“_ 关键区域 ”或“ 拒绝区域 _”。
临界值:在表中出现的用于指定统计测试的值,指示可以拒绝原假设的计算值(计算的统计量落在拒绝区域中)。
- 第 265 页,研究方法手册:社会科学从业者和学生指南,2003 年。
统计检验可以是单尾或双尾。
单尾测试具有单个临界值,例如分布的左侧或右侧。
通常,单尾测试在非对称分布(例如卡方分布)的分布右侧具有临界值。
将统计值与计算的临界值进行比较。如果统计量小于或等于临界值,则统计检验的零假设未被拒绝。否则它被拒绝。
我们可以总结如下解释:
- 测试统计&lt;临界值:未能拒绝统计检验的零假设。
- 测试统计=&gt;临界值:拒绝统计检验的零假设。
双尾检验具有两个临界值,分布的每一侧有一个,通常假设它们是对称的(例如高斯分布和 T 分布)。
使用双尾测试时,计算临界值时使用的显着性水平(或 alpha)必须除以 2.临界值将在分布的每一侧使用此 alpha 的一部分。
为了使这个具体,请考虑 5%的 alpha。这将被分割为在分布的任一侧给出 2.5%的两个α值,其中接收区域在分布的中间为 95%。
我们可以将每个临界值分别称为分布左右的下临界值和上临界值。测试统计值大于或等于下临界值且小于或等于上临界值表示未能拒绝原假设。而测试统计值小于下临界值且大于上临界值表示拒绝测试的零假设。
We can summarize this interpretation as follows:
- 降低 CR&lt;测试统计&lt;上 CR :未拒绝统计检验的零假设。
- 测试统计&lt; =下 CR OR 测试统计&gt; =上 CR :拒绝统计测试的原假设。
如果测试统计量的分布在零均值附近对称,那么我们可以通过将检验统计量的绝对值(正值)与上临界值进行比较来快速检查。
- |测试统计| &LT;上临界值:未拒绝统计检验的零假设。
哪里 |测试统计| 是计算的检验统计量的绝对值。
密度函数返回分布中观察的概率。回想一下 PDF 和 CDF 的定义如下:
- 概率密度函数(PDF):返回具有分布中特定值的观测值的概率。
- 累积密度函数(CDF):返回观察的概率等于或小于分布中的特定值。
为了计算临界值,我们需要一个函数,给定概率(或重要性),将从分布中返回观测值。
具体而言,我们需要累积密度函数的倒数,在给定概率的情况下,给出小于或等于概率的观测值。这称为百分点函数(PPF),或更一般地称为分位数函数。
- 百分点函数(PPF):返回所提供概率的观测值,该概率小于或等于分布中提供的概率。
具体而言,来自分布的值将等于或小于具有指定概率的 PPF 返回的值。
让我们通过三个分布来具体化,通常需要通过三个分布来计算临界值。即,高斯分布,T 分布和卡方分布。
我们可以使用给定分布上的 ppf() 函数计算 SciPy 中的百分点函数。还应该注意的是,您还可以使用 SciPy 中名为 isf() 的逆生存函数来计算 ppf()。这是提到的,因为您可能会在第三方代码中看到这种替代方法的使用。
下面的示例计算标准高斯分布上 95%的百分点函数。
# Gaussian Percent Point Function
from scipy.stats import norm
# define probability
p = 0.95
# retrieve value <= probability
value = norm.ppf(p)
print(value)
# confirm with cdf
p = norm.cdf(value)
print(p)
运行该示例首先打印标记 95%或更少的观察值的值,该值来自约 1.65 的分布。然后通过从 CDF 检索观察的概率来确认该值,CDF 按预期返回 95%。
我们可以看到,1.65 的值与我们对 68-95-99.7 规则中覆盖 95%分布的平均值的标准偏差数量的预期一致。
1.6448536269514722
0.95
下面的示例计算标准 T 分布的 95%的百分点函数,具有 10 个自由度。
# Student t-distribution Percent Point Function
from scipy.stats import t
# define probability
p = 0.95
df = 10
# retrieve value <= probability
value = t.ppf(p, df)
print(value)
# confirm with cdf
p = t.cdf(value, df)
print(p)
运行该示例将返回大约 1.812 或更小的值,该值覆盖所选分布中 95%的观察值。然后通过 CDF 确认该值的概率(具有较小的舍入误差)。
1.8124611228107335
0.949999999999923
下面的示例计算了具有 10 个自由度的标准卡方分布的 95%的百分点函数。
# 卡方 Percent Point Function
from scipy.stats import chi2
# define probability
p = 0.95
df = 10
# retrieve value <= probability
value = chi2.ppf(p, df)
print(value)
# confirm with cdf
p = chi2.cdf(value, df)
print(p)
首先运行该示例计算的值为 18.3 或更小,覆盖了分布中 95%的观测值。通过将其用作 CDF 的输入来确认该观察的概率。
18.307038053275143
0.95
如果您希望深入了解,本节将提供有关该主题的更多资源。
- 研究方法手册:社会科学从业者和学生指南,2003 年。
- 维基百科的重要价值
- 维基百科上的 P 值
- 维基百科的单尾和双尾测试
- 维基百科上的分位数函数
- 维基百科上的 68-95-99.7 规则
在本教程中,您发现了临界值,它们重要的原因,它们的使用方式以及如何使用 SciPy 在 Python 中计算它们。
具体来说,你学到了:
- 统计假设检验的例子及其可以计算和使用临界值的分布。
- 如何在单尾和双尾统计假设检验中使用准确的临界值。
- 如何计算 Gaussian,Student's t 和卡方分布的临界值。
你有任何问题吗? 在下面的评论中提出您的问题,我会尽力回答。