互联网

序贯分析

序贯分析

  • 外文名:sequential analysis
  • 出处:1947年发表的一本同名著作
  • 出现时间:1947年
  • 实质:数理统计学的一个分支
  • 序贯分析介绍
    序贯分析是数理统计学的一个分支,其名称源出于A.瓦尔德在1947年发表的一本同名著作,它研究的对象是所谓“序贯抽样方案”,及如何用这种抽样方案得到的样本去作统计推断。

    序贯分析

    序贯抽样方案是指在抽样时,不事先规定总的抽样个数(观测或实验次数),而是先抽少量样本,根据其结果,再决定停止抽样或继续抽样、抽多少,这样下去,直至决定停止抽样为止。反之,事先确定抽样个数的那种抽样方案,称为固定抽样方案。

    例如,一个产品抽样检验方案规定按批抽样品20件,若其中不合格品件数不超过 3,则接收该批,否则拒收。在此,抽样个数20是预定的,是固定抽样。若方案规定为:第一批抽出3个,若全为不合格品,拒收该批,若其中不合格品件数为

    ,则第二批再抽

    个,若全为不合格品,则拒收该批,若其中不合格品数为

    ,则第三批再抽

    个,这样下去,直到抽满20件或抽得 3个不合格品为止。这是一个序贯抽样方案,其效果与前述固定抽样方案相同,但抽样个数平均讲要节省些。此例中,抽样个数是随机的,但有一个不能超过的上限20。有的序贯抽样方案,其可能抽样个数无上限,例如,序贯概率比检验的抽样个数就没有上限。

    H.F.道奇和 H.G.罗米格的二次抽样方案(见抽样检验)是较早的一个序贯抽样方案。1945年,C.施坦针对方差未知时估计和检验正态分布的均值 μ(见数学期望)的问题,提出了一个二次抽样方案。依此方案,在事先给定了

    后,可作出均值μ的一个置信区间,其置信系数(见区间估计)为

    ,而长度不超过l。可以证明:当方差未知时,具有这种性质的置信区间在固定样本的情况下不可能找到。由此可以看出序贯抽样方案除了可节省抽样量之外,还有一种作用,即为了达到预定的推断可靠程度(这里为置信系数)及精确程度(这里是以区间长度来刻画),有时必须使用序贯抽样。

    例如,估计一事件A的概率

    ,给定

    ,要找到这样的估计孨,使能以不小于

    的概率保证估计的相对误差小于等于

    。可以证明,若用固定抽样方案,事先指定自然数n,做n次试验,每次观察A是否发生,则不论n多么大,具有上述性质的孨不存在。但用下述序贯抽样方案可得到这样的:作试验,观察A是否发生,设到A第一次发生时已作了

    试验,计算 取其整数部分

    ,再作

    次试验,记

    次试验中A出现的次数为m,

    ,则有

    ,而估计孨具有所指定的性质。

    第二次世界大战时,为军需验收工作的需要,瓦尔德发展了一种一般性的序贯检验方法,叫序贯概率比检验(简称SPRT)。此法在他的1947年的著作中有系统介绍,其要点如下:设在原假设

    备择假设

    之下,随机变量x概率密度函数或概率函数随机变量都已知,且分别为

    ,对x逐次观测,第i次观测的结果记为

    ,称比值为样本

    的概率比。在固定抽样方案之下,是先给定自然数n,对x进行n次观测得

    ,计算

    。定出一常数C(其值取决于检验水平α),当

    时,接受原假设

    ,否则拒绝

    。这样,在λn的值与C很接近时,

    是否被接受的界限过于断然,不大合理。瓦尔德将此修改为:指定两个数

    根据各次观测得的样本

    的值,依次计算概率比

    。每次抽样完毕,即算出

    ,再与A,B比较,若

    ,则接受

    ;若

    ,则接收

    (拒绝

    );若

    ,则继续抽样一次得

    计算出

    再作上述比较,直到作出决定为止。这就是序贯概率比检验。至于A,B的定法,则取决于指定的两种错误概率α和β(α,β都大于0,但很小)。瓦尔德提供的近似公式是

    。他也给出了这种检验法的平均抽样次数和功效函数(见假设检验),并在1948年与美国统计学家J.沃尔弗维茨一起,证明了在一切两种错误概率分别不超过α和β的检验类中,上述序贯概率比检验所需平均抽样次数最少。瓦尔德在其著作中也考虑了复合检验的问题,有许多统计学者研究了这种检验。瓦尔德的上述开创性工作,引起了许多统计学者对序贯方法的注意,并继续进行工作,从而使序贯分析形成为数理统计学的一个分支。

    除了检验问题以外,序贯方法在其他方面也有不少进展,对一般的统计决策问题,在各次观测结果相互独立的情况下的序贯贝叶斯解的问题,在理论上已有较完整的结果。在点估计方面,对序贯的最小化最大估计的研究有了一些结果。在区间估计方面,关于斯坦的二次抽样,正态均值及一般总体均值和线性模型参数的区间估计,有不少的工作。另外,在数理统计学中有一类在应用上重要的问题,叫选择问题,它要求从若干个分布中挑选出一个在某种意义上的最优者。例如,从若干个具有不同均值的正态分布中,挑选出其均值最大者。关于这个问题也发展了一系列的序贯方法。

    参考书目

    A.Wald,Sequential Analysis,John Wiley & Sons, New York, 1947.

    D.Siegmund,Sequential Analysis,Springer-Verlag, New York, 1985.

    相关资讯
    内容声明

    1、本网站为开放性注册平台,以上所有展示信息均由会员自行提供,内容的真实性、准确性和合法性均由发布会员负责,本网站对此不承担任何法律责任。

    2、网站信息如涉嫌违反相关法律规定或侵权,请发邮件至599385753@qq.com删除。

    Copyright © 趣爱秀