科学

一致估计

一致估计

  • 外文名:consistent estimator
  • 性质:点估计
  • 学科:统计学
  • 领域:数学
  • 别名:相合估计、相容估计
  • 一致估计介绍
    一致估计亦称相合估计和相容估计,是一种优良点估计。按收敛的意义不同将一致估计分为两种:弱一致估计和强一致估计。点估计又称定值估计,是指直接用样本平均数或样本成数代替总体平均数或成数,而不考虑误差的一种估计方法。例如对100名大学生进行收视率调查,调查结果是30%每天收看电视新闻,从而推断, 在全体大学生中30%每天收看电视新闻。

    概念

    一致估计(consistent estimator)亦称相合估计和相容估计。是一种优良点估计。设总体ξ的概率分布函数为

    为未知参数,若可估函数g(θ)估计量

    当n趋于无穷时,在某种意义下收敛于g(θ),则称

    在这种收敛意义下的一致估计。它要求作为估计量的统计量,当样本容量无限增大时,在某种意义下,收敛于待估计参数的真值。按收敛的意义不同将一致估计分为两种:若当样本容量

    时,对任意给定的

    ,有:

    称为

    的弱一致估计;若有:

    称为

    的强一致估计。一致估计是点估计中最基本的大样本准则。例如,正态总体

    样本均值ξ就是

    的一致估计,因为根据大数定律,对任给

    ,当

    时,有:

    成立。这就表明ξ是E(ξ)的弱一致估计。

    估计

    根据观测值来推测母体参数的值或范围的过程称为估计。估计分为点估计和区间估 计。点估计,是根据观测值估计出对母体参数θ的估计值

    的过程。例如,在进行灯泡寿命测定时,根据几个灯泡寿命 来推测一批灯泡寿命的过程,就为点估计。其过程是:先抽取若干个灯泡做样本来测取寿命值 (以小时为单位) ,样本的寿命分别是

    ,求出平均值

    和方差:

    此时就用平均寿命去估计母体寿命μ,用方差S去估计母体 σ,即是点估计。

    点估计

    点估计又称定值估计,是指直接用样本平均数或样本成数代替总体平均数或成数,而不考虑误差的一种估计方法。例如对100名大学生进行收视率调查,调查结果是

    每天收看电视新闻,从而推断,在全体大学生中

    每天收看电视新闻。

    一般说来,用抽样指标估计总体指标,总会存在一定差异,但如果满足下面3个要求,就可认为是合理估计或优良估计。1.无偏性。用抽样指标估计总体指标时,个别样本指标与总体指标间会有偏差,而用很多样本指标的平均值估计总体指标,平均说来是无偏差的。2.一致性。用抽样指标估计总体指标,当样本单位数充分大时,抽样指标将充分接近总体指标。3.有效性。用抽样平均数和总体某一变量来估计总体平均数时,虽然两者都是无偏估计量,但样本平均数更靠近总体平均数,平均说来,它的离差较小,因此,是更优良的估计量。

    区间估计

    设总体或总体分布的某个参数为θ,从该总体抽取含量为n的样本,按一定概率估计总体参数θ在哪个范围,即由样本观测值求θ的

    可信区间

    称可信度,通常取95%可信度,即

    ,求θ的

    可信区间。如求总体均数μ的

    可信区间,求总体率π的

    可信区间,求总体回归系数β的

    可信区间等。θ的区间估计常和其点估计θ相结合。一般当样本含量较大时(如

    ),θ近似服从正态分布,可用正态近似法求总体参数的

    可信区间:

    或简写成

    为θ的标准误。通常求总体参数θ的

    可信区间:

    或简写成

    。可信区间的含义为:固定样本含量n,从总体中作随机抽样,每个样本可以算得一个可信区间,如

    可信区间,意味着做100次抽样,算得100个可信区间,平均有95个可信区间包括总体参数(估计正确),只有5个可信区间不包括总体参数(估计错误)。

    小概率事件,实际发生的可能性小,因此,在实际应用中就认为总体参数在算得的一个可信区间内,冒5%犯错误的风险。可信区间的两个要素:一是准确度,反映在可信度

    的大小,越接近1越准确,如可信度

    准确;二是精密度,反映在区间的长度,越小越精密。二者是矛盾的,需要兼顾。

    统计量

    样本的已知函数,其作用是把样本中有关总体的信息汇集起来,是数理统计学中一个重要的基本概念。常用统计量有样本矩次序统计量、U统计量和秩统计量等。其中U统计量是W.霍夫丁于1948年引进的。统计量的充分性和完全性是两个重要概念,充分性是费希尔在1925年引进的,内曼和P.R.哈尔莫斯在1949年严格证明了一个判定统计量充分性的方法,叫做因子分解定理。统计量的分布叫做抽样分布,它的研究是数理统计中的重要课题。对一维正态总体,有三个重要的抽样分布,即χ分布、t分布和F分布。其中χ分布是F.赫尔梅特于1875年在研究正态总体的样本方差时得到的;t分布是英国统计学家W.S.戈塞特(笔名“学生”)于1908年提出的;F分布是费希尔在20世纪20年代提出的。

    相关资讯
    内容声明

    1、本网站为开放性注册平台,以上所有展示信息均由会员自行提供,内容的真实性、准确性和合法性均由发布会员负责,本网站对此不承担任何法律责任。

    2、网站信息如涉嫌违反相关法律规定或侵权,请发邮件至599385753@qq.com删除。

    Copyright © 趣爱秀