一、随机事件和概率

(一)概率的定义和性质

  1. 概率的公理化定义

为样本空间,为事件,对每一个事件都有一个实数,若满足下列三个条件:

(1).

(2).

(3)对于两辆互不相容的事件.(该性质通常称为可列(完全)可加性)

则称为事件的概率。

  1. 古典概型(等可能概型)

设任一事件,它是由组成的,则有

排列组合公式:

要排序用,不用排序用

比如:

(二)概率的五大公式

  1. 加法公式

.(当时,

.

随机事件和概率-加法公式-01
  1. 减法公式

时,

时,

  1. 条件概率和乘法公式

条件概率:设是两个事件,且,则称为事件发生条件下,事件发生的条件概率,记为.

(条件概率时概率的一种,所有概率的性质都适合于条件概率。)

概率的乘法公式:.

  1. 全概率公式

设事件满足:

(1)两两互不相容,

(2)

则有

此公式即为全概率公式。

随机事件和概率-全概率公式-01
  1. 贝叶斯公式

若事件满足:

(1)两两互不相容,

(2)

此公式即为贝叶斯公式。

随机事件和概率-贝叶斯公式-01

)通常叫先验概率。)通常称为后验概率。如果我们把当作观察的“结果”,而理解为“原因”,则贝叶斯公式反映了“因果”的概率规律,并作出了“由果溯因”的推断。

(三)事件的独立性和伯努利试验

  1. 两个事件的独立性

设事件满足,则称事件是相互独立的。

若事件相互独立,且,则有.

若事件相互独立,则可得到也都相互独立。

由定义,我们可知必然事件和不可能事件与任何事件都相互独立,同时与任何事件都互斥。

区分:互不相容和独立

互不相容指,即不会同时发生。

独立指两件事发生的概率不相互影响,此时仍有可能同时发生。

  1. 多个事件的独立性

是三个事件,如果满足两两独立的条件(即),并且同时满足,那么相互独立。对于个事件独立的条件类似。

  1. 伯努利试验

定义:我们做了次试验,且满足

则这种试验称为伯努利概型,或称为重伯努利试验。

表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现)次的概率,

二、随机变量及其分布

(一)随机变量的分布函数

  1. 离散型随机变量的分布率

设离散型随机变量的可能取值为),且取各个值的概率为,即事件的概率为),则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:

显然分布律应满足下列条件:

(1).

(2).

  1. 分布函数

对于非离散型随机变量,通常有,不可能用分布律表达,例如日光灯管的寿命,所以我们考虑用落在某个区间内的概率表示。

定义:设为随机变量,是任意实数,则函数称为随机变量的分布函数。

可以得到落入区间的概率。也就是说,分布函数完整地描述了随机变量随机取值的统计规律性。

分布函数是一个普通的函数,它表示随机变量落入区间内的概率。

的图形是阶梯图形,是第一类间断点,随机变量处的概率就是处的跃度。

分布函数具有如下性质(对连续型和离散型都适用):

(1).

(2)单调不减的函数,即,有.

(3).

(4),即右连续的.

(5).

随机变量及其分布-分布函数-01

离散型一般是右连续的分段函数,而连续型是变上限积分,整个函数都连续(如果被积函数是分段函数,那么在分段处不可导)

  1. 连续型随机变量的密度函数

定义:设是随机变量的分布函数,若存在非负函数,对任意实数,有,则称为连续性随机变量,称为概率密度函数(或密度函数),简称概率密度。的图形是一条曲线,称为密度(分布)曲线。

由上式可知,连续型随机变量的分布函数连续函数,所以,即端点处的值取不取不影响概率。

密度函数具有以下性质:

(1).

(2),几何意义:在横轴上面、密度曲线下面的全部面积等于1.

如果一个函数满足性质1、2,则它一定是某个随机变量的密度函数。

(3).

(4)若处连续,则有,它在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用类似。

对于连续型随机变量,虽然有,但事件并非是不可能事件

,令,则右端为零,而概率,故得

连续型在任意一点处的概率都为0,概率密度函数反映的时在该点附近的概率是多少。

不可能事件()的概率为零,而概率为零的事件不一定是不可能事件。同理,必然事件()的概率为1,而概率为1的事件也不一定是必然事件。

例:已知密度函数,求在的条件下的条件分布

解:时,

时,

(二)常见分布

0-1分布

或写成,即看作是只做一次的伯努利试验,这是时的二项分布。

二项分布

重伯努利试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为,那么在次伯努利试验中恰有次发生事件的概率为:

其中,则称随机变量服从参数为的二项分布,记为

容易验证,二项分布满足离散型分布律的条件。

不是整数时,时取得最大值(其中”[ ]“是取整符号)

是整数时,时取得最大值

(二项分布在满足一定条件时可以用泊松分布或正态分布近似)

泊松分布

设随机变量的分布律为

则称随机变量服从参数为的泊松分布,记为或者

泊松分布其实时乘以的泰勒展开的第项,因此分布函数(即)等于1,而且此时只能取正整数。

泊松分布为二项分布的极限分布,即当二项分布的很大,而是一个常数时,二项分布可以用泊松分布近似,此时。(一般是,而时可以近似;如果不满足条件,那么当很大时,根据后面的中心极限定理,二项分布也可以用正态分布近似,但是要先进行标准化)

证明泊松分布为二项分布的极限分布:

时,

泊松分布的和仍是泊松分布(相减为Skellam分布)。

服从参数为的泊松分布,服从参数为的泊松分布,相互独立,,求证服从参数为的泊松分布:

(和卷积公式类似)

若在任意两个长度的区间上,事件发生的概率相等,且两段区间事件的发生是相互独立的,则可以用泊松分布计算概率。

比如,假设一个收费站,每隔15分钟平均通过10辆车,那么问15分钟内恰好通过5辆车的概率是多少

这里等于10,指在一个区间内事件发生次数的期望;等于5,指事件在一个区间内发生的次数。

超几何分布

则称随机变量服从参数为的超几何分布。

超几何分布和二项分布联系密切,它们的不同之处是:超几何概率分布中,各次试验不是独立的,并且各次试验中成功的概率不等;或者说二项分布是放回的,而超几何分布是不放回的。

举个例子,有个球,其中个白球,个黑球,采用不放回抽样,抽取个球,那么问抽取的个球中恰好有个白球,个黑球的概率是多少,这时的概率就服从超几何分布。

很大,很小(即样本很大,抽取的数量很小),这时虽然要求不放回,但是即使放回了对结果影响也不大,这时超几何分布可以用二项分布近似

几何分布

其中,则称随机变量服从参数为的几何分布。

几何分布用于求解概率对应的事件在第次才首次发生的概率。

均匀分布

设随机变量的值只落在内,其密度函数上为常数,即

则称随机变量上服从均匀分布,记为

均匀分布为连续型概型,其分布函数为

落在区间内的概率为

指数分布

设随机变量的密度函数为

其中,则称随机变量服从参数为的指数分布,记为

的分布函数为

指数分布具有无记忆性:若,取,则

无记忆性的证明:

比如,若灯泡寿命满足指数分布,那么灯泡在使用了年的基础上可以再年的概率,和直接可以使用年的概率是一样的。

指数分布的最小顺序统计量

若有一系列,且之间相互独立,令,则,即,期望

指数分布常用的几个积分:

伽马函数

是通过二重积分得出的:

,其中的方形区域

解:对区域进行更改,是小圆的面积,是矩形的面积,是大圆的面积

随机变量及其分布-指数函数-常用积分-01

由于被积函数大于等于0,于是,

对于,换成极坐标同理,得

时,左右两边都等于,根据夹逼定理,

即当时,,于是

由于被积函数是偶函数,,把代进去,可得上面结论。

正态分布

设随机变量的密度函数为

其中为常数,则称随机变量服从参数为的正态分布(或叫高斯(Gauss)分布),记为.

具有如下性质:

(1)的图形是关于对称的.

(2)当时,为最大值.

(3)轴为渐近线.

特别地,当固定、改变时,的图形形状不变,只是集体沿轴平行移动,所以又称为位置参数。

固定、改变时,的图形形状要发生变化。随变大,图形的形状变得平坦,所以又称为形状参数。

正态分布的分布函数为

参数时的正态分布称为标准正态分布,记为,其密度函数为

分布函数为

由于是不可求积函数,其函数值已编制成表可供查用。

如果,则,此时

如果一个函数是正态分布,但不是标准状态分布,需要先转换称标准正态分布才能查表,转换公式如下(若其密度函数为,分布函数为):

证明:,即写成标准正态分布的形式直接看出。

有如下性质:

(1)是偶函数,.

(2)当时,为最大值.

(3),且.

(三)随机变量函数的分布

随机变量时随机变量的函数,,若的分布函数或密度函数已知,如何求出的分布函数或密度函数

  1. X是离散型随机变量

已知的分布列为

显然,的取值只可能是,若互不相等,则的分布列如下:

若有某些相等,则应将对应的相加作为的概率。

  1. X是连续型随机变量

先利用的概率密度写出的分布函数,再利用变上下限积分的求导公式求出

例1:若已知的密度函数,而,求的密度函数

解:

(因为的地方变成了

然后两边同时求导(注意右边是复合函数求导)

例2:若

解:时,

,即

时,同理可得

三、二维随机变量及其分布

(一)二维随机变量的基本概念

- (联合)分布密度

对于二维随机变量,如果存在非负函数),使对任意一个其邻边分别平行于坐标轴的矩形区域,即,有

则称为连续型随机变量,并称分布密度,或称为联合分布密度

这时

二维随机变量及其分布-二维随机变量的基本概念-联合分布密度-01

分布密度具有下面的性质:

(1).

(2).

- 边缘分布密度

一般来说,当为连续型随机变量,并且其联合分布密度为,则边缘分布密度

简单地说,的边缘分布密度就是对积分(连续型)或求和(离散型);的边缘分布密度就是对积分(连续型)或求和(离散型)。的边缘分布指在不考虑的情况下,发生的概率(同理)。

从图像上看:

二维随机变量及其分布-二维随机变量的基本概念-边缘分布密度-01

比如离散型,先求出行和、列和:

因此的边缘分布为:

(边缘分布中的概率就是对前面表格中,当时对应的所有可能进行求和,也就是前面表格中第一行的行和,其他同理)

的边缘分布为:

- 条件分布

离散型,并且联合分布律为),在已知的条件下,取值的条件分布为:

的条件分布同理。其中分别为的边缘分布

连续型随机变量,并且其联合分布密度为,则在已知的条件下,条件分布密度分布函数为:

在已知的条件下,的条件分布密度为:

其中分别为的边缘分布密度。

- (联合)分布函数

为二维随机变量,对于任意实数,二元函数

称为二维随机变量分布函数,或称为随机变量联合分布函数

分布函数是一个以全平面为定义域、以事件的概率为函数值的一个实值函数。

分布函数具有以下性质:

(1).

(2)分别对是非减的,即,当时,由;当时,有.

(3)分别对是右连续的,即.

(4).

在已知联合分布密度的情况下,如果是关于的函数,,那么如何求解的分布:

,其中

例:已知,求

解:当时,.

时,的一个圆的内部,

(二)随机变量的独立性

  1. 连续型随机变量

独立,则密度函数与边缘分布之间的关系,以及分布函数的关系分别为:

独立意味着联合分布密度等于边缘分布密度相乘(联合分布密度就是两件事同时发生的概率函数,对于独立事件,同时发生就是概率相乘)

此时.

直接判断是否独立,充要条件:

(1)可分离变量.

(2)正概率密度区间为矩形.

如果独立,,那么可以得到卷积公式

二维随机变量及其分布-随机变量的独立性-卷积公式-01

,则,这是一个型的积分,画出积分区域后,把它改写成型的积分

  1. 随机变量函数的独立性

独立,为连续函数,则独立。

(三)常见的二维分布

  1. 均匀分布

设随机变量的分布密度函数为

其中为区域的面积,则称服从上的均匀分布,记为.

  1. 正态分布

设随机变量的分布密度函数为

其中,是5个参数,称为服从二维正态分布,记为.

由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即。(但是反过来不一定成立,即,即使都是正态分布,但他们的联合分布密度不确定)

只有当是相互独立的正态分布,且的时候,的联合分布才是正态分布。

证明:

独立,

由卷积公式,得

同理,若不是标准的正态分布,而是普通的正态分布时:.

时,二维状态分布是独立的,此时,而且,对于二维正态分布来说,不相关等价于独立。

四、随机变量的数字特征

(一)期望

期望的定义与性质

离散型

是离散型随机变量,其分布律为),则其期望

期望也称作均值。

连续型

是连续型随机变量,其概率密度为,则

(二维的形式:如果已知,那么先算出

期望的性质

(1)是常数).

(2).

(3).

(4)若独立(充分条件),或不相关(充要条件),则.

注意,自身并不独立,因为一个增加,另一个也必然会相应增加。像只能用性质(5)求。

(5)若

二维的形式,若

(6)条件期望

离散:

连续:

例1:已知某商品的需求量满足在上的均匀分布(单位:吨),若每卖出1吨可赚3万,卖不出10吨亏损1万,求收益最高为多少。

解:为生产数量,为收益,则

当生产数量时收益达到最高,

例2:假设某商品的进货量与需求量独立,且都在上满足均匀分布,若每卖一件赚1000元,如果不够可以从其他商店进货,但只赚500元,问平均利润是多少?

解:设利润

条件期望

离散型随机变量的条件期望

在已知的情况下,的条件期望为:

连续型随机变量的条件期望

在已知的情况下,的条件期望为:

同理,.

条件期望的性质

(1)全期望公式:

对原本进行分类,单独求每个分类的期望后,再求分类的总体期望,与直接求总体期望的结果一样。

证明:

离散时,

其中,如果是离散型随机变量,那么也是离散型随机变量,其分布列为

连续时,

(2)独立时,

证明:

离散时,

连续时,.

(3),比如:

(4)对于任意实函数,都有

证明:.

(5)对于任意实函数,都有

证明:.

特别地,,因为对于,只有才不为0.

(6)当独立时,

因为.

随机向量的条件期望

定义:随机变量关于维随机向量的条件期望,是一个新的随机变量,是的函数。

性质

(1)全期望公式:​;

(2)独立时,;

(3)

(4)对于任意实值元函数,都有

(5)对于任意实值元函数,都有

(二)方差

方差与标准差

方差

离散型:.

连续型:.

标准差

方差的性质

(1)是常数,常数的方差为0;对比期望;变量方差为0的充要条件是

(2)(对比期望

(3)(对比期望

(4)

(5)

特别地,如果独立(充分条件),或不相关(充要条件),则协方差

性质4的证明:

性质5的证明:

条件方差

在已知的情况下,条件方差定义为(是关于的函数):

性质

证明:

(三)常见分布的期望与方差

总结

分布名称 符号 期望 方差
0-1分布
二项分布
泊松分布
几何分布
超几何分布
均匀分布
指数分布
正态分布

0-1分布

0-1分布:

二项分布

二项分布:

(因为根据莱布尼兹公式,而

泊松分布

泊松分布:

(因为是一个泊松分布,它的概率之和为1)

超几何分布

超几何分布:

几何分布

几何分布:

先回顾级数求和:

由于概率,所以可以用上面结论

均匀分布

均匀分布:

指数分布

正态分布

前面提到过,,即一般的正态分布减去期望再除以标准差后,可以转换成标准正态分布再查表。

(四)二维随机变量的数字特征

协方差

对于随机变量,称它们的二阶混合中心矩的协方差或相关矩,记为,即

与记号相对应,的方差也可分别记为

协方差有以下性质:

(1).

(2).

(3).

(4).

相关系数

对于随机变量,如果,则称

的相关系数,记作,有时也简记为

证明

引理:柯西-施瓦茨不等式:

如果令,则

根据取值的不同,有不同的关系:

关于相关系数的几个重要结论:

(1)若随机变量独立,则,但反过来不一定成立。(相关系数只是用来描述线性相关程度的,意味着不线性相关,但仍有可能有其他关系,不一定独立) (2)若,则相互独立的充要条件是,即不相关。

(3)以下几个命题是等价的:

不独立协方差也可以为0:

边缘分布:

此时

独立意味着联合分布密度等于边缘分布密度相乘,但是,显然这里并不独立。

原点矩和中心矩

原点矩

对于正整数,称随机变量次幂的数学期望为阶原点矩,记为,即,于是有:

中心矩

对于正整数,称随机变量差的次幂的数学期望为阶中心矩,记为,即,于是有:

混合原点矩

对于随机变量,如果有存在,则称之为阶混合原点矩,记为,即.

五、大数定律和中心极限定理

(一)切比雪夫不等式

设随机变量具有数学期望,方差,则对于任意正数,有下列切比雪夫不等式

或写成

切比雪夫不等式给出了在未知的分布的情况下,对变量落在期望的某个邻域外面的概率估计。

证明:

对于连续型,设的分布密度为

由于在积分区域上,,两边平方去绝对值,得,即;由于被积函数大于等于0,还可以对积分区域进行放大

.

(二)大数定律

切比雪夫大数定律

(要求方差有界)

设随机变量相互独立(实际上不相关就行,而且不要求同分布),数学期望存在,均具有有限方差且被同一常数所界(即方差有界,),则对于任意的正数,有:

证明:

对于事件,先求出其期望和方差

不相关,

根据切比雪夫不等式,

时,上式右边为1,再由于概率小于等于1,所以上式就等于1.

特别地,如果具有相同的数学期望,则上式变为

或简写成

切比雪夫大数定律指出,个相互独立,且具有有限的相同的数学期望和方差的随机变量,当很大时,它们的算术平均以很大的概率接近它们的数学期望。(即可以用均值逼近期望

伯努利大数定律

次独立试验中事件发生的次数,是事件在每次试验中发生的概率,则对于任意的正数,有

是事件发生的次数,那么就是事件发生的频率,对于只有发生和不发生的事件,一般用的是二项分布。

证明:

,则

根据切比雪夫不等式,

时,上式右边为1,再由于概率小于等于1,所以上式就等于1.

我们一般把概率收敛。和收敛不同,概率收敛允许有少数点不落在的大小为的对称邻域内。

伯努利大数定律还可以写成:

伯努利大数定律说明,当试验的次数很大时,事件发生的频率与概率有较大区别的可能性很小。(即可以用频率逼近概率

频率:试验统计的值。概率:理论值。

代表发生,代表不发生,那么可以表示事件发生的次数,此时是0-1分布,而0-1分布的期望是,把上述变量代入伯努利大数定律,也可以得到切比雪夫大数定律。

辛钦大数定律

(不要求方差存在)

设随机变量是相互独立同分布的随机变量序列,且,则对于任意的正数,有

辛钦大数定律看似与切比雪夫大数定律相同,但是它们的条件不同:

切比雪夫大数定律不要求同分布,但是要求变量独立,且期望、方差都存在且有界;

而辛钦大数定律要求独立、同分布,且期望存在并相等,但不要求方差存在。

(三)中心极限定理

  1. 列维-林德伯格定理

设随机变量相互独立,服从同一分布,且具有相同的数学期望和方差,,则随机变量的分布函数对任意的实数,有

或简写成

对于具有相同期望和相同方差的一系列事件,它的和的期望,方差

对于一个事件减去期望再除以标准差,其实这是一个对一般正态分布进行标准化的过程。换而言之,事件的和)满足一般正态分布,而为了研究它的概率,一般先对其进行标准化之后,再查标准正态分布的表。

此定理也称为独立同分布的中心极限定理

例:假设有100名顾客,每位顾客的消费金额相互独立且满足在上的均匀分布,问日销售额超过3500元的概率是多少?

解:设为第位顾客的消费金额,则

根据独立同分布的中心极限定理,满足一般的正态分布,要求出它超过3500的概率,先对其进行标准化,即

  1. 棣莫弗-拉普拉斯定理(DeMoivre-Laplace中心极限定理)

设随机变量均为具有参数的二项分布,则对于任意实数,有

表示事件发生,表示事件不发生,这时是0-1分布,那么可以表示事件发生的次数,而0-1分布的标准差为,代入列维-林德伯格定理,就可以得到上式。

棣莫弗-拉普拉斯定理说明了,当很大时,二项分布可以用正态分布近似(但是要先进行标准化才能查表)。

例:求二项分布的值

解:

由于定理只能求小于某个数的概率,是一个区间,所以的概率可以用从之间的概率近似

特别地,.

(四)二项定理和泊松定理

  1. 二项定理

若当时,不变),则

证明:

其中,

超几何分布的极限分布为二项分布

  1. 泊松定理

若当时,,则

证明在前面“常见分布”中。

六、数理统计

(一)总体、个体和样本

  1. 总体和样本

在数理统计中,常把被考察对象的某一个或多个指标的全体称为总体(或母体),而把总体总的每一个单元称为样本(或个体)。在以后的讨论中,我们总是把总体看成一个具有分布的随机变量(或随机向量)。

  1. 样本函数与统计量

为总体的一个样本,称

为样本函数,其中为一个连续函数。

如果中不包含任何未知参数,则称为一个统计量。(统计量:不包含未知参数的函数)

(二)常用统计量

样本均值.

样本方差.(和概率论中方差的定义不同)

样本标准差.

样本阶原点矩.

样本阶中心矩.

其中二阶中心矩:(与概率论中方差定义相同)

统计量的期望和方差.

(三)三个抽样分布

分位数

数理统计-上α分位数-01

比如,其中表示卡方分布,是它的自由度,而指的是卡方分布图像在某一点右侧的面积是,而这个点找出来后是.

也可以写成,比如.

分布(卡方分布)

(卡方分布之和仍为卡方分布,且自由度等于原自由度相加)

个随机变量相互独立,且服从标准正态分布,可以证明,它们的平方和的分布密度为

这是我们称随机变量服从自由度为分布,记为,其中.

所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。

分布满足可加性:设,则.

分布的期望和方差:

例:设,求

解:先标准化,

,然后查表。

图像(时,峰值在处,越大峰值越靠右):

卡方分布的图像

t分布

是两个相互独立的随机变量。且,可以证明,函数的概率密度为

我们称随机变量服从自由度为分布,记为.

分布的期望和方差:

分布的图像是对称的,.(这里是上分位数的写法)

数理统计-t分布-02
数理统计-t分布-01

F分布

,且独立,可以证明,的概率密度函数为

我们称随机变量服从第一个自由度为,第二个自由度为分布,记为

几个常用的公式

正态分布.

.

.

(四)正态总体下统计量的分布和性质

注意一个定理:独立

正态分布

为来自正态分布总体的一个样本,则样本函数

相互独立的正态分布相加减仍是正态分布(比如,则,加减后可以利用的性质求参数),乘以常数后也还是正态分布,这时可以叫做样本均值

,上面的过程其实就是将它标准化,使它满足标准正态分布。

分布

为来自正态分布总体的一个样本,则样本函数

其中表示自由度为分布。

其中

特别地,如果已知样本的期望,则

此时满足的是自由度为分布。

这个式子可以用“标准正态分布之和是分布”的定理直接得到。

如果令中的,即添加的约束条件,这时,代入可得前面的公式,而且也解释了为什么自由度会少1(因为添加了1个约束条件)。

t分布

为来自正态分布总体的一个样本,则样本函数

其中表示自由度为分布。

这个式子可以用前面样本均值的正态分布和分布,通过分布的构造公式得到:.

F分布

为来自正态分布总体的一个样本,而为来自正态分布总体的一个样本,则样本函数

其中表示第一个自由度为,第二个自由度为分布。

例:若的样本,的期望和方差,问的分布

解:

,将其标准化,即

观察上式和题目,差了一个,而正态总体下的分布()会出现,要使出现在分母,要让两式相除再分母开根号,这时用分布的构造式比较合理

.

七、参数估计

参数估计的意义是,如果知道样本值(也即试验值),而且知道服从什么分布,但是分布中的参数不知道,那么可以用样本值通过某些方法计算出这些参数。实际上不仅分布中的未知参数可以通过样本进行估计,总体的期望、方差等也可以通过样本进行估计。

(一)点估计

矩法

所谓矩法就是利用样本各阶原点矩与相应的总体矩,来立估计量应满足的方程,从而求得未知参数估计量的方法。

设总体的分布中含有未知数,则其分布函数可以表示成,它的阶原点矩)中包含了未知参数,即。又设为总体个样本值,其样本的阶原点矩为),这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,则有

由上面的个方程,解出的个未知参数即为的矩估计量。

例:对于正态分布是其样本,计算的矩估计。

解:

(先通过已知的公式得出总体各阶矩的形式,然后加个变成估计量,这个估计量可以用样本的各阶矩来表示)

(符号说明:其中是样本的二阶原点矩,是样本的二阶中心矩)

总体的一阶矩,样本的一阶矩

用样本的一阶矩估计出总体的一阶矩:

总体的二阶矩(根据方差公式),样本的二阶矩

用样本的二阶矩估计出总体的二阶矩:

即对于正态分布,期望的估计量都等于样本的一阶原点矩,方差的估计量都等于样本的二阶中心矩。(实际上对于所有分布都成立)

对于泊松分布来说,,但是用矩估计出来的不一样,这时要选用哪个估计,就要用后面的“估计量的评选标准”来确定。(实际上选会让计算更方便,所以一般都用

最大似然法

所谓最大似然法就是当我们用样本的函数值估计总体参数时,应使得当参数取这些值时,所观测到的样本出现的概率为最大。

比如袋子里有黑白两种球共100个,一种是99个另一种是1个,随机抽出来1个如果是黑球,就说明黑球很可能是99个,即概率大的最有可能发生。

即,如果(相互独立的)事件已经发生了,那么它们同时发生的概率应当很大,也就是要让它们的密度函数相乘(即联合分布密度)取得最大值。

当总体为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一组样本,则称

为样本的似然函数,简记为.

当总体为离散型随机变量时,设其分布律为,则它的似然函数为

若似然函数处取得最大值,则称分别为的最大似然估计值,相应的统计量统称为最大似然估计量。我们把这种方法叫做最大似然估计法。

连乘函数往往会很复杂,因此我们考虑对它取变成相加,由于是一个递增函数,所以同时达到最大值,我们称

为似然方程,由多元微分学可知,可以通过该方程算出使得取得最大值的一系列.

例:设为它的一组样本,求的极大似然估计

解:的概率函数为:

的似然函数为:

两边对求导,令导数为零求出极值点,得

求出极值点为:.

不是所有的情况都可以通过取求出极值点的,比如均匀分布就不行,只能得出越小,越大的结论。

(二)估计量的评选标准

不同方法估计出来的参数不一样,要通过一些标准来选择用哪个估计量

  1. 无偏性

是未知参数的估计量,若,则称的无偏估计量。

若总体的均值和方差存在,则样本均值和样本方差分别为的无偏估计,即.

的无偏估计,但不一定是的无偏估计。

  1. 有效性

是未知参数的两个无偏估计,若,则称有效。

  1. 一致性(相合性)

的一串估计量,如果对于任意的正数,都有

则称的一致估计量(或相合估计量)。

(三)区间估计

置信区间和置信度

设总体含有一个待估未知参数。如果我们从样本出发,找出两个统计量),使得区间)的概率包含这个待估参数,即

那么称区间的置信区间,为该区间的置信度(或置信水平)。

即,是一个未知数,但它是一个固定的数,任选区间能套住的概率是。若不好确定,但对作变换后可以查表得出,该变换叫枢轴变量。

单正态总体的期望和方差的区间估计

为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下:

(1)选取样本函数;

(2)由置信度,查表找出分位数;

(3)导出置信区间

下面讨论不同情况下的求法

总结

估计 条件 选取函数 置信区间
已知
未知
已知
未知

已知方差,估计均值

(1)选取样本函数

设方差,其中为已知数,我们知道的一个点估计,并且知道包含未知参数的样本函数

(2)查表找分位数

对于给定的置信度,查正态分布分位数表,找出分位数,使得,即

(3)导出置信区间

推得

也就是说,随机区间的概率包含.

如果把写成上分位数的形式,随机区间还可以写成.

例:已知5个灯泡的使用寿命为1650、1700、1680、1820、1800,且满足的正态分布,要求置信区间中的,求对的估计

解:

此时对作标准化后,就可以查标准正态分布的表,关键是怎么查。

参数估计-区间估计-01

因为要求以的概率套住,即、正态分布图像、轴所围成的面积要为,由于标准正态分布的图像对称,选取区间的中心在处,由于区间对称,那么两边的面积都是,且此时,若,那么,即查表查出对应的值就是的值。(标准正态分布、t分布的图像都是对称的,可以用上面的方式查表,但是分布并不是对称的,查分布函数的表只能找出左边的,而只能通过查上分位数的表得出)

查表后,写成上分位数的形式就是

,代入前面算出来的,最后得到.

未知方差,估计均值

(1)选取样本函数

为总体的一个样本,由于是未知的,这里选取样本方差来替代,这时样本函数选取

(2)查表找分位数

对于给定的置信度,查分位数表,找出分位数,使得,即

(3)导出置信区间

推得

也就是说,随机区间的概率包含.

如果把写成上分位数的形式,随机区间还可以写成.

未知均值,估计方差

(1)选取样本函数

为总体的一个样本,通过样本可以求得样本方差,样本函数选取

(2)查表找分位数

对于给定的置信度,查分位数表,找出两个分位数,由于分布不具有对称性,因此通常采取使得概率对称的区间,即,于是

(3)导出置信区间

推得

也就是说,的概率包含,而的概率包含.

如果把写成上分位数的形式,随机区间还可以写成.