6 数理统计的基本概念
6.1 基本要求
1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。
2 了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。
3 了解2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。
4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。
6.2 内容提要
6.2.1 总体和样本
1 总体和个体 研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。总体是一个随机变量,常用X,Y等来表示。
2 样本 从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。
3 简单随机样本 设X1,X2,…,Xn是来自总体X的容量为n的样本,如果这n个随机变量X1,X2,…,Xn相互独立且每个样品Xi与总体X具有相同的分布,则称X1,X2,…,Xn为总体X的简单随机样本。
4 样本的联合分布
若总体X具有分布函数F(x),则样本(X1,X2,…,Xn)的联合分布函数为
若总体X为连续型随机变量,其概率密度函数为f(x),则样本的联合概率密度为
(6.1)
若总体X为离散型随机变量,其分布律为P{X=ai}=pi (i=1,2,…n),则样本的联合分布为
(6.2)
其中为的任一组可能的观察值。
6.2.2 样本分布
1 频率分布
设样本值(x1,x2,…,xn)中不同的数值是x1*,x2*,…,xl*,记相应的频数分别为n1,n2,…,nl,其中x1*< x2*<…< xl*且。则样本的频数分布及频率分布可由表6-1给出。
表6-1
指标X | x1* | x2* | … | xl* |
频数ni | n1 | n2 | … | nl |
频率 | … | |||
2 经验分布函数
定义 设(X1,X2,…,Xn)为总体X的一个样本,其样本值为(x1,x2,…,xn),则称函数
为样本值(x1,x2,…,xn)的经验分布函数。
若已知样本值(x1,x2,…,xn)的频数、频率分布表为
指标X | x1* | x2* | … | xl* |
频数ni | n1 | n2 | … | nl |
频率 | … | |||
则经验分布函数
(6.3)
6.2.3 几个重要分布及临界值
1.分布 设X1,X2,…,Xn是相互独立的随机变量,且Xi~N (0,1) (i=1,2,…,n),则称随机变量
服从自由度为n的分布,简记为~(n)。
2分布的性质:
(1)设~(n),则,
(2)设,,且Y1,Y2相互独立,则有
3.t分布 设,,且X,Y相互独立,则称随机变量
服从自由度为n的t分布,或称学生氏(Student)分布,简记为T~t(n)。
4.t分布的性质
(1)
(2);这里f (x)为t分布的概率密度函数。
5.F分布 设,,且X,Y相互独立,则称随机变量
所服从的分布是自由度为m,n的F分布,简记为F~F(m,n)。
6.F分布的性质
(1) 若则
(2)
(2) 若F~F(m,n),则。
7.临界值
(1) 标准正态分布的临界值 设X~N(0,1),对给定的正数,若存在实数满足
则称点为标准正态分布X的临界值 (或称上分位点或分位数)。
由,若已知,可通过反查标准正态分布表,求出临界值。当时,表中无法查出,此时查表,再由可求得临界值。
(2)分布的临界值 设,概率密度为f(x)。对给定的数(0<<1),若存在实数满足
则称数为分布的临界值。已知n,,通过查分布表可求得。当n>45时,可利用近似公式: 这里是标准正态分布的临界值。
(3) t分布的临界值 设T~t(n),概率密度为f(x)。对给定的(0<<1。若存在实数满足
则称点为t分布的临界值。已知n,,通过查t分布表可求得。
注:1) 类似标准正态分布临界值的性质,对t分布亦有:;
2) 当n>45时,可用正态分布近似。
(4) F分布的临界值 设F~F(m, n),概率密度为f(x)。对给定的(0<<1,若存在实数(m,n)满足
则称数(m,n)为F分布的临界值。注意公式
6.2.4 统计量及样本矩
1.统计量 设(X1,X2,…,Xn)为总体X的一个样本, (X1,X2,…,Xn)是X1,X2,…,Xn的函数,若是连续函数且不含末知参数,则称(X1,X2,…,Xn)是一个统计量。
2.几个常用的统计量——样本矩
(1)样本均值 。
(2)样本方差 。
(3)样本标准差 。
(4)样本k阶原点矩 。
(5)样本k阶中心矩 。
3 样本矩与总体矩的关系
由样本的独立性及与总体同分布这一特性出发,运用数字特征的运算法则,可得:若总体X的期望、方差存在,即,,又(X1,X2,…,Xn)是取自总体X的一个样本,则
,;,。 (6.4)
上述结论无论总体服从什么样的分布都正确,故它是计算任意总体,特别是非正态总体的样本均值和样本方差的期望、方差的常用结论。
6.2.5 正态总体样本均值和样本方差的分布
1. 设总体X~N(),()为样本,为样本均值,为样本方差
(1)~,或~N (0,1); (6.5)
(2) (6.6)
(3) (6.7)
(4) 样本均值与样本方差相互独立;
(5)~ (6.8)
2.设()是取自总体X的一个样本,()是取自总体Y的一个样本,且这两个样本相互独立,即假定,是n1+n2个相互独立的随机变量。若总体X~N(),Y~N(),则有
1)~N(0,1); (6.9)
2)~F(n1-1,n2-1); (6.10)
3)当时,有
~t(n1+n2-2); (6.11)
其中,,。
6.3 典型例题分析
已知总体,求样本的联合分布
例1.设(X1,X2,…,Xn)是取自总体X的一个样本。试在下列三种情况下,分别写出样本(X1,X2,…,Xn)的联合分布律或联合概率密度。
(1)X~B(1,p);(2)X服从参数为的指数分布;(3)X服从(0,)(>0)上的均匀分布。
分析: 解此类题先写出总体X的分布律(或概率密度);再由Xi与X有相同的分布以及Xi之间的相互独立性,由式(6.1),(6.2)即可写出样本(X1,X2,…,Xn)的联合分布律或联合概率密度。
解:(1) 因为总体分布律为
于是
样本的联合分布律为:
(2) 因为总体概率密度函数为:
所以,每一个样本的概率密度为:
故样本的联合概率密度为:
(3)因为总体概率密度函数为:
所以样本Xi的概率密度为
故,样本的联合概率密度为:
例2.设X~N(),(X1,X2,X3)为来自总体X的一个样本。试求样本(X1,X2,X3)的联合概率密度和样本均值的概率密度函数。
解: 由于
故
又因为,所以,的概率密度函数为:
注: 此题用到结论:若,则。这一结果有十分广泛的应用。
例3.设总体服从泊松分布,是来自总体的简单随机样本
(1) 计算;
(2) 若容量为10的一组样本观察值为(1,2,4,3,3,4,5,6,4,8),试计算样本均值,样本方差和经验分布函数。
解: (1)解法一 由(6.4)式,因为
,于是,故,
解法二
故
(2),
又X的频率分布表为
指标X | 1 | 2 | 3 | 4 | 5 | 6 | 8 |
频数ni | 1 | 1 | 2 | 3 | 1 | 1 | 1 |
频率 | 1/10 | 1/10 | 2/10 | 3/10 | 1/10 | 1/10 | 1/10 |
所以,经验分布函数为
注: (1)解法一直接运用样本矩与总体矩之间的关系,即(6.4)式求得;
解法二运用样本与总体同分布的特性及数字特征的运算法则求得。
(2)写经验分布函数,可先列出频率分布表,这样不至遗漏或出错。
例4 设总体
为样本。试求:
(1)数学期望与方差,的数学期望;(2)。
解: 计算总体X的数学期望和方差
故(1),
。
(2)因为,所以
注:当总体的期望和方差不能直接写出时,要先求总体的期望和方差,再求样本均值、样本方差及样本二阶中心矩的期望和方差。另外,要注意与之间的差异。由于,即是总体方差的无偏估计,而不是总体方差的无偏估计,因此,一般都是以作为方差的估计量。但,故当样本容量很大时,和两者相差很小,此时亦可用来估计总体方差。因此,有时把称为大样本方差,而有的书上也称为样本修正方差。
本题(2)的解答用到了中心极限定理。由中心极限定理可得,不论总体服从什么分布,只要知道总体的数学期望,方差,则样本均值的渐近分布就为正态分布。即
由此可知
求样本均值落在某个区间内的概率,就可以利用上述结论近似计算,这是很重要的结论。
*例5 设是来自正态总体的简单样本,且则当时,统计量服从2-分布,其自由度为( )。
解:
解法1令
则
欲使,就必须使,由于
于是
令,则,此时。
解法2 由于且相互独立,则
从而
所以
为使
必须使
同上面两个服从正态分布的随机变量比较可知
即 。
注:本题虽用了两种不同的解法,但目的相同且明确,即由分布的定义并由构成的特点,应选择恰当的a,b使恰为两个标准正态分布的平方和。
*例6 设是来自正态总体X的一个简单随机样本,
,
证明:统计量T服从自由度为2的t-分布.。
证明: 由于从而
所以
故
于是
又因为,且
从而与独立。于是由t分布的定义知
注: 本题的关键是熟练掌握t分布的定义及正态总体下样本均值、样本方差的分布:
~N(0,1),。
例7.已知X~。证明~F(1,n)。
证明: 因为, 即, 其中
,又, 而
故由F-分布的定义知:
注: 本题解答看似简单,但本章所学的三个分布都涉及到。因而了解证明过程中每一步的来龙去脉,对于熟悉、掌握有关随机变量及其分布是一项基础性训练。
例8.设(X1,X2,…,Xn)是来自正态总体N(0,1)的样本。试求统计量(m<n)的抽样分布。
解 因为
所以, 故
同理
于是
例9.设(X1,…,X5)是来自正态总体N()的一个样本。试证:
(1)当时,~F(1,3);
(2)当时,~t(3)。
解 (1)
于是
由F-分布的定义,即得:
(2) 据(1)的分析,
由t-分布的定义即得结论。
注: 本题仍是关于F-分布和t-分布的基础训练题。
例10 设为总体的一个样本,求。
解: 因为
于是 ,
由分布临界值的定义,查表可知,故。
注: 本题由于出现了随机变量的平方和,故在寻找的分布时自然想到分布。但分布中的均服从N (0,1),所以只要将此处的标准化即可。由临界值的定义,一般查表是已知,找临界值,而此处则相反,是已知临界值找,故得到的是近似值。
*例11 从正态总体中抽取容量为n的样本,如果要求其样本均值位于区间(1.4,5.4)内的概率不小于0.95,问样本容量n至少应取多少?
Z | 1.28 | 1.645 | 1.96 | 2.33 |
(z) | 0.900 | 0.950 | 0.975 | 0.990 |
解 : 设正态总体为X,则,从而由(6.5)式得
所以
即。由此可得,即n(1.963)234.57,故n至少应取35。
例12.设X1,X2,…,Xn为相互独立且分别服从正态分布N()的随机变量。设
证明:~。特别地,若~N() i=1,2,…,n,则~。
证明相互独立
故
同理可证若~N() i=1,2,…,n,则~。
注: 本例说明n个相互独立正态分布随机变量的线性组合仍服从正态分布。特殊情形:若取,则结论正是正态总体下样本均值的分布(6.5)式。该题结果可作为一般结论直接引用。
例13.设总体X~N ()。现抽取容量为9的样本,得到,问是多少?
解 :
而服从自由度为n-1=8的t分布,又由于t分布的对称性,有
令,查表知,由插值可求得,即。
注: 本题的关键是寻找含有统计量的分布。由于2未知,故不能用来解题,但S已知,由(6.8)式得,于是由t分布临界值的定义即可顺利求得相应的概率。
例14 设是来自总体X的随机样本,求下列概率。
(1)
(2)
解 (1)由内容提要6.2.5知
0.98-0.02=0.96
(2)利用(6.7)式得
注: 本题关键是要注意这两个统计量的差异。它们虽然都服从分布,但由于与的不同使其自由度也不同。查表时,上述两个随机变量的自由度分别是10和9。同例10由于是反查表,得到的仍是近似值。
例15 求总体N(20,3)的容量分别为10,15的两个独立样本均值差的绝对值大于0.3的概率。
解 设两独立样本分别为X,Y,其样本均值分别为,则
由内容提要中(6.9)式知
即
故
注 :以上各题(例11-15),是掌握正态总体下几种常用统计量分布的基础训练题。
例16
:
;
.
证:
。
注: 本题是一道综合题,所述结果很重要。它说明,如果样本增加一个,其n+1个数据构成新样本的均值和方差的求法无需从头做起,只要根据前n个数据求出的均值和方差,加上新的这个数据便可由1)和2)计算出来。证明最后一步时用到结论。
6.4 练习与测试
1 设随机变量X和Y相互独立,且都服从正态分布,而和是分别来自总体X和Y的简单随机样本,则统计量
服从 分布,参数(自由度)为 。
2 设是来自总体的容量为n+m的样本,则
(1)统计量服从 分布。
(2)统计量服从 分布。
(3)统计量服从 分布。
3 X服从正态分布且则服从 分布。
4设为10个样本的均值,则。
5 设随机变量,则T服从 分布。
6 设是来自具有分布的总体的样本,则
7 设分别来自两个正态总体的样本,且相互独立,分别为两个样本的样本方差,则。
8 设是来自正态总体的样本,为样本均值,记
则服从自由度为n-1的t-分布的随机变量是。
9 已知总体X有概率密度
试求样本的联合概率密度,并求
10 设是总体X的样本,而X服从区间[a,b]上的均匀分布,试求。
11 在总体中随机地抽取一个容量为5的样本。
(1) 求样本均值在11到15之间取值的概率;
(2) 求概率;
(3) 求概率。
12 随机观察总体X,取得10个数据如下
3.2,2.5,-4,2.5,0,3,2,2.5,4,2
求样本均值、样本方差及经验分布函数。
13 已知,从中随机抽取n=14的样本,试分别由以下条件求样本均值与总体均值之差的绝对值小于1.5的概率。
(1);(2)。
14 某厂生产的灯泡使用寿命。现进行质量检查,方法如下:任选若干个灯泡,若这些灯泡的平均寿命超过2200个小时,就认为该厂生产的灯泡质量合格。若要使检查能通过的概率超过0.997,问至少应检查多少个灯泡?
15 设在总体中抽取一容量为16的样本,这里均未知
(1) 求;
(2) 求。
16 设总体,从此总体中取容量为6的样本,设
试决定常数c,使得随机变量cY服从分布。
17 设是正态总体的一个样本,求
18 设总体相互独立,且都服从是分别来自X和Y的样本,求。
6.5 练习与测试答案
1..
2
.
3
4.
5.
6 n, 2.
7 由(6.10)式即得。
8 将(6.8)式作简单变形知 (B) 正确。
9.
故.
10;
11 (1) 0.7372;
(2)
=
(3)
=
12 1.77, 5.185,
13 (1) 0.7372,
a)
==0.80
14 n=189.1190
15
(1)
(2)
因,故
所以 (这是一个有用的结论。)
16 解
故
17.
18
本文来源:https://www.2haoxitong.net/k/doc/d5630620482fb4daa58d4b39.html
文档为doc格式