常见的分布函数

发布时间:2019-02-08 14:02:07   来源:文档文库   
字号:

6 数理统计的基本概念

6.1 基本要求

1 理解总体、样本()、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。

2 了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。

3 了解2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。

4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。

6.2 内容提要

6.2.1 总体和样本

1 总体和个体 研究对象的某项特征指标值的全体称为总体(母体),组成总体的每个元素称为个体。总体是一个随机变量,常用XY等来表示。

2 样本 从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。

3 简单随机样本 X1X2,…,Xn是来自总体X的容量为n的样本,如果这n个随机变量X1X2,…,Xn相互独立且每个样品Xi与总体X具有相同的分布,则称X1X2,…,Xn为总体X简单随机样本

4 样本的联合分布

若总体X具有分布函数F(x),则样本(X1X2,…,Xn)的联合分布函数为



若总体X为连续型随机变量,其概率密度函数为f(x),则样本的联合概率密度为

(6.1)

若总体X为离散型随机变量,其分布律为P{X=ai}=pi (i=12,…n),则样本的联合分布为

(6.2)

其中的任一组可能的观察值。

6.2.2 样本分布

1 频率分布

设样本值(x1x2,…,xn)中不同的数值是x1*x2*,…,xl*,记相应的频数分别为n1n2,…,nl,其中x1*< x2*<< xl*。则样本的频数分布及频率分布可由表6-1给出。

6-1

指标X

x1*

x2*

xl*

频数ni

n1

n2

nl

频率

2 经验分布函数

定义 (X1X2,…,Xn)为总体X的一个样本,其样本值为(x1x2,…,xn),则称函数

为样本值(x1x2,…,xn)的经验分布函数。

若已知样本值(x1x2,…,xn)的频数、频率分布表为

指标X

x1*

x2*

xl*

频数ni

n1

n2

nl

频率

则经验分布函数

(6.3)

6.2.3 几个重要分布及临界值

1分布 X1X2,…,Xn是相互独立的随机变量,且XiN (01) (i=12,…,n),则称随机变量



服从自由度为n分布,简记为(n)

2分布的性质

(1)(n),则,

(2),且Y1Y2相互独立,则有

3t分布 ,且XY相互独立,则称随机变量

服从自由度为nt分布,或称学生氏(Student)分布,简记为Tt(n)

4t分布的性质

(1)

(2);这里f (x)t分布的概率密度函数。

5F分布 ,且XY相互独立,则称随机变量

所服从的分布是自由度为mnF分布,简记为FF(mn)

6F分布的性质

(1)

(2)

(2) FF(mn),则

7临界值

(1) 标准正态分布的临界值 XN(01),对给定的正数,若存在实数满足

则称点为标准正态分布X临界值 (或称上分位点或分位数)

若已知,可通过反查标准正态分布表,求出临界值。当时,表中无法查出,此时查表,再由可求得临界值

(2)分布的临界值 ,概率密度为f(x)。对给定的数(01),若存在实数满足



则称数分布的临界值已知n,通过查分布表可求得。当n45时,可利用近似公式: 这里是标准正态分布的临界值。

(3) t分布的临界值 Tt(n),概率密度为f(x)。对给定的(01。若存在实数满足

则称点t分布的临界值。已知n,通过查t分布表可求得

1) 类似标准正态分布临界值的性质,对t分布亦有:

2) n45时,可用正态分布近似

(4) F分布的临界值 FF(m n),概率密度为f(x)。对给定的(01,若存在实数(mn)满足

则称数(mn)F分布的临界值。注意公式

6.2.4 统计量及样本矩

1统计量 (X1X2,…,Xn)为总体X的一个样本, (X1X2,…,Xn)X1X2,…,Xn的函数,若是连续函数且不含末知参数,则称(X1X2,…,Xn)是一个统计量

2.几个常用的统计量——样本矩

(1)样本均值

(2)样本方差

(3)样本标准差

(4)样本k阶原点矩

(5)样本k阶中心矩

3 样本矩与总体矩的关系

由样本的独立性及与总体同分布这一特性出发,运用数字特征的运算法则,可得:若总体X的期望、方差存在,即,又(X1X2,…,Xn)是取自总体X的一个样本,则

6.4

上述结论无论总体服从什么样的分布都正确,故它是计算任意总体,特别是非正态总体的样本均值和样本方差的期望、方差的常用结论。

6.2.5 正态总体样本均值和样本方差的分布

1. 设总体XN()()为样本,为样本均值,为样本方差

(1),或N (01) (6.5)

(2) (6.6)

(3) (6.7)

(4) 样本均值与样本方差相互独立;

(5) (6.8)

2.设()是取自总体X的一个样本,()是取自总体Y的一个样本,且这两个样本相互独立,即假定n1+n2个相互独立的随机变量。若总体XN()YN(),则有

1)N(01) (6.9)

2)F(n11n21) (6.10)

3)时,有

t(n1+n22) (6.11)

其中

6.3 典型例题分析

已知总体,求样本的联合分布

1.(X1X2,…,Xn)是取自总体X的一个样本。试在下列三种情况下,分别写出样本(X1X2,…,Xn)的联合分布律或联合概率密度。

(1)XB(1p)(2)X服从参数为的指数分布;(3)X服从(0)(>0)上的均匀分布。

分析: 解此类题先写出总体X的分布律(或概率密度);再由XiX有相同的分布以及Xi之间的相互独立性,由式(6.1),(6.2)即可写出样本(X1X2,…,Xn)的联合分布律或联合概率密度。

:1 因为总体分布律为

于是

样本的联合分布律为:

(2) 因为总体概率密度函数为:

所以,每一个样本的概率密度为:

故样本的联合概率密度为:

3)因为总体概率密度函数为:

所以样本Xi的概率密度为

故,样本的联合概率密度为:

2XN()(X1X2X3)为来自总体X的一个样本。试求样本(X1X2X3)的联合概率密度和样本均值的概率密度函数。

: 由于

又因为,所以,的概率密度函数为:

注: 此题用到结论:若,则。这一结果有十分广泛的应用。

3.设总体服从泊松分布是来自总体的简单随机样本

(1) 计算

(2) 若容量为10的一组样本观察值为(1243345648),试计算样本均值,样本方差和经验分布函数。

: 1解法一 由(6.4)式,因为

,于是,故

解法二

2

X的频率分布表为

指标X

1

2

3

4

5

6

8

频数ni

1

1

2

3

1

1

1

频率

1/10

1/10

2/10

3/10

1/10

1/10

1/10

所以,经验分布函数为

: 1)解法一直接运用样本矩与总体矩之间的关系,即(6.4)式求得;

解法二运用样本与总体同分布的特性及数字特征的运算法则求得。

2)写经验分布函数,可先列出频率分布表,这样不至遗漏或出错。

4 设总体

为样本。试求:

1数学期望与方差,的数学期望;(2

: 计算总体X的数学期望和方差

故(1

2)因为,所以

:当总体的期望和方差不能直接写出时,要先求总体的期望和方差,再求样本均值、样本方差及样本二阶中心矩的期望和方差。另外,要注意之间的差异。由于,即是总体方差的无偏估计,而不是总体方差的无偏估计,因此,一般都是以作为方差的估计量。但故当样本容量很大时,两者相差很小,此时亦可用来估计总体方差因此,有时把称为大样本方差,而有的书上也称为样本修正方差

本题(2)的解答用到了中心极限定理。由中心极限定理可得,不论总体服从什么分布,只要知道总体的数学期望,方差,则样本均值的渐近分布就为正态分布。即

由此可知

求样本均值落在某个区间内的概率,就可以利用上述结论近似计算,这是很重要的结论。

*5 是来自正态总体的简单样本,且则当时,统计量服从2-分布,其自由度为( )。

:

解法1

欲使,就必须使,由于

于是

,则,此时

解法2 由于且相互独立,则

从而

所以

为使

必须使

同上面两个服从正态分布的随机变量比较可知

:本题虽用了两种不同的解法,但目的相同且明确,即由分布的定义并由构成的特点,应选择恰当的a,b使恰为两个标准正态分布的平方和。

*6 是来自正态总体X的一个简单随机样本,

证明统计量T服从自由度为2t-分布.

证明: 由于从而

所以

于是

又因为,且

从而独立。于是由t分布的定义知

注: 本题的关键是熟练掌握t分布的定义及正态总体下样本均值、样本方差的分布:

N(01)

7.已知X。证明F(1n)

证明: 因为, , 其中

,又,

故由F-分布的定义知:

本题解答看似简单,但本章所学的三个分布都涉及到。因而了解证明过程中每一步的来龙去脉,对于熟悉、掌握有关随机变量及其分布是一项基础性训练。

8.设(X1X2,…,Xn)是来自正态总体N(01)的样本。试求统计量(m<n)的抽样分布。

因为

所以,

同理

于是

9.设(X1,…,X5)是来自正态总体N()的一个样本。试证:

(1)时,F(13)

(2)时,t(3)

(1)

于是

F-分布的定义,即得:

(2) 据(1)的分析,

t-分布的定义即得结论。

注: 本题仍是关于F-分布和t-分布的基础训练题。

10 为总体的一个样本,求

解: 因为

于是

分布临界值的定义,查表可知,故

注: 本题由于出现了随机变量的平方和,故在寻找的分布时自然想到分布。但分布中的均服从N (0,1),所以只要将此处的标准化即可。由临界值的定义,一般查表是已知,找临界值,而此处则相反,是已知临界值,故得到的是近似值。

*11 从正态总体中抽取容量为n的样本,如果要求其样本均值位于区间(1.45.4)内的概率不小于0.95,问样本容量n至少应取多少?

Z

1.28

1.645

1.96

2.33

(z)

0.900

0.950

0.975

0.990

设正态总体为X,则,从而由(6.5)式得

所以

。由此可得,即n(1.963)234.57,n至少应取35

12.设X1X2,…,Xn为相互独立且分别服从正态分布N()的随机变量。设

证明:。特别地,若N() i=12,…,n,则

证明相互独立

同理可证若N() i=12,…,n,则

本例说明n个相互独立正态分布随机变量的线性组合仍服从正态分布。特殊情形:若取,则结论正是正态总体下样本均值的分布(6.5)式。该题结果可作为一般结论直接引用。

13.设总体XN ()。现抽取容量为9的样本,得到,问是多少?

服从自由度为n-1=8t分布,又由于t分布的对称性,有

,查表知,由插值可求得,即

本题的关键是寻找含有统计量的分布。由于2未知,故不能用来解题,但S已知,由(6.8)式得,于是由t分布临界值的定义即可顺利求得相应的概率。

14 是来自总体X的随机样本,求下列概率。

1

2

1)由内容提要6.2.5

0.98-0.02=0.96

2利用(6.7)式得

本题关键是要注意这两个统计量的差异。它们虽然都服从分布,但由于的不同使其自由度也不同。查表时,上述两个随机变量的自由度分别是109。同例10由于是反查表,得到的仍是近似值。

15 求总体N(20,3)的容量分别为1015的两个独立样本均值差的绝对值大于0.3的概率。

设两独立样本分别为X,Y,其样本均值分别为,则

由内容提要中(6.9)式知

:以上各题(例11-15),是掌握正态总体下几种常用统计量分布的基础训练题。

16

:

;

.

证:

本题是一道综合题,所述结果很重要。它说明,如果样本增加一个,其n+1个数据构成新样本的均值和方差的求法无需从头做起,只要根据前n个数据求出的均值和方差,加上新的这个数据便可由1)和2)计算出来。证明最后一步时用到结论

6.4 练习与测试

1 设随机变量XY相互独立,且都服从正态分布,而是分别来自总体XY的简单随机样本,则统计量

服从 分布,参数(自由度)为

2 是来自总体的容量为n+m的样本,则

1)统计量服从 分布。

2)统计量服从 分布。

3)统计量服从 分布。

3 X服从正态分布且服从 分布。

410个样本的均值,则

5 设随机变量,则T服从 分布。

6 是来自具有分布的总体的样本,则

7 分别来自两个正态总体的样本,且相互独立,分别为两个样本的样本方差,则

8 是来自正态总体的样本,为样本均值,记

则服从自由度为n-1t-分布的随机变量是

9 已知总体X有概率密度

试求样本的联合概率密度,并求

10 是总体X的样本,而X服从区间[ab]上的均匀分布,试求

11 在总体中随机地抽取一个容量为5的样本

(1) 求样本均值1115之间取值的概率;

(2) 求概率

(3) 求概率

12 随机观察总体X,取得10个数据如下

3.22.5-42.50322.542

求样本均值、样本方差及经验分布函数。

13 已知,从中随机抽取n=14的样本,试分别由以下条件求样本均值与总体均值之差的绝对值小于1.5的概率。

1;(2

14 某厂生产的灯泡使用寿命。现进行质量检查,方法如下:任选若干个灯泡,若这些灯泡的平均寿命超过2200个小时,就认为该厂生产的灯泡质量合格。若要使检查能通过的概率超过0.997,问至少应检查多少个灯泡?

15 设在总体中抽取一容量为16的样本,这里均未知

(1)

(2)

16 设总体,从此总体中取容量为6的样本,设

试决定常数c,使得随机变量cY服从分布。

17 是正态总体的一个样本,求

18 设总体相互独立,且都服从是分别来自XY的样本,求

6.5 练习与测试答案

1..

2

.

3

4.

5.

6 n, 2.

7 由(6.10)式即得

8 将(6.8)式作简单变形知 (B) 正确。

9.

.

10

11 (1) 0.7372

(2)

=

3

=

12 1.77, 5.185,

13 (1) 0.7372,

a)

==0.80

14 n=189.1190

15

(1)

(2)

,故

所以 (这是一个有用的结论。)

16

17.

18

本文来源:https://www.2haoxitong.net/k/doc/d5630620482fb4daa58d4b39.html

《常见的分布函数.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式