概率统计公式大全（复习重点）

发布时间：2020-10-02 03:36:50 来源：文档文库

小中大

字号：

手机查看

第一章随机事件和概率

（1）排列组合公式	从m个人中挑出n个人进行排列的可能数。从m个人中挑出n个人进行组合的可能数。
（2）加法和乘法原理	加法原理（两种方法均能完成此事）：m+n 某件事由两种方法来完成，第一种方法可由m种方法完成，第二种方法可由n种方法来完成，则这件事可由m+n 种方法来完成。乘法原理（两个步骤分别不能完成这件事）：m×n 某件事由两个步骤来完成，第一个步骤可由m种方法完成，第二个步骤可由n 种方法来完成，则这件事可由m×n 种方法来完成。
（3）一些常见排列	重复排列和非重复排列（有序）对立事件（至少有一个）顺序问题
（4）随机试验和随机事件	如果一个试验在相同条件下可以重复进行，而每次试验的可能结果不止一个，但在进行一次试验之前却不能断言它出现哪个结果，则称这种试验为随机试验。试验的可能结果称为随机事件。
（5）基本事件、样本空间和事件	在一个试验下，不管事件有多少个，总可以从其中找出这样一组事件，它具有如下性质： ①每进行一次试验，必须发生且只能发生这一组中的一个事件； ②任何事件，都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件，用来表示。基本事件的全体，称为试验的样本空间，用表示。一个事件就是由中的部分点（基本事件）组成的集合。通常用大写字母A，B，C，…表示事件，它们是的子集。为必然事件，Ø为不可能事件。不可能事件（Ø）的概率为零，而概率为零的事件不一定是不可能事件；同理，必然事件（Ω）的概率为1，而概率为1的事件也不一定是必然事件。
（6）事件的关系与运算	①关系：如果事件A的组成部分也是事件B的组成部分，（A发生必有事件B发生）：如果同时有，，则称事件A与事件B等价，或称A等于B：A=B。 A、B中至少有一个发生的事件：AB，或者A+B。属于A而不属于B的部分所构成的事件，称为A与B的差，记为A-B，也可表示为A-AB或者，它表示A发生而B不发生的事件。 A、B同时发生：AB，或者AB。AB=Ø，则表示A与B不可能同时发生，称事件A与事件B互不相容或者互斥。基本事件是互不相容的。 -A称为事件A的逆事件，或称A的对立事件，记为。它表示A不发生的事件。互斥未必对立。 ②运算：结合率：A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C 分配率：(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC) 德摩根率：，
（7）概率的公理化定义	设为样本空间，为事件，对每一个事件都有一个实数P(A)，若满足下列三个条件： 1° 0≤P(A)≤1， 2° P(Ω) =1 3° 对于两两互不相容的事件，，…有常称为可列（完全）可加性。则称P(A)为事件的概率。
（8）古典概型	1°， 2°。设任一事件，它是由组成的，则有 P(A)= =
（9）几何概型	若随机试验的结果为无限不可数并且每个结果出现的可能性均匀，同时样本空间中的每一个基本事件可以使用一个有界区域来描述，则称此随机试验为几何概型。对任一事件A，。其中L为几何度量（长度、面积、体积）。
（10）加法公式	P(A+B)=P(A)+P(B)-P(AB) 当P(AB)＝0时，P(A+B)=P(A)+P(B)
（11）减法公式	P(A-B)=P(A)-P(AB) 当BA时，P(A-B)=P(A)-P(B) 当A=Ω时，P()=1- P(B)
（12）条件概率	定义设A、B是两个事件，且P(A)>0，则称为事件A发生条件下，事件B发生的条件概率，记为。条件概率是概率的一种，所有概率的性质都适合于条件概率。例如P(Ω/B)=1P(/A)=1-P(B/A)
（13）乘法公式	乘法公式：更一般地，对事件A1，A2，…An，若P(A1A2…An-1)>0，则有 …………。
（14）独立性	①两个事件的独立性设事件、满足，则称事件、是相互独立的。若事件、相互独立，且，则有若事件、相互独立，则可得到与、与、与也都相互独立。必然事件和不可能事件Ø与任何事件都相互独立。 Ø与任何事件都互斥。 ②多个事件的独立性设ABC是三个事件，如果满足两两独立的条件， P(AB)=P(A)P(B)；P(BC)=P(B)P(C)；P(CA)=P(C)P(A) 并且同时满足P(ABC)=P(A)P(B)P(C) 那么A、B、C相互独立。对于n个事件类似。
（15）全概公式	设事件满足 1°两两互不相容，， 2°，则有。
（16）贝叶斯公式	设事件，，…，及满足 1° ，，…，两两互不相容，>0，1，2，…，， 2° ，，则，i=1，2，…n。此公式即为贝叶斯公式。，（，，…，），通常叫先验概率。，（，，…，），通常称为后验概率。贝叶斯公式反映了“因果”的概率规律，并作出了“由果朔因”的推断。
（17）伯努利概型	我们作了次试验，且满足 ◆ 每次试验只有两种可能结果，发生或不发生； ◆ 次试验是重复进行的，即发生的概率每次均一样； ◆ 每次试验是独立的，即每次试验发生与否与其他次试验发生与否是互不影响的。这种试验称为伯努利概型，或称为重伯努利试验。用表示每次试验发生的概率，则发生的概率为，用表示重伯努利试验中出现次的概率，，。

第二章随机变量及其分布

（1）离散型随机变量的分布律	设离散型随机变量的可能取值为Xk(k=1,2,…)且取各个值的概率，即事件(X=Xk)的概率为 P(X=xk)=pk，k=1,2,…，则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出：。显然分布律应满足下列条件：（1），，（2）。
（2）连续型随机变量的分布密度	设是随机变量的分布函数，若存在非负函数，对任意实数，有，则称为连续型随机变量。称为的概率密度函数或密度函数，简称概率密度。密度函数具有下面4个性质： 1° 。 2° 。
（3）离散与连续型随机变量的关系	积分元在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。
（4）分布函数	设为随机变量，是任意实数，则函数称为随机变量X的分布函数，本质上是一个累积函数。可以得到X落入区间的概率。分布函数表示随机变量落入区间（– ∞，x]内的概率。分布函数具有如下性质： 1° ； 2° 是单调不减的函数，即时，有； 3° ，； 4° ，即是右连续的； 5° 。对于离散型随机变量，；对于连续型随机变量，。
（5）八大分布	0-1分布	P(X=1)=p, P(X=0)=q
	二项分布	在重贝努里试验中，设事件发生的概率为。事件发生的次数是随机变量，设为，则可能取值为。，其中，则称随机变量服从参数为，的二项分布。记为。当时，，，这就是（0-1）分布，所以（0-1）分布是二项分布的特例。
	泊松分布	设随机变量的分布律为，，，则称随机变量服从参数为的泊松分布，记为或者P()。泊松分布为二项分布的极限分布（np=λ，n→∞）。
	超几何分布	随机变量X服从参数为n,N,M的超几何分布，记为H(n,N,M)。
	几何分布	，其中p≥0，q=1-p。随机变量X服从参数为p的几何分布，记为G(p)。
	均匀分布	设随机变量的值只落在[a，b]内，其密度函数在[a，b]上为常数，即 a≤x≤b 其他，则称随机变量在[a，b]上服从均匀分布，记为X~U(a，b)。分布函数为 a≤x≤b 0， x， 1， x>b。当a≤x12≤b时，X落在区间（）内的概率为。
	指数分布	, 0, , 其中，则称随机变量X服从参数为的指数分布。 X的分布函数为 , x<0。记住积分公式：
	正态分布	设随机变量的密度函数为，，其中、为常数，则称随机变量服从参数为、的正态分布或高斯（Gauss）分布，记为。具有如下性质： 1° 的图形是关于对称的； 2° 当时，为最大值；若，则的分布函数为。。参数、时的正态分布称为标准正态分布，记为，其密度函数记为，，分布函数为。是不可求积函数，其函数值，已编制成表可供查用。 Φ(-x)＝1-Φ(x)且Φ(0)＝。如果~，则~。。
（6）分位数	下分位表：；上分位表：。
（7）函数分布	离散型	已知的分布列为，的分布列（互不相等）如下：，若有某些相等，则应将对应的相加作为的概率。
（7）函数分布	连续型	先利用X的概率密度fX(x)写出Y的分布函数FY(y)＝P(g(X)≤y)，再利用变上下限积分的求导公式求出fY(y)。

第三章二维随机变量及其分布

（1）联合分布

离散型

如果二维随机向量（X，Y）的所有可能取值为至多可列个有序对（x,y），则称为离散型随机量。

设=（X，Y）的所有可能取值为，且事件{=}的概率为pij,,称

为=（X，Y）的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示：

Y X	y1	y2	…	yj	…
x1	p11	p12	…	p1j	…
x2	p21	p22	…	p2j	…

xi	pi1		…		…

这里pij具有下面两个性质：

（1）pij≥0（i,j=1,2,…）；

（2）

连续型

对于二维随机向量，如果存在非负函数，使对任意一个其邻边分别平行于坐标轴的矩形区域D，即D={(X,Y)|a有

则称为连续型随机向量；并称f(x,y)为=（X，Y）的分布密度或称为X和Y的联合分布密度。

分布密度f(x,y)具有下面两个性质：

（1） f(x,y)≥0;

（2）

（2）二维随机变量的本质

（3）联合分布函数

设（X，Y）为二维随机变量，对于任意实数x,y,二元函数

称为二维随机向量（X，Y）的分布函数，或称为随机变量X和Y的联合分布函数。

分布函数是一个以全平面为其定义域，以事件的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质：

（1）

（2）F（x,y）分别对x和y是非减的，即

当x2>x1时，有F（x2,y）≥F(x1,y);当y2>y1时，有F(x,y2) ≥F(x,y1);

（3）F（x,y）分别对x和y是右连续的，即

（4）

（5）对于

（4）离散型与连续型的关系

（5）边缘分布

离散型

X的边缘分布为

；

Y的边缘分布为

。

连续型

X的边缘分布密度为

Y的边缘分布密度为

（6）条件分布

离散型

在已知X=xi的条件下，Y取值的条件分布为

在已知Y=yj的条件下，X取值的条件分布为

连续型

在已知Y=y的条件下，X的条件分布密度为

；

在已知X=x的条件下，Y的条件分布密度为

（7）独立性

一般型

F(X,Y)=FX(x)FY(y)

离散型

有零不独立

连续型

f(x,y)=fX(x)fY(y)

直接判断，充要条件：

①可分离变量

②正概率密度区间为矩形

二维正态分布

＝0

随机变量的函数

若X1,X2,…Xm,Xm+1,…Xn相互独立， h,g为连续函数，则：

h（X1，X2,…Xm）和g（Xm+1,…Xn）相互独立。

特例：若X与Y独立，则：h（X）和g（Y）独立。

例如：若X与Y独立，则：3X+1和5Y-2独立。

（8）二维均匀分布

设随机向量（X，Y）的分布密度函数为

其中SD为区域D的面积，则称（X，Y）服从D上的均匀分布，记为（X，Y）～U（D）。

例如图3.1、图3.2和图3.3。

O 1 x

图3.1

O 2 x

图3.2

O a b x

图3.3

（9）二维正态分布

设随机向量（X，Y）的分布密度函数为

其中是5个参数，则称（X，Y）服从二维正态分布，

记为（X，Y）～N（

由边缘密度的计算公式，可以推出二维正态分布的两个边缘分布仍为正态分布，

即X～N（

但是若X～N（，(X，Y)未必是二维正态分布。

（10）函数分布

Z=X+Y

根据定义计算：

对于连续型，fZ(z)＝

两个独立的正态分布的和仍为正态分布（）。

n个相互独立的正态分布的线性组合，仍服从正态分布。

，

Z=max,min(X1,X2,…Xn)

若相互独立，其分布函数分别为，则Z=max,min(X1,X2,…Xn)的分布函数为：

分布

设n个随机变量相互独立，且服从标准正态分布，可以证明它们的平方和

的分布密度为

我们称随机变量W服从自由度为n的分布，记为W～，其中

所谓自由度是指独立正态随机变量的个数，它是随机变量分布中的一个重要参数。

分布满足可加性：设

则

t分布

设X，Y是两个相互独立的随机变量，且

可以证明函数

的概率密度为

我们称随机变量T服从自由度为n的t分布，记为T～t(n)。

F分布

设，且X与Y独立，可以证明的概率密度函数为

我们称随机变量F服从第一个自由度为n1，第二个自由度为n2的F分布，记为F～f(n1, n2).

第四章随机变量的数字特征

（1）一维随机变量的数字特征		离散型	连续型
	期望期望就是平均值	设X是离散型随机变量，其分布律为P()＝pk，k=1,2,…,n，（要求绝对收敛）	设X是连续型随机变量，其概率密度为f(x)，（要求绝对收敛）
	函数的期望	Y=g(X)	Y=g(X)
	方差 D(X)=E[X-E(X)]2，标准差，
	矩	①对于正整数k，称随机变量X的k次幂的数学期望为X的k阶原点矩，记为vk,即 νk=E(Xk)=, k=1,2, …. ②对于正整数k，称随机变量X与E（X）差的k次幂的数学期望为X的k阶中心矩，记为，即 =， k=1,2, ….	①对于正整数k，称随机变量X的k次幂的数学期望为X的k阶原点矩，记为vk,即 νk=E(Xk)= k=1,2, …. ②对于正整数k，称随机变量X与E（X）差的k次幂的数学期望为X的k阶中心矩，记为，即 = k=1,2, ….
	切比雪夫不等式	设随机变量X具有数学期望E（X）=μ，方差D（X）=σ2，则对于任意正数ε，有下列切比雪夫不等式切比雪夫不等式给出了在未知X的分布的情况下，对概率的一种估计，它在理论上有重要意义。
（2）期望的性质	（1） E(C)=C （2） E(CX)=CE(X) （3） E(X+Y)=E(X)+E(Y)，（4） E(XY)=E(X) E(Y)，充分条件：X和Y独立；充要条件：X和Y不相关。
（3）方差的性质	（1） D(C)=0；E(C)=C （2） D(aX)=a2D(X)； E(aX)=aE(X) （3） D(aX+b)= a2D(X)； E(aX+b)=aE(X)+b （4） D(X)=E(X2)-E2(X) （5） D(X±Y)=D(X)+D(Y)，充分条件：X和Y独立；充要条件：X和Y不相关。 D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))]，无条件成立。而E(X+Y)=E(X)+E(Y)，无条件成立。
（4）常见分布的期望和方差		期望	方差
	0-1分布	p
	二项分布	np
	泊松分布
	几何分布
	超几何分布
	均匀分布
	指数分布
	正态分布
		n	2n
	t分布	0	(n>2)
（5）二维随机变量的数字特征	期望
	函数的期望	＝	＝
	方差
	协方差	对于随机变量X与Y，称它们的二阶混合中心矩为X与Y的协方差或相关矩，记为，即与记号相对应，X与Y的方差D（X）与D（Y）也可分别记为与。
	相关系数	对于随机变量X与Y，如果D（X）>0, D(Y)>0，则称为X与Y的相关系数，记作（有时可简记为）。 \|\|≤1，当\|\|=1时，称X与Y完全相关：完全相关而当时，称X与Y不相关。以下五个命题是等价的： ①； ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).
	协方差矩阵
	混合矩	对于随机变量X与Y，如果有存在，则称之为X与Y的k+l阶混合原点矩，记为；k+l阶混合中心矩记为：

（6）协方差的性质

(i) cov (X, Y)=cov (Y, X);

(ii) cov(aX,bY)=ab cov(X,Y);

(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);

(iv) cov(X,Y)=E(XY)-E(X)E(Y).

（7）独立和不相关

（i）若随机变量X与Y相互独立，则；反之不真。

（ii）若（X，Y）～N（），

则X与Y相互独立的充要条件是X和Y不相关。

第五章大数定律和中心极限定理

（1）大数定律	切比雪夫大数定律	设随机变量X1，X2，…相互独立，均具有有限方差，且被同一常数C所界：D（Xi）…),则对于任意的正数ε，有特殊情形：若X1，X2，…具有相同的数学期望E（XI）=μ，则上式成为
	伯努利大数定律	设μ是n次独立试验中事件A发生的次数，p是事件A在每次试验中发生的概率，则对于任意的正数ε，有伯努利大数定律说明，当试验次数n很大时，事件A发生的频率与概率有较大判别的可能性很小，即这就以严格的数学形式描述了频率的稳定性。
	辛钦大数定律	设X1，X2，…，Xn，…是相互独立同分布的随机变量序列，且E（Xn）=μ，则对于任意的正数ε有
（2）中心极限定理	列维－林德伯格定理	设随机变量X1，X2，…相互独立，服从同一分布，且具有相同的数学期望和方差：，则随机变量的分布函数Fn(x)对任意的实数x，有此定理也称为独立同分布的中心极限定理。
（2）中心极限定理	棣莫弗－拉普拉斯定理	设随机变量为具有参数n, p(0的二项分布，则对于任意实数x,有
（3）二项定理	若当，则超几何分布的极限分布为二项分布。
（4）泊松定理	若当，则其中k=0，1，2，…，n，…。二项分布的极限分布为泊松分布。

第六章样本及抽样分布

（1）数理统计的基本概念	总体	在数理统计中，常把被考察对象的某一个（或多个）指标的全体称为总体（或母体）。我们总是把总体看成一个具有分布的随机变量（或随机向量）。
	个体	总体中的每一个单元称为样品（或个体）。
	样本	我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量，一般用n表示。在一般情况下，总是把样本看成是n个相互独立的且与总体有相同分布的随机变量，这样的样本称为简单随机样本。在泛指任一次抽取的结果时，表示n个随机变量（样本）；在具体的一次抽取之后，表示n个具体的数值（样本值）。我们称之为样本的两重性。
	样本函数和统计量	设为总体的一个样本，称（）为样本函数，其中为一个连续函数。如果中不包含任何未知参数，则称（）为一个统计量。
	常见统计量及其性质	样本均值样本方差样本标准差样本k阶原点矩样本k阶中心矩，，，, 其中，为二阶中心矩。
（2）正态总体下的四大分布	正态分布	设为来自正态总体的一个样本，则样本函数
	t分布	设为来自正态总体的一个样本，则样本函数其中t(n-1)表示自由度为n-1的t分布。
		设为来自正态总体的一个样本，则样本函数其中表示自由度为n-1的分布。
	F分布	设为来自正态总体的一个样本，而为来自正态总体的一个样本，则样本函数其中表示第一自由度为，第二自由度为的F分布。
（3）正态总体下分布的性质	与独立。

第七章参数估计

（1）点估计	矩估计	设总体X的分布中包含有未知数，则其分布函数可以表成它的k阶原点矩中也包含了未知参数，即。又设为总体X的n个样本值，其样本的k阶原点矩为这样，我们按照“当参数等于其估计量时，总体矩等于相应的样本矩”的原则建立方程，即有由上面的m个方程中，解出的m个未知参数即为参数（）的矩估计量。若为的矩估计，为连续函数，则为的矩估计。
	极大似然估计	当总体X为连续型随机变量时，设其分布密度为，其中为未知参数。又设为总体的一个样本，称为样本的似然函数，简记为Ln. 当总体X为离型随机变量时，设其分布律为，则称为样本的似然函数。若似然函数在处取到最大值，则称分别为的最大似然估计值，相应的统计量称为最大似然估计量。若为的极大似然估计，为单调函数，则为的极大似然估计。
（2）估计量的评选标准	无偏性	设为未知参数的估计量。若E （）=，则称为的无偏估计量。 E（）=E（X）， E（S2）=D（X）
	有效性	设和是未知参数的两个无偏估计量。若，则称有效。
	一致性	设是的一串估计量，如果对于任意的正数，都有则称为的一致估计量（或相合估计量）。若为的无偏估计，且则为的一致估计。只要总体的E(X)和D(X)存在，一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
（3）区间估计	置信区间和置信度	设总体X含有一个待估的未知参数。如果我们从样本出发，找出两个统计量与，使得区间以的概率包含这个待估参数，即那么称区间为的置信区间，为该区间的置信度（或置信水平）。
	单正态总体的期望和方差的区间估计	设为总体的一个样本，在置信度为下，我们来确定的置信区间。具体步骤如下：（i）选择样本函数；（ii）由置信度，查表找分位数；（iii）导出置信区间。
		已知方差，估计均值	（i）选择样本函数 (ii) 查表找分位数（iii）导出置信区间
		未知方差，估计均值	（i）选择样本函数 (ii)查表找分位数（iii）导出置信区间
		方差的区间估计	（i）选择样本函数（ii）查表找分位数（iii）导出的置信区间

第八章假设检验

基本思想	假设检验的统计思想是，概率很小的事件在一次试验中可以认为基本上是不会发生的，即小概率原理。为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生，那就表明原来的假定H0是不正确的，我们拒绝接受H0；如果由此没有导出不合理的现象，则不能拒绝接受H0，我们称H0是相容的。与H0相对的假设称为备择假设，用H1表示。这里所说的小概率事件就是事件，其概率就是检验水平α，通常我们取α=0.05，有时也取0.01或0.10。
基本步骤	假设检验的基本步骤如下： (i) 提出零假设H0； (ii) 选择统计量K； (iii) 对于检验水平α查表找分位数λ； (iv) 由样本值计算统计量之值K；将进行比较，作出判断：当时否定H0，否则认为H0相容。
两类错误	第一类错误	当H0为真时，而样本值却落入了否定域，按照我们规定的检验法则，应当否定H0。这时，我们把客观上H0成立判为H0为不成立（即否定了真实的假设），称这种错误为“以真当假”的错误或第一类错误，记为犯此类错误的概率，即 P{否定H0\|H0为真}=；此处的α恰好为检验水平。
	第二类错误	当H1为真时，而样本值却落入了相容域，按照我们规定的检验法则，应当接受H0。这时，我们把客观上H0。不成立判为H0成立（即接受了不真实的假设），称这种错误为“以假当真”的错误或第二类错误，记为犯此类错误的概率，即 P{接受H0\|H1为真}=。
	两类错误的关系	人们当然希望犯两类错误的概率同时都很小。但是，当容量n一定时，变小，则变大；相反地，变小，则变大。取定要想使变小，则必须增加样本容量。在实际使用时，通常人们只能控制犯第一类错误的概率，即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时，则应把α取得很小，如0.01，甚至0.001。反之，则应把α取得大些。