古典概型
随机事件
事件分类
- 不可能与零概率
- 不可能事件:A=∅
- 零概率事件:P{A}=0
- 不可能事件一定是零概率事件,反之不一定
- 必然与一概率
- 必然事件:A=Ω
- 一概率事件:P{A}=1
- 必然事件一定是一概率事件,反之不一定
事件运算
- 并:A∩B=A+B,表示有一个事件发生
- 交:A∪B=AB,表示事件同时发生
- 逆:A,表示事件不发生
- 差:A−B=AB,A发生且B不发生的概率
事件关系
- 独立
- 满足P{AB}=P{A}P{B}
- 零概率事件和一概率事件与任何事件独立
- 如果A,B的概率都不为零,P{AB}=0⇒AB=∅,即不互斥
- 证明不独立:先看是否相关,如果不相关,就找两个事件AB,证明A⊂B,B=Ω,从而P(AB)=P(A)>P(A)P(B)从而不独立
- 互斥(互不相容)
- 满足AB=∅
- 不可能事件与任何事件互斥
- 如果A,B的概率都不为零,AB=∅⇒P{AB}=0=P{A}P{B},即不独立
- 若还满足A+B=Ω则为对立
- 包含
- A⊂B⇒P{A}≤P{B},A发生则B必然发生
- P{A}=P{AB},P{B}=P{A+B}
概率公式
概率基本公式
- 加法定律
- P{A+B}=P{A}+P{B}−P{AB}
- P{A+B+C}=P{A}+P{B}+P{C}−P{AB}−P{AC}−P{BC}+P{ABC}
- 减法定律
- P{A−B}=P{AB}=P{A}−P{AB}
- 逆运算
- P{A}=1−P{A}
- 分配率
- P{(A+B)C}=P{AC+BC}
- P{AB+C}=P{(A+C)(B+C)}
- 对偶律
- P{AB}=P{A+B}
- P{A+B}=P{AˉBˉ}
条件概率公式
- 定义
P{B∣A}=P{A}P{AB}
- 性质
P{B∣A}=1−P{B∣A}=1−P{A}P{AB}P{A1+A2∣B}=P{A1∣B}+P{A2∣B}−P{A1A2∣B}
常用结论
- AB=AˉBˉ,或AB=AB,或A+B=Aˉ+Bˉ,或A+B=A+B,则A,B对立
- P{AB}=P{A+B}则P{AB}=P{A+B}=P{A}=P{B}
- 事件互斥说明样本空间没有交集;样本空间相同则事件相同
- 相互独立一定两两独立,反之不一定
- 相互独立的事件分为两组,每组进行任意运算,得到的两个事件依然独立
一维随机变量
分布
分布函数
- 定义
- 对于任意随机变量X,记F(x)=P{X≤x}为X的分布函数
x为下分位数,表示{X≤x}的发生概率;同理,上分位数y,表示{X>y}的发生概率
- F(x)表示事件{X≤x}发生的概率
- 性质
- F(x)单调不减,F(x)=F(x+),即右连续
- F(x)∈[0,1],f(−∞)=0,f(+∞)=1
- P{X<x}=F(x−),P{X=x}=F(x)−F(x−)
概率分布
- 对于离散型随机变量,概率分布指分布律
- 离散型随机变量X,用P{X=xi}=pi表示X的分布律
- 对于连续型随机变量,概率分布值概率密度
- 连续型随机变量X,用f(x)表示X的概率密度
复合分布
- 离散型随机变量
- 若P{X=xi}=pi,则Y=g(X)的分布律为P{X=g(xi)}=pi
- 连续型随机变量
- 定义法:若X的概率密度函数为fX(x),Y=g(X),则FY(y)=P{g(X)≤y}=∫g(x)≤yfX(x)dx,求导得到fY(y)
- 公式法:若y=g(x)处处可导且单调,则
FY(y)=P{Y≤y}=P{g(X)≤y}=P{x≤g−1(y)}=F(g−1(y))fY(y)={fX(g−1(y))∣∣(g−1(y))′∣∣0y∈g(x)的值域其他
X的分布函数F(x),x∈(a,b)为单调增函数,则Y=F(X)服从U(0,1)
- 非离散非连续随机变量
- 画出纵坐标为Y,横坐标为X的关系图
- 用y=y0截取关系图,位于直线下方的点的横坐标范围就是X的范围,积分结果就是P{Y<y0}
离散型
概念
- 定义
- 如果随机变量X只能取有限值或无穷可列个值xi,则X为离散型随机变量
- 性质
- pi≥0,∑pi=1
- F(x)=∑xi<xpi
- F(x)在pi处右连续,在其它点处处连续
- 矩
- E(X)=∑pixi
- E(g(X))=∑pig(xi)
- D(X)=E[X−E(X)]2=∑pi(xi−μ)2=∑pixi2−(∑pixi)2
0-1分布
- 定义
- P{X=k}=pk(1−p)1−k(k=0,1),则X服从参数为p的0-1分布/两点分布
- 矩
- E(X)=p
- D(X)=p(1−p)
二项分布
- 定义
- P{X=k}=Cnkpk(1−p)n−k(k=0,1,⋯n),则X服从参数为n,p的二项分布
- 记为X∼B(n,p)
- 性质
- X∼B(n,p)⇔n−X∼B(n,1−p)
- X∼B(n,p),Y∼B(m,p),X,Y独立,则X+Y∼B(n+m,p)
- 最大概率项(用概率比值法):{⌊(n+1)p⌋(n+1)p或(n+1)p−1 if (n+1)p不是整数 if (n+1)p是整数
- 矩
- E(X)=np
- D(X)=np(1−p)
几何分布
- 定义
- P{X=n}=p(1−p)n−1(k=0,1,⋯),则X服从参数为p的几何分布
- 性质
- 无记忆性:P{X=m+n∣X>m}=P{X=n}, P{X>m+n∣X>m}=P{X>n}
- 矩
- E(X)=p1
- D(X)=p21−p
超几何分布
- 定义
- P{X=k}=CN1+N2nCN1kCN2n−k(k=0,1,⋯,min(n,N1)),则X服从超几何分布
- 从N1个白球和N2个黑球中一次性拿n个球,抽到k个白球的概率为P{X=k}
- 矩
- E(X)=N1+N2nN1
- D(X)=(N1+N2)2(N1+N2−1)nN1N2(N1+N2−n)
泊松分布
- 定义
- P{X=k}=k!λke−λ(k=0,1,⋯),则X服从参数为λ泊松分布
- 记为X∼P(λ)
- 性质
- X∼P(λ1),Y∼P(λ2),X,Y独立,则X+Y∼P(λ1+λ2)
- 若X∼B(n,p),当n充分大、p充分小、np适中时,B(n,p)≈P(np)
- 矩
- E(X)=λ
- D(X)=λ
连续型
概念
- 定义
- 若随机变量X的分布函数F(x)连续,且存在非负可积函数f(x),满足
F(x)=P{X≤x}=∫−∞xf(t)dt
则X为连续型随机变量
- 性质
- f(x)≥0,∫−∞+∞f(t)dt=1
- P{x1<X≤x2}=P{x1≤X≤x2}=P{x1≤X<x2}=P{x1<X<x2}=∫x1x2f(t)dt
- 若f(x)在x连续,则F′(x)=f(x)
- 矩
- E(X)=∫−∞+∞xf(x)dx
- E(g(X))=∫−∞+∞g(x)f(x)dx
- D(X)=E[X−E(X)]2=∫−∞+∞(x−μ)2f(x)dx=∫−∞+∞x2f(x)dx−(∫−∞+∞xf(x)dx)2
均匀分布
- 定义
f(x)={b−a10a<x<b其他F(x)=⎩⎨⎧0b−ax−a1x<aa⩽x<bx⩾b
- 记为X∼U(a,b)
- 矩
- E(X)=2a+b
- D(X)=12(b−a)2
指数分布
- 定义
f(x)={λe−λx0x>0x⩽0F(x)={1−e−λx0x>0x⩽0
- 记为X∼E(λ)
- 性质
- P{X>x}=e−λx
- 无记忆性:P{X>s+t∣X>s}=P{X>t}
- 矩
- E(X)=λ1
- D(X)=λ21
正态分布
- 定义
f(x)=2πσ1e−2σ2(x−μ)2F(x)=2πσ1∫−∞xe−2σ2(t−μ)2 dt
- 记为X∼N(μ,σ2)
- 定义Φ(σx−μ)=F(x)=P{X⩽x},Φ(x)为标准正态分布的分布函数
- 定义σ1ϕ(σx−μ)=F′(x)=f(x),ϕ(x)为标准正态分布的概率密度([Φ(g(x))]′=g(x)′ϕ(g(x)))
- 性质
- 最大值f(μ)=2πσ1,驻点μ,拐点μ+σ
- N(μX,σX2)±N(μY,σY2)=N(μX±μY,σX2+σY2),前提是独立
- a+bN(μ,σ2)=N(a+bμ,b2σ2)
- Φ(−x)=1−Φ(x),ϕ(−x)=ϕ(x)
- ∫0+∞x2ϕ(x)dx=21,∫0+∞xϕ(x)dx=2π1,∫0+∞ϕ(x)dx=21
- 矩
- E(X)=μ
- D(X)=σ2
- νk=E[X−E(X)]k={(k−1)!!σk0 if k为偶数 if k为奇数
- μk=E(Xk)=E[X−E(X)+E(X)]k,利用νk的展开式递推
卡方分布
- 定义
- X1,⋯,Xn独立且均服从标准正态分布N,则
χ2(n)=∑Xi2
为自由度为n的卡方分布
- 若P{χ2(n)>χα2(n)}=α,记χα2(n)为χ2(n)的上α位分位点
- 性质
- N2∼χ2(1)
- 若χ2(n1),χ2(n2)独立,χ2(n1)+χ2(n2)=χ2(n1+n2)
- 矩
- E[χ2(n)]=n
- D[χ2(n)]=2n
t分布
- 定义
- 若N,χ2(n)独立,则
τ(n)=χ2(n)/nN
- 若P{τ(n)>τα(n)}=α,记τα(n)为τ的上α位分位点
- 性质
- τ1−α(n)=−τα(n)
- τ(n)LnN
- τ2(n)∼F(1,n)
- 矩
- E[τ(n)]=0
- D[τ(n)]=n−2n
F分布
- 定义
- 若χ2(m),χ2(n)独立,则
F(m,n)=χ2(n)/nχ2(m)/m
- 若P{F(m,n)>Fα(m,n)}=α,记Fα(m,n)为F(m,n)的上α位分位点
- 性质
- F(m,n)1∼F(n,m)
- F1−α(m,n)=Fα(n,m)1
- 矩
- E[F(m,n)]=n−2n
- D[F(m,n)]=m(n−2)2(n−4)2n2(m+n−2)
二维随机变量
分布
联合分布
- 定义
- 对于二维随机变量(X,Y),对于任意实数x,y,称二元函数F(x,y)=P{X≤x,Y≤y}为X和Y的联合分布函数,或(X,Y)的概率分布
- F(x,y)表示{X≤x}与{Y≤y}同时发生的概率
- 性质
- F(−∞,−∞)=F(−∞,y)=F(x,−∞)=0,F(+∞,+∞)=1
- F(x,y)=F(x+,y)≤F(x+δx,y),F(x,y)=F(x,y+)≤F(x,y+δy),即对于x和y均右连续且单调不减
- G={(x,y)∣x1<X≤x2,y1≤Y≤y2},P{(X,Y)∈G}=F(x2,y2)−F(x2,y1)+F(x1,y1)−F(x1,y2)≥0
- FaX,bY(x,y)=FX,Y(ax,by),F(ax,by)→abf(ax,by)
- 对于复杂联合分布,通过事件运算化简
===P{max(X,Y)≤z1,min(X,Y)≤z2}P{max(X,Y)≤z1,min(X,Y)>z2}P{max(X,Y)≤z1}−P{max(X,Y)≤z1,min(X,Y)>z2}P{X≤z1,Y≤z1}−P{z2<X≤z1,z2<Y≤z1}
边缘分布
- 定义
- FX(x)=P{X≤x}=P{X≤x,Y<+∞}=F(x,+∞)为关于X的边缘分布函数
- FY(y)=P{Y≤y}=P{X<+∞,Y≤y}=F(+∞,y)为关于Y的边缘分布函数
- fX(x)=P{X=x}=P{X=x,Y<+∞}=f(x,+∞)为关于X的边缘密度函数
- fY(y)=P{Y=y}=P{X<+∞,Y=y}=f(+∞,y)为关于Y的边缘密度函数
- 性质
- (X,Y)的分布函数可以确定X和Y的边缘分布函数
- X和Y的边缘分布函数可以确定(X,Y)的分布函数的前提是X和Y相互独立
条件分布
- 定义
- 变量分布与另一个变量取值有关,如X服从0-2均匀分布,Y服从0-X均匀分布
- 条件分布函数
FX∣Y(x∣y)=P{X≤x∣Y=y}FY∣X(y∣x)=P{Y≤y∣X=x}
- 条件密度函数
fX∣Y(x∣y)=P{X=x∣Y=y}fY∣X(y∣x)=P{Y=y∣X=x}
- 性质
- 密度乘法公式:f(x,y)=fX(x)fY∣X(y∣x)=fY(y)fX∣Y(x∣y)(fX(x)>0,fY(y)>0)
独立分布
- 判断
- 对于二维离散型随机变量:对任意xi,yj,都有P{X=xi,Y=yj}=P{X=xi}P{Y=yj},即pij=pi⋅p⋅j
- 对于二维连续型随机变量:对f(x,y)上任意连续点,都有f(x,y)=fX(x)fY(y)或F(x,y)=FX(x)FY(y)
- 对于二维混合型随机变量:对任意xi,yj,都有P{X=xi,Y≤yj}=P{X=xi}P{Y≤yj}
- 性质
- 定义域为矩形才有可能独立
- 二维离散型随机变量独立,则联合分布律的行列成比例
- 两个随机变量独立,则条件分布等于其边缘分布
- 几个相互独立的变量,它们各自的任意复合分布也相互独立
复合分布
- 求Z=g(X,Y)的分布
- 确定(X,Y)的定义域
- 判断FZ(z)=P{Z≤z}=P{g(X,Y)≤z}恒成立、恒不成立时z的取值范围,得到FZ(z)的一部分
- 绘制g(X,Y)=z的图像,确定(X,Y)的定义域中落在g(X,Y)≤z的部分,对该区域积分得到FZ(z)的其余部分
- 对FZ(z)求导得到fZ(z)
- 性质
- E(Z)=∬g(x,y)f(x,y)dxdy
- Xi独立同分布,计算∑Xi时,多次使用卷积公式
离散型
- 定义
- 对于离散型随机变量X与Y,则(X,Y)为二维离散型随机变量
- 联合分布律为P{X=xi,Y=yj}=pij
- 边缘分布
pi⋅=FX(xi)=j∑P{X=xi,Y=yj}=j∑pijp⋅j=FY(yj)=i∑P{X=xi,Y=yi}=i∑pij
- 条件分布
P{X=xi∣Y=yj}=P{Y=yj}P{X=xi,Y=yj}=p⋅jpijP{Y=yj∣X=xi}=P{X=xi}P{X=xi,Y=yj}=pi⋅pij
连续型
概念
- 定义
- 设二维随机变量(X,Y)的分布函数为F(x,y),如果存在非负的可积函数f(x,y)使对于任意x,y,有
F(x,y)=∫−∞x∫−∞yf(u,v)du dv
- 则称(X,Y)为二维连续型随机变量,f(x,y)为联合概率密度
- 若f(x,y)在点(x,y)处连续,则有∂x∂y∂2F(x,y)=f(x,y)
- P{g(X,Y)>0}=∬{(x,y)∣g(x,y)>0}f(x,y)dxdy
- 边缘分布
FX(x)=F(x,+∞)=∫−∞x[∫−∞+∞f(x,y)dy]dxFY(y)=F(+∞,y)=∫−∞y[∫−∞+∞f(x,y)dx]dyfX(x)=∫−∞+∞f(x,y)dyfY(y)=∫−∞+∞f(x,y)dx
- P{g(X)>0}=∬{x∣g(x)>0}f(x,y)dxdy=∫{x∣g(x)>0}fX(x)dx
- 条件分布
FX∣Y(x∣y)=∫−∞xfY(y)f(t,y)dtFY∣X(y∣x)=∫−∞yfX(x)f(x,t)dtfX∣Y(x∣y)=fY(y)f(x,y)fY∣X(y∣x)=fX(x)f(x,y)
- 直线与概率密度定义域的交集就是条件密度的定义域
- 注意排除边缘概率等于0的点
- 求非独立时的联合分布函数
- 已知(X,Y)的联合概率密度f(x,y),求(g(X),h(Y))的联合概率密度
根据F(g(X),h(Y))(x,y)=P{g(X)≤x,h(Y)≤y},确定X,Y的取值范围DX,DY,从而F(g(X),h(Y))(x,y)=∫DXdx∫Dyf(x,y)dy
- 已知独立变量X,Y的概率密度f(x,y),求(g(X,Y),h(X,Y))的联合概率密度
F((g(X,Y),h(X,Y)))(x,y)=P{g(X,Y)≤x,h(X,Y)≤y}=P{(g(X,Y)≤x)(h(X,Y)≤y)},用概率公式化简,最终带入FX(x),FY(y),从而f(g(X,Y),h(X,Y))(x,y)=∂x∂y∂2F(g(X,Y),h(X,Y))(x,y)
- 注意确定定义域分段时,不仅要单独看x,y,还要考虑它们的相互关系
二维正态分布
- 定义
f(x,y)∼N(μ1,μ2,σ12,σ22,ρ)=2πσ1σ21−ρ21e−2(1−ρ2)1[σ12(x−μ1)2+σ22(y−μ2)2−σ1σ22ρ(x−μ1)(y−μ2)]
- 性质
- 独立性:X,Y相互独立⇔ρ=0
- 若∣∣acbd∣∣=0,则(aX+bY,cX+dY)也服从二维正态分布
混合型
- 定义
- 设X为离散型随机变量,Y为混合型随机变量,则(X,Y)为二维混合型随机变量
- 联合分布函数
F(x,y)=xi∈X∑P{X=xi}E({yi∣yi∈Y,yi≤y}∣X=xi)
- 复合分布函数Z=g(X,Y)
FZ(z)=P{g(X,Y)≤z}=xi∈X∑P{X=xi}P{g(xi,Y)≤z}
- 联合分布
- 求每一个部分的分布和定义域,合成得到总的分布和定义域
数字特征
期望和方差
- 期望的性质
- 设C是常数,则有E(C)=C
- 设X是随机变量, C是常数,则有E(CX)=CE(X)
- 设X和Y是两个任意随机变量,则有E(X±Y)=E(X)±E(Y)
- 设X和Y是两个独立随机变量,则有E(XY)=E(X)E(Y)
- 方差的性质
- D(X)=E{[X−E(X)]2}=E(X2)−E2(X)
- 设C是常数,则D(C)=0;反过来不成立,只能得到P{X=E(X)}=1
- 设X是随机变量, C是常数,则有D(X+C)=D(X),D(CX)=C2D(X)
- 设随机变量X与Y相互独立,则有D(X±Y)=D(X)+D(Y)
协方差和相关系数
- 协方差的性质
- Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}=E(XY)−E(X)E(Y)
- D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
- Cov(X,Y)=Cov(Y,X)
- Cov(X,X)=D(X)
- Cov(aX,bY)=abCov(X,Y)
- Cov(A+B,C−D)=Cov(A,C)−Cov(A,D)+Cov(B,C)−Cov(B,D)
- 相关系数的性质
- ρXY=D(X)D(Y)Cov(X,Y)
- ∣ρXY∣⩽1,取等的充要条件是存在常数a,b,使得P{Y=aX+b}=1,a>0时ρ=1,a<0时ρ=−1
- ρXY=0 ⇔ X与Y不相关 ⇔ E(XY)=E(X)E(Y) ⇔ D(X±Y)=D(X)+D(Y)
- 独立一定不相关,不相关不一定独立
- 对于二维正态分布和二维0-1分布,独立等于不相关
随机变量的矩
- 零点矩μk
μk=E(Xk)
- 中心矩νk
νk=E[X−E(X)]k
数理统计
随机变量序列
切比雪夫不等式
- 定义
P{∣X−E(X)∣≥ε}≤ε2D(X)P{∣X−E(X)∣<ε}≥1−ε2D(X)
- 作用
- 估计X落在(EX−ε,EX+ε)的概率
依概率收敛
- 定义
- 对于随机变量序列Y1,⋯,Yn⋯,若对于常数a,对于任意正数ε,有
n→∞limP{∣Yn−a∣<ε}=1
则Y1,⋯,Yn⋯依概率收敛为a,记作Yn→Pa
- 表示实验次数越多,Xn落在(a−ε,a+ε)的概率越趋向于1
- 性质
- Xn→Px,Yn→Py,若g(x,y)在(a,b)连续,则
g(Xn,Yn)→Pg(x,y)
大数定律
- 切比雪夫大数定律
- 随机变量之间独立,随机变量的期望存在、方差存在且有限
- 样本均值→P对应的随机变量期望的均值
- 伯努利大数定律
- 对于二项分布Xn∼B(n,p)
- 样本中实验发生概率→Pp
- 辛钦大数定律
- 考虑切比雪夫大数定律中,若随机变量同分布
- X→PE(Xi)
- 更进一步,由独立性的性质可得g(X)→PE(g(Xi))
中心极限定理
- 列维-林德伯格定理
- 随机变量之间独立同分布,随机变量的期望存在、方差存在且有限
- 期望为μ,方差为σ2,则XLnN(μ,nσ2)
- 棣莫弗-拉普拉斯定理
- 若Xn∼B(n,p),随着n增大,Xn趋向正态分布
- 则XnLnN(np,np(1−p))
统计量
总体与样本
- 相互独立且与总体X同分布的随机变量X1,⋯,Xn称为样本
- n为样本容量,x1,⋯,xn为样本值,或X1,⋯,Xn的观测值,可以来源于X的n次简单随机抽样
- 样本的联合分布函数FX1,⋯,Xn(x1,⋯,xn)=∏FX(xi)
- 样本的概率密度函数fX1,⋯,Xn(x1,⋯,xn)=∏fX(xi)
- 样本的分布律P{X1=x1,⋯,Xn=xn}=∏P{X=xi}
- 样本的值域为分布的非0区域
统计量的性质
- 统计量的概念
- g(X1,⋯,Xn)为X1,⋯,Xn的一个统计量,g(x1,⋯,xn)为统计量的一个观测值
- 统计量也是随机变量
- 常用统计量
- 样本均值X=n1∑Xi
- 样本方差S2=n−11∑(Xi−X)2
- 样本协方差SXY2=nX+nY−2(nX−1)SX2+(nY−1)SY2
- 样本原点矩Ak=n1∑Xik
- 样本中心矩Bk=n1∑(Xi−X)k
- 统计量与实际值
- E(Xi)=E(X)=μ,D(Xi)=D(X)=σ2
- E(X)=μ,D(X)=nσ2
- E(S2)=σ2,D(S2)=nν4−n(n−1)n−3σ4
统计量的分布
- 若X∼N(μ,σ2),则
- X
σ/nX−μ∼NS/nX−μ∼τ(n−1)
- S2
σ2(n−1)S2∼χ2(n−1)
- 且X与S2相互独立
- 若X∼N(μX,σX2),Y∼N(μY,σY2)且X,Y独立,则
- X−Y
若总体同方差 σX2/nX+σY2/nY(X−Y)−(μX−μY)∼NsXY1/nX+1/nY(X−Y)−(μX−μY)∼τ(nX+nY−2)
- SX2/SY2
σX2/σY2SX2/SY2∼F(nX−1,nY−1)
- 若总体同方差,SXY2
σ2(nX+nY−2)SXY2∼χ2(nX+nY−2)
参数估计
矩估计法
- 计算总体的1∼k阶原点矩
- 离散型
μl(θ1,θ2,⋯,θk)=E(Xl)=i=1∑∞xilp(xi;θ1,θ2,⋯,θk)l=1,2,⋯,k
- 连续型
μl(θ1,θ2,⋯,θk)=E(Xl)=∫−∞+∞xlf(x;θ1,θ2,⋯,θk)dxl=1,2,⋯,k
- 令样本矩等于总体矩
Xil=E(Xl)(l=1,2,⋯,k)
- 得到关于θ1,θ2,⋯,θk的k个方程
- 如果某一个等式中不含θi,则需要计算k+1阶原点矩然后令样本矩等于总体矩,重复此步直到得到新的关于θi的等式
- 多个解时,利用E(X)=Xˉ,D(X)=E(X2)−E2(X)=S2求解
- 求解
- 得到θl的矩估计量θ^l(X1,⋯,Xn)
- θ^l(x1,⋯,xn)为矩估计值
- 性质
- 若θ^是θ的矩估计量,则g(θ^)不是g(θ)的矩估计量
- E(X)的矩估计量为Xˉ;D(X)的矩估计量为nn−1S2
- 根据θ^与Xi的关系确定Fθ^(θ),fθ^(θ)
最大似然估计
- 构造似然函数
- 离散型
L(θ)=∏p(xi,θ)
- 连续型
L(θ)=∏f(xi,θ)
- 表示样本观测值为x1,⋯,xn的概率
- 找到使似然函数最大的θ
dθdlnL(θ)=0
- 得到θ的极大似然估计值θ^l(x1,⋯,xn)
- θ^l(X1,⋯,Xn)为极大似然估计量
- 若包含多个要估计的量则为
∂μ∂lnL(μ,σ2)=0∂σ2∂lnL(μ,σ2)=0
- 特殊情况
- lnL(θ)单调递增,则θ越大越好,由于样本x1,⋯,xn有范围,因此θ^=min(x1,⋯,xn)
- lnL(θ)单调递减,则θ越小越好,由于样本x1,⋯,xn有范围,因此θ^=max(x1,⋯,xn)
- 对于分段L(θ),则列出(Xi)在不同取值下的似然函数,该函数取最大值时的参数就是估计值,从而得到估计值关于(Xi)的分段关系式
如求出来的估计值不在参数范围内,用该方法
- 对于常函数L(θ),任何满足定义域的(xi)都取到最大值,因此xi∈[a,b],满足min(xi)≥a,max(xi)≤b的g(xi)都是估计值
这说明最大似然估计量不一定唯一,也有可能不存在
- 性质
- 若θ^是θ的极大似然估计量,则g(θ^)也是g(θ)的极大似然估计量
- 根据θ^与Xi的关系确定Fθ^(θ),fθ^(θ)
其它
伽马函数
∫0+∞xαe−xdx=Γ(α+1)=α!(21)!=2π,(−21)!=π
卷积公式
- 求Z=g(X,Y)的分布
- 用Z,X表示Y,即Y=h(Z,X)
- 则∬Df(x,y)dxdy=∬D′f(x,h)∣∣∂z∂h∣∣dxdz
- 故(X,Z)的概率密度为f(x,h)∣∣∂z∂h∣∣
- 故fZ(z)=∫−∞+∞f(x,h)∣∣∂z∂h∣∣dx
- 同理也可以用Z,Y表示X
- 确定积分域
- 积分域是使得f(x,h)不为零的范围,因此x位于fX(x)的定义域且h位于fY(y)的定义域
- x位于fX(x)定义域得与z无关的固定区间,h位于fY(y)的定义域与z有关的动态区间,积分域就是这两区间的交集
- 具体方法:在z,x为横纵坐标的坐标系中根据条件画出有效域,往z轴投影就是z的范围,从下往上穿线就是x的积分域
- 常见组合
- Z=aX+bY:fZ(z)=∫−∞+∞f(x,b1z−bax)∣∣b1∣∣dx=∫−∞+∞f(a1z−aby,y)∣∣a1∣∣dy
关于min,max
- Z=min(X,Y)
- FZ(z)=P{min(X,Y)≤z}=1−P{X>z,Y>z}
- Z=21(X+Y−∣X−Y∣)
- Z=max(X,Y)
- FZ(z)=P{max(X,Y)≤z}=P{X≤z,Y≤z}
- Z=21(X+Y+∣X−Y∣)
- P{max(X1,X2)≤X3}
- 先确定Y=max(X1,X2)与X3的概率分布
- 由独立性得到(Y,X3)的联合概率分布
- 在区域Y≤X3内对联合概率分布积分得到结果