概率论

realhuhu 787 0

古典概型

随机事件

事件分类

  1. 不可能与零概率
    • 不可能事件:A=A=\emptyset
    • 零概率事件:P{A}=0\mathrm P\{A\}=0
    • 不可能事件一定是零概率事件,反之不一定
  2. 必然与一概率
    • 必然事件:A=ΩA=\Omega
    • 一概率事件:P{A}=1\mathrm P\{A\}=1
    • 必然事件一定是一概率事件,反之不一定

事件运算

  1. 并:AB=A+BA\cap B=A+B,表示有一个事件发生
  2. 交:AB=ABA\cup B=AB,表示事件同时发生
  3. 逆:A\overline{A},表示事件不发生
  4. 差:AB=ABA-B=A\overline BAA发生且BB不发生的概率

事件关系

  1. 独立
    • 满足P{AB}=P{A}P{B}\mathrm P\{AB\}=\mathrm P\{A\}\mathrm P\{B\}
    • 零概率事件和一概率事件与任何事件独立
    • 如果A,BA,B概率都不为零P{AB}0AB\mathrm P\{AB\}\ne 0\Rightarrow AB\ne \emptyset,即不互斥
    • 证明不独立:先看是否相关,如果不相关,就找两个事件ABAB,证明AB,BΩA\subset B,B\ne \Omega,从而P(AB)=P(A)>P(A)P(B)\mathrm P(AB)=\mathrm P(A)\gt \mathrm P(A)\mathrm P(B) 从而不独立
  2. 互斥互不相容
    • 满足AB=AB=\emptyset
    • 不可能事件与任何事件互斥
    • 如果A,BA,B概率都不为零AB=P{AB}=0P{A}P{B}AB=\emptyset\Rightarrow \mathrm P\{AB\}= 0\ne \mathrm P\{A\}\mathrm P\{B\},即不独立
    • 若还满足A+B=ΩA+B=\Omega则为对立
  3. 包含
    • ABP{A}P{B}A\subset B\Rightarrow \mathrm P\{A\}\le \mathrm P\{B\}AA发生则BB必然发生
    • P{A}=P{AB},P{B}=P{A+B}\mathrm P\{A\}= \mathrm P\{AB\},\mathrm P\{B\}= \mathrm P\{A+B\}

概率公式

概率基本公式

  1. 加法定律
    • P{A+B}=P{A}+P{B}P{AB}\mathrm P\{A+B\}=\mathrm P\{A\}+\mathrm P\{B\}-\mathrm P\{AB\}
    • P{A+B+C}=P{A}+P{B}+P{C}P{AB}P{AC}P{BC}+P{ABC}\mathrm P\{A+B+C\}=\mathrm P\{A\}+\mathrm P\{B\}+\mathrm P\{C\}-\mathrm P\{AB\}-\mathrm P\{AC\}-\mathrm P\{BC\}+\mathrm P\{ABC\}
  2. 减法定律
    • P{AB}=P{AB}=P{A}P{AB}\mathrm P\{A-B\}=\mathrm P\{A\overline{B}\}=\mathrm P\{A\}-\mathrm P\{AB\}
  3. 逆运算
    • P{A}=1P{A}\mathrm P\{\overline{A}\}=1-\mathrm P\{A\}
  4. 分配率
    • P{(A+B)C}=P{AC+BC}\mathrm P\{(A+B)C\}=\mathrm P\{AC+BC\}
    • P{AB+C}=P{(A+C)(B+C)}\mathrm P\{AB+C\}=\mathrm P\{(A+C)(B+C)\}
  5. 对偶律
    • P{AB}=P{A+B}\mathrm P\{\overline{AB}\}=\mathrm P\{\overline{A}+\overline{B}\}
    • P{A+B}=P{AˉBˉ}\mathrm P\{\overline{A+B}\}=\mathrm P\{\bar{A}\bar{B}\}

条件概率公式

  1. 定义
    P{BA}=P{AB}P{A} \mathrm P\{B|A\}=\frac{\mathrm P\{AB\}}{\mathrm P\{A\}}
  2. 性质
    P{BA}=1P{BA}=1P{AB}P{A}P{A1+A2B}=P{A1B}+P{A2B}P{A1A2B} \begin{align} &\mathrm P\{\overline{B}|A\}=1-\mathrm P\{B|A\}=1-\frac{\mathrm P\{AB\}}{\mathrm P\{A\}} \\ &\mathrm P\{A_1+A_2|B\}=\mathrm P\{A_1|B\}+\mathrm P\{A_2|B\}-\mathrm P\{A_1A_2|B\} \end{align}

常用结论

  1. AB=AˉBˉAB=\bar{A}\bar{B},或AB=ABAB=\overline{AB},或A+B=Aˉ+BˉA+B=\bar{A}+\bar{B},或A+B=A+BA+B=\overline{A+B},则A,BA,B对立
  2. P{AB}=P{A+B}\mathrm P\{AB\}=\mathrm P\{A+B\}P{AB}=P{A+B}=P{A}=P{B}\mathrm P\{AB\}=\mathrm P\{A+B\}=\mathrm P\{A\}=\mathrm P\{B\}
  3. 事件互斥说明样本空间没有交集;样本空间相同则事件相同
  4. 相互独立一定两两独立,反之不一定
  5. 相互独立的事件分为两组,每组进行任意运算,得到的两个事件依然独立

一维随机变量

分布

分布函数

  1. 定义
    • 对于任意随机变量XX,记F(x)=P{Xx}F(x)=\mathrm P\{X\le x\}XX分布函数
      xx为下分位数,表示{Xx}\{X\le x\}的发生概率;同理,上分位数yy,表示{X>y}\{X\gt y\}的发生概率
    • F(x)F(x)表示事件{Xx}\{X\le x\}发生的概率
  2. 性质
    • F(x)F(x)单调不减F(x)=F(x+)F(x)=F(x^+),即右连续
    • F(x)[0,1]F(x)\in [0,1]f()=0f(-\infty)=0f(+)=1f(+\infty)=1
    • P{X<x}=F(x)\mathrm P\{X\lt x\}=F(x^-)P{X=x}=F(x)F(x)\mathrm P\{X= x\}=F(x)-F(x^-)

概率分布

  1. 对于离散型随机变量,概率分布指分布律
    • 离散型随机变量XX,用P{X=xi}=pi\mathrm P\{X= x_i\}=p_i表示XX分布律
  2. 对于连续型随机变量,概率分布值概率密度
    • 连续型随机变量XX,用f(x)f(x)表示XX概率密度

复合分布

  1. 离散型随机变量
    • P{X=xi}=pi\mathrm P\{X= x_i\}=p_i,则Y=g(X)Y=g(X)的分布律为P{X=g(xi)}=pi\mathrm P\{X= g(x_i)\}=p_i
  2. 连续型随机变量
    • 定义法:若XX的概率密度函数为fX(x)f_X(x)Y=g(X)Y=g(X),则FY(y)=P{g(X)y}=g(x)yfX(x)dxF_Y(y)=\mathrm P\{g(X)\le y\}=\int_{g(x) \le y} {f_X(x)} \mathrm{d} x,求导得到fY(y)f_Y(y)
    • 公式法:若y=g(x)y=g(x)处处可导且单调,则
      FY(y)=P{Yy}=P{g(X)y}=P{xg1(y)}=F(g1(y))fY(y)={fX(g1(y))(g1(y))yg(x)的值域0其他  \begin{align} &F_Y(y)=\mathrm P\{Y\le y\}=\mathrm P\{g(X)\le y\}=\mathrm P\{x\le g^{-1}(y)\}=F(g^{-1}(y)) \\ &f_Y(y)=\left\{\begin{array}{ll}f_X\left(g^{-1}(y)\right)\left|(g^{-1}(y))^\prime\right| & y\in g(x)\text{的值域}\\0 & \text {其他 }\end{array}\right . \end{align}
      XX的分布函数F(x),x(a,b)F(x),x\in(a,b)为单调增函数,则Y=F(X)Y=F(X)服从U(0,1)\mathrm U(0,1)
  3. 非离散非连续随机变量
    • 画出纵坐标为YY,横坐标为XX的关系图
    • y=y0y=y_0截取关系图,位于直线下方的点的横坐标范围就是XX的范围,积分结果就是P{Y<y0}\mathrm P\{Y\lt y_0\}

离散型

概念

  1. 定义
    • 如果随机变量XX只能取有限值无穷可列个值xix_i,则XX离散型随机变量
  2. 性质
    • pi0,pi=1p_i\ge 0,\sum p_i=1
    • F(x)=xi<xpiF(x)=\sum_{x_i\lt x} p_i
    • F(x)F(x)pip_i处右连续,在其它点处处连续
    • E(X)=pixi\mathrm E(X)=\sum p_ix_i
    • E(g(X))=pig(xi)\mathrm E(g(X))=\sum p_ig(x_i)
    • D(X)=E[XE(X)]2=pi(xiμ)2=pixi2(pixi)2\mathrm D(X)=\mathrm E\left[X-\mathrm E(X)\right]^2=\sum p_i(x_i-\mu)^2=\sum p_ix_i^2-(\sum p_ix_i)^2

0-1分布

  1. 定义
    • P{X=k}=pk(1p)1k(k=0,1)\mathrm P\{X=k\}=p^k(1-p)^{1-k}\quad (k=0,1),则XX服从参数为pp的0-1分布/两点分布
    • E(X)=p\mathrm E(X)=p
    • D(X)=p(1p)\mathrm D(X)=p(1-p)

二项分布

  1. 定义
    • P{X=k}=Cnkpk(1p)nk(k=0,1,n)\mathrm P\{X=k\}=\mathrm C_n^k p^k(1-p)^{n-k}\quad (k=0,1,\cdots n),则XX服从参数为n,pn,p的二项分布
    • 记为XB(n,p)X\sim \mathrm B(n,p)
  2. 性质
    • XB(n,p)nXB(n,1p)X \sim \mathrm B(n,p)\Leftrightarrow n-X\sim B(n,1-p)
    • XB(n,p),YB(m,p)X \sim \mathrm B(n,p),Y \sim \mathrm B(m,p)X,YX,Y独立,则X+YB(n+m,p)X+Y \sim \mathrm B(n+m,p)
    • 最大概率项(用概率比值法):{(n+1)p if (n+1)p不是整数(n+1)p(n+1)p1 if (n+1)p是整数\begin{cases} \left \lfloor (n+1)p \right \rfloor & \text{ if } (n+1)p\text{不是整数}\\ (n+1)p\text{或}(n+1)p-1 & \text{ if }(n+1)p\text{是整数} \end{cases}
    • E(X)=np\mathrm E(X)=np
    • D(X)=np(1p)\mathrm D(X)=np(1-p)

几何分布

  1. 定义
    • P{X=n}=p(1p)n1(k=0,1,)\mathrm P\{X=n\}=p(1-p)^{n-1}\quad (k=0,1,\cdots),则XX服从参数为pp的几何分布
  2. 性质
    • 无记忆性:P{X=m+nX>m}=P{X=n}, P{X>m+nX>m}=P{X>n}\mathrm P\{X=m+n|X\gt m\}=\mathrm P\{X=n\},\ \mathrm P\{X\gt m+n|X\gt m\}=\mathrm P\{X\gt n\}
    • E(X)=1p\mathrm E(X)=\frac{1}{p}
    • D(X)=1pp2\mathrm D(X)=\frac{1-p}{p^2}

超几何分布

  1. 定义
    • P{X=k}=CN1kCN2nkCN1+N2n(k=0,1,,min(n,N1))\mathrm P\{X=k\}=\frac{\mathrm C_{N_1}^k\mathrm C_{N_2}^{n-k}}{\mathrm C_{N_1+N_2}^n}\quad (k=0,1,\cdots,\min(n,N_1)),则XX服从超几何分布
    • N1N_1个白球和N2N_2个黑球中一次性拿nn个球,抽到kk个白球的概率为P{X=k}\mathrm P\{X=k\}
    • E(X)=nN1N1+N2\mathrm E(X)=\frac{nN_1}{N_1+N_2}
    • D(X)=nN1N2(N1+N2n)(N1+N2)2(N1+N21)\mathrm D(X)=\frac{nN_1N_2(N_1+N_2-n)}{(N_1+N_2)^2(N_1+N_2-1)}

泊松分布

  1. 定义
    • P{X=k}=λkk!eλ(k=0,1,)\mathrm P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda}\quad (k=0,1,\cdots),则XX服从参数为λ\lambda泊松分布
    • 记为XP(λ)X\sim \mathrm P(\lambda)
  2. 性质
    • XP(λ1),YP(λ2)X \sim \mathrm P(\lambda_1),Y \sim \mathrm P(\lambda_2)X,YX,Y独立,则X+YP(λ1+λ2)X+Y \sim \mathrm P(\lambda_1+\lambda_2)
    • XB(n,p)X\sim \mathrm B(n,p),当nn充分大、pp充分小、npnp适中时,B(n,p)P(np)\mathrm B(n,p)\approx \mathrm P(np)
    • E(X)=λ\mathrm E(X)=\lambda
    • D(X)=λ\mathrm D(X)=\lambda

连续型

概念

  1. 定义
    • 若随机变量XX的分布函数F(x)F(x)连续,且存在非负可积函数f(x)f(x),满足
      F(x)=P{Xx}=xf(t)dt F(x)=\mathrm P\{X\le x\}=\int_{-\infty}^xf(t)\mathrm d t
      XX连续型随机变量
  2. 性质
    • f(x)0,+f(t)dt=1f(x)\ge0,\int_{-\infty}^{+\infty}f(t) \mathrm d t=1
    • P{x1<Xx2}=P{x1Xx2}=P{x1X<x2}=P{x1<X<x2}=x1x2f(t)dt\mathrm P\{x_1\lt X\le x_2\}=\mathrm P\{x_1\le X\le x_2\}=\mathrm P\{x_1\le X\lt x_2\}=\mathrm P\{x_1\lt X\lt x_2\}=\int_{x_1}^{x_2}f(t) \mathrm d t
    • f(x)f(x)xx连续,则F(x)=f(x)F^\prime(x)=f(x)
    • E(X)=+xf(x)dx\mathrm E(X)=\int_{-\infty}^{+\infty}xf(x)\mathrm d x
    • E(g(X))=+g(x)f(x)dx\mathrm E(g(X))=\int_{-\infty}^{+\infty}g(x)f(x)\mathrm d x
    • D(X)=E[XE(X)]2=+(xμ)2f(x)dx=+x2f(x)dx(+xf(x)dx)2\mathrm D(X)=\mathrm E\left[X-\mathrm E(X)\right]^2=\int_{-\infty}^{+\infty}(x-\mu)^2f(x)\mathrm d x=\int_{-\infty}^{+\infty}x^2f(x)\mathrm d x-(\int_{-\infty}^{+\infty}xf(x)\mathrm d x)^2

均匀分布

  1. 定义
    f(x)={1baa<x<b0其他F(x)={0x<axabaax<b1xb {f(x)}=\left\{\begin{array}{ll}\frac{1}{b-a} & a\lt x\lt b \\0 & \text {其他}\end{array}\right.\quad {F(x)}=\left\{\begin{array}{ll}0 & x\lt a \\ \frac{x-a}{b-a} & a \leqslant x\lt b \\1 & x \geqslant b \end{array}\right.

    • 记为XU(a,b)X \sim \mathrm U(a, b)
    • E(X)=a+b2\mathrm E(X)=\frac{a+b}{2}
    • D(X)=(ba)212\mathrm D(X)=\frac{(b-a)^2}{12}

指数分布

  1. 定义
    f(x)={λeλxx>00x0F(x)={1eλxx>00x0 {f(x)}=\left\{\begin{array}{ll}\lambda \mathrm{e}^{-\lambda x} & x>0 \\0 & x \leqslant0\end{array}\right.\quad {F(x)}=\left\{\begin{array}{ll}1-\mathrm{e}^{-\lambda x} & x>0 \\0 & x \leqslant0\end{array}\right.

    • 记为XE(λ)X \sim \mathrm E(\lambda)
  2. 性质
    • P{X>x}=eλx\mathrm{P}\{X\gt x\}=\mathrm{e}^{-\lambda x}
    • 无记忆性:P{X>s+tX>s}=P{X>t}\mathrm{P}\{X\gt s+t|X\gt s\}=\mathrm{P}\{X\gt t\}
    • E(X)=1λ\mathrm E(X)=\frac{1}{\lambda}
    • D(X)=1λ2\mathrm D(X)=\frac{1}{\lambda^2}

正态分布

  1. 定义
    f(x)=12πσe(xμ)22σ2F(x)=12πσxe(tμ)22σ2 dt {f(x)}=\frac{1}{\sqrt{2\pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^2}{2\sigma^2}}\quad{F(x)}=\frac{1}{\sqrt{2\pi} \sigma} \int_{-\infty}^x \mathrm{e}^{-\frac{(t-\mu)^2}{2\sigma^2}} \mathrm{~d} t

    • 记为XN(μ,σ2)X \sim \mathrm N(\mu,\sigma^2)
    • 定义Φ(xμσ)=F(x)=P{Xx}\Phi\left(\frac{x-\mu}{\sigma}\right) = {F(x)}=\mathrm{P}\{X \leqslant x\}Φ(x)\Phi(x)为标准正态分布的分布函数
    • 定义1σϕ(xμσ)=F(x)=f(x)\frac{1}{\sigma}\phi\left(\frac{x-\mu}{\sigma}\right) ={F^\prime(x)}= {f(x)}ϕ(x)\phi(x)为标准正态分布的概率密度([Φ(g(x))]=g(x)ϕ(g(x))[\Phi(g(x))]^\prime=g(x)^\prime\phi(g(x))
  2. 性质
    • 最大值f(μ)=12πσf(\mu)=\frac{1}{\sqrt{2\pi}\sigma},驻点μ\mu,拐点μ+σ\mu+\sigma
    • N(μX,σX2)±N(μY,σY2)=N(μX±μY,σX2+σY2)\mathrm N(\mu_X,\sigma_X^2)\pm\mathrm N(\mu_Y,\sigma_Y^2)=\mathrm N(\mu_X\pm\mu_Y,\sigma_X^2+\sigma_Y^2),前提是独立
    • a+bN(μ,σ2)=N(a+bμ,b2σ2)a+b\mathrm N(\mu,\sigma^2)=\mathrm N(a+b\mu,b^2\sigma^2)
    • Φ(x)=1Φ(x),ϕ(x)=ϕ(x)\Phi(-x)=1-\Phi(x),\phi(-x)=\phi(x)
    • 0+x2ϕ(x)dx=12,0+xϕ(x)dx=12π,0+ϕ(x)dx=12\int_{0}^{+\infty}x^2\phi(x)dx=\frac{1}{2},\int_{0}^{+\infty}x\phi(x)dx=\frac{1}{\sqrt{2\pi}},\int_{0}^{+\infty}\phi(x)dx=\frac{1}{2}
    • E(X)=μ\mathrm E(X)=\mu
    • D(X)=σ2\mathrm D(X)=\sigma^2
    • νk=E[XE(X)]k={(k1)!!σk if  k为偶数0 if  k为奇数\nu_k=\mathrm E\left[X-\mathrm E(X)\right]^k=\begin{cases} (k-1)!!\sigma^k & \text{ if }\ \text{k为偶数} \\ 0 & \text{ if }\ \text{k为奇数} \end{cases}
    • μk=E(Xk)=E[XE(X)+E(X)]k\mu_k=\mathrm E\left(X^k\right)=\mathrm E\left[X-\mathrm E(X)+\mathrm E(X)\right]^k,利用νk\nu_k的展开式递推

卡方分布

  1. 定义
    • X1,,XnX_1,\cdots,X_n独立且均服从标准正态分布N\mathcal{N},则
      χ2(n)=Xi2 \chi^2(n)=\sum X_i^2
      为自由度为nn的卡方分布
    • P{χ2(n)>χα2(n)}=α\mathrm P\{\chi^2(n)\gt\chi^2_\alpha(n)\}=\alpha,记χα2(n)\chi^2_\alpha(n)χ2(n)\chi^2(n)α\alpha位分位点
  2. 性质
    • N2χ2(1)\mathcal{N}^2\sim\chi^2(1)
    • χ2(n1),χ2(n2)\chi^2(n_1),\chi^2(n_2)独立,χ2(n1)+χ2(n2)=χ2(n1+n2)\chi^2(n_1)+\chi^2(n_2)=\chi^2(n_1+n_2)
    • E[χ2(n)]=n\mathrm E\left[\chi^2(n)\right]=n
    • D[χ2(n)]=2n\mathrm D\left[\chi^2(n)\right]=2n

t分布

  1. 定义
    • N,χ2(n)\mathcal N,\chi^2(n)独立,则
      τ(n)=Nχ2(n)/n \tau(n)=\frac{\mathcal N}{\sqrt{\chi^2(n)/n}}
    • P{τ(n)>τα(n)}=α\mathrm P\{\tau(n)\gt\tau_\alpha(n)\}=\alpha,记τα(n)\tau_\alpha(n)τ\tauα\alpha位分位点
  2. 性质
    • τ1α(n)=τα(n)\tau_{1-\alpha}(n)=-\tau_\alpha(n)
    • τ(n)nLN\tau(n)\xrightarrow[n]{L} \mathcal N
    • τ2(n)F(1,n)\tau^2(n)\sim \mathcal F(1,n)
    • E[τ(n)]=0\mathrm E\left[\tau(n)\right]=0
    • D[τ(n)]=nn2\mathrm D\left[\tau(n)\right]=\frac{n}{n-2}

F分布

  1. 定义
    • χ2(m),χ2(n)\chi^2(m),\chi^2(n)独立,则
      F(m,n)=χ2(m)/mχ2(n)/n \mathcal F(m,n)=\frac{\chi^2(m)/m}{\chi^2(n)/n}
    • P{F(m,n)>Fα(m,n)}=α\mathrm P\{\mathcal F(m,n)\gt\mathcal F_\alpha(m,n)\}=\alpha,记Fα(m,n)\mathcal F_\alpha(m,n)F(m,n)\mathcal F(m,n)α\alpha位分位点
  2. 性质
    • 1F(m,n)F(n,m)\frac{1}{\mathcal F(m,n)}\sim\mathcal F(n,m)
    • F1α(m,n)=1Fα(n,m)\mathcal F_{1-\alpha}(m,n)=\frac{1}{\mathcal F_{\alpha}(n,m)}
    • E[F(m,n)]=nn2\mathrm E\left[\mathcal F(m,n)\right]=\frac{n}{n-2}
    • D[F(m,n)]=2n2(m+n2)m(n2)2(n4)\mathrm D\left[\mathcal F(m,n)\right]=\frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}

二维随机变量

分布

联合分布

  1. 定义
    • 对于二维随机变量(X,Y)(X,Y),对于任意实数x,yx,y,称二元函数F(x,y)=P{Xx,Yy}F(x,y)=\mathrm{P}\{X \le x, Y \le y\}XXYY联合分布函数,或(X,Y)(X,Y)概率分布
    • F(x,y)F(x,y)表示{Xx}\{X \le x\}{Yy}\{Y \le y\}同时发生的概率
  2. 性质
    • F(,)=F(,y)=F(x,)=0F(-\infty,-\infty)=F(-\infty,y)=F(x,-\infty)=0F(+,+)=1F(+\infty,+\infty)=1
    • F(x,y)=F(x+,y)F(x+δx,y)F(x,y)=F(x^+,y)\le F(x+\delta x,y) F(x,y)=F(x,y+)F(x,y+δy)F(x,y)=F(x,y^+)\le F(x,y+\delta y),即对于xxyy右连续且单调不减
    • G={(x,y)x1<Xx2,y1Yy2}G=\left\{(x, y) \mid x_1 \lt X \le x_2, y_1\le Y \le y_2\right\}P{(X,Y)G}=F(x2,y2)F(x2,y1)+F(x1,y1)F(x1,y2)0\mathrm{P}\{(X, Y) \in G\}=F\left(x_2, y_2\right)-F\left(x_2, y_1\right)+F\left(x_1, y_1\right)-F\left(x_1, y_2\right)\ge0
    • FaX,bY(x,y)=FX,Y(xa,yb)F_{aX,bY}(x,y)=F_{X,Y}(\frac{x}{a},\frac{y}{b})F(ax,by)abf(ax,by)F(ax,by)\rightarrow abf(ax,by)
  3. 对于复杂联合分布,通过事件运算化简
    P{max(X,Y)z1,min(X,Y)z2}=P{max(X,Y)z1,min(X,Y)>z2}=P{max(X,Y)z1}P{max(X,Y)z1,min(X,Y)>z2}=P{Xz1,Yz1}P{z2<Xz1,z2<Yz1} \begin{align} &\mathrm{P}\{\max(X,Y)\le z_1,\min(X,Y)\le z_2\} \\ =&\mathrm{P}\{\max(X,Y)\le z_1,\overline{\min(X,Y)\gt z_2}\} \\ =&\mathrm{P}\{\max(X,Y)\le z_1\}-\mathrm{P}\{\max(X,Y)\le z_1,\min(X,Y)\gt z_2\} \\ =&\mathrm{P}\{X\le z_1,Y\le z_1\}-\mathrm{P}\{z_2\lt X\le z_1,z_2\lt Y\le z_1\} \end{align}

边缘分布

  1. 定义
    • FX(x)=P{Xx}=P{Xx,Y<+}=F(x,+)F_X(x)=\mathrm{P}\{X \le x\}=\mathrm{P}\{X \le x, Y\lt +\infty\}={F(x,+\infty)}为关于XX边缘分布函数
    • FY(y)=P{Yy}=P{X<+,Yy}=F(+,y)F_Y(y)=\mathrm{P}\{Y \le y\}=\mathrm{P}\{X \lt +\infty, Y\le y\}={F(+\infty,y)}为关于YY边缘分布函数
    • fX(x)=P{X=x}=P{X=x,Y<+}=f(x,+)f_X(x)=\mathrm{P}\{X = x\}=\mathrm{P}\{X = x, Y\lt +\infty\}={f(x,+\infty)}为关于XX边缘密度函数
    • fY(y)=P{Y=y}=P{X<+,Y=y}=f(+,y)f_Y(y)=\mathrm{P}\{Y = y\}=\mathrm{P}\{X \lt +\infty, Y= y\}={f(+\infty,y)}为关于YY边缘密度函数
  2. 性质
    • (X,Y)(X,Y)的分布函数可以确定XXYY的边缘分布函数
    • XXYY的边缘分布函数可以确定(X,Y)(X,Y)的分布函数的前提是XXYY相互独立

条件分布

  1. 定义
    • 变量分布与另一个变量取值有关,如XX服从0-2均匀分布,YY服从0-X均匀分布
    • 条件分布函数
      FXY(xy)=P{XxY=y}FYX(yx)=P{YyX=x} F_{X \mid Y}(x \mid y)=\mathrm P\{X\le x\mid Y= y\}\quad\quad F_{Y \mid X}(y \mid x)=\mathrm P\{Y\le y\mid X= x\}
    • 条件密度函数
      fXY(xy)=P{X=xY=y}fYX(yx)=P{Y=yX=x} f_{X \mid Y}(x \mid y)=\mathrm P\{X= x\mid Y= y\}\quad\quad f_{Y \mid X}(y \mid x)=\mathrm P\{Y= y\mid X= x\}
  2. 性质
    • 密度乘法公式f(x,y)=fX(x)fYX(yx)=fY(y)fXY(xy)(fX(x)>0,fY(y)>0)f(x,y)=f_X(x) f_{Y \mid X}(y \mid x)=f_Y(y) f_{X \mid Y}(x \mid y) \quad\quad\left(f_X(x)>0,f_Y(y)>0\right)

独立分布

  1. 判断
    • 对于二维离散型随机变量:对任意xi,yjx_i,y_j,都有P{X=xi,Y=yj}=P{X=xi}P{Y=yj}\mathrm{P}\left\{X=x_i, Y=y_j\right\}=\mathrm{P}\left\{X=x_i\right\} \mathrm{P}\left\{Y=y_j\right\},即pij=pipjp_{i j}=p_{i \cdot} p_{\cdot j}
    • 对于二维连续型随机变量:对f(x,y)f(x,y)上任意连续点,都有f(x,y)=fX(x)fY(y){f(x, y)}=f_X(x) f_Y(y)F(x,y)=FX(x)FY(y){F(x, y)}=F_X(x) F_Y(y)
    • 对于二维混合型随机变量:对任意xi,yjx_i,y_j,都有P{X=xi,Yyj}=P{X=xi}P{Yyj}\mathrm{P}\left\{X=x_i, Y\le y_j\right\}=\mathrm{P}\left\{X=x_i\right\}\mathrm{P}\left\{Y\le y_j\right\}
  2. 性质
    • 定义域为矩形才有可能独立
    • 二维离散型随机变量独立,则联合分布律的行列成比例
    • 两个随机变量独立,则条件分布等于其边缘分布
    • 几个相互独立的变量,它们各自的任意复合分布也相互独立

复合分布

  1. Z=g(X,Y)Z=g(X,Y)的分布
    • 确定(X,Y)(X,Y)的定义域
    • 判断FZ(z)=P{Zz}=P{g(X,Y)z}F_Z(z)=\mathrm P\{Z\le z\}=\mathrm P\{g(X,Y)\le z\}恒成立、恒不成立时zz的取值范围,得到FZ(z)F_Z(z)的一部分
    • 绘制g(X,Y)=zg(X,Y)=z的图像,确定(X,Y)(X,Y)的定义域中落在g(X,Y)zg(X,Y)\le z的部分,对该区域积分得到FZ(z)F_Z(z)的其余部分
    • FZ(z)F_Z(z)求导得到fZ(z)f_Z(z)
  2. 性质
    • E(Z)=g(x,y)f(x,y)dxdy\mathrm E(Z)=\iint g(x,y)f(x,y)dxdy
    • XiX_i独立同分布,计算Xi\sum X_i时,多次使用卷积公式

离散型

  1. 定义
    • 对于离散型随机变量XXYY,则(X,Y)(X,Y)二维离散型随机变量
    • 联合分布律P{X=xi,Y=yj}=pij\mathrm{P}\left\{X=x_i, Y=y_j\right\}=p_{i j}
  2. 边缘分布
    pi=FX(xi)=jP{X=xi,Y=yj}=jpijpj=FY(yj)=iP{X=xi,Y=yi}=ipij \begin{align} &p_{i \cdot}=F_X(x_i)=\sum_j\mathrm{P}\left\{X=x_i, Y=y_j \right\}=\sum_j p_{ij} \\ &p_{\cdot j}=F_Y(y_j)=\sum_i\mathrm{P}\left\{X=x_i, Y=y_i \right\}=\sum_i p_{ij} \end{align}
  3. 条件分布
    P{X=xiY=yj}=P{X=xi,Y=yj}P{Y=yj}=pijpjP{Y=yjX=xi}=P{X=xi,Y=yj}P{X=xi}=pijpi \begin{align} &\mathrm{P}\left\{X=x_i \mid Y=y_j\right\}=\frac{\mathrm{P}\left\{X=x_i, Y=y_j\right\}}{\mathrm{P}\left\{Y=y_j\right\}}=\frac{p_{i j}}{p_{\cdot j}} \\ &\mathrm{P}\left\{Y=y_j \mid X=x_i\right\}=\frac{\mathrm{P}\left\{X=x_i, Y=y_j\right\}}{\mathrm{P}\left\{X=x_i\right\}}=\frac{p_{i j}}{p_{i \cdot}} \end{align}

连续型

概念

  1. 定义
    • 设二维随机变量(X,Y)(X, Y)的分布函数为F(x,y){F(x, y)},如果存在非负的可积函数f(x,y){f(x, y)}使对于任意x,yx, y,有
      F(x,y)=xyf(u,v)du dv {F(x, y)}=\int_{-\infty}^x \int_{-\infty}^y {f(u, v)} \mathrm{d} u \mathrm{~d} v
    • 则称(X,Y)(X, Y)二维连续型随机变量f(x,y)f(x,y)联合概率密度
    • f(x,y){f(x, y)}在点(x,y)(x, y)处连续,则有2xyF(x,y)=f(x,y)\frac{\partial^2}{\partial x \partial y}F(x, y)={f(x, y)}
    • P{g(X,Y)>0}={(x,y)g(x,y)>0}f(x,y)dxdy\mathrm{P}\{g(X, Y) \gt0\}=\iint_{\left\{(x, y) \mid g(x,y)\gt0\right\}} {f(x, y)} \mathrm{d} x \mathrm{d} y
  2. 边缘分布
    FX(x)=F(x,+)=x[+f(x,y)dy]dxfX(x)=+f(x,y)dyFY(y)=F(+,y)=y[+f(x,y)dx]dyfY(y)=+f(x,y)dx \begin{align} &F_X(x)={F(x,+\infty)}=\int_{-\infty}^x\left[\int_{-\infty}^{+\infty} {f(x, y)} \mathrm{d} y\right] \mathrm{d} x\quad &f_X(x)=\int_{-\infty}^{+\infty} {f(x, y)} \mathrm{d} y \\ &F_Y(y)={F(+\infty,y)}=\int_{-\infty}^y\left[\int_{-\infty}^{+\infty} {f(x, y)} \mathrm{d} x\right] \mathrm{d} y\quad &f_Y(y)=\int_{-\infty}^{+\infty} {f(x, y)} \mathrm{d} x \end{align}

    • P{g(X)>0}={xg(x)>0}f(x,y)dxdy={xg(x)>0}fX(x)dx\mathrm{P}\{g(X) \gt0\}=\iint_{\left\{x \mid g(x)\gt0\right\}} {f(x, y)} \mathrm{d} x \mathrm{d} y=\int_{\left\{x \mid g(x)\gt0\right\}} f_X(x) \mathrm{d} x
  3. 条件分布
    FXY(xy)=xf(t,y)fY(y)dtfXY(xy)=f(x,y)fY(y)FYX(yx)=yf(x,t)fX(x)dtfYX(yx)=f(x,y)fX(x) \begin{align} &F_{X \mid Y}(x \mid y)=\int_{-\infty}^x \frac{{f(t, y)}}{f_Y(y)} \mathrm{d} t\quad&f_{X \mid Y}(x \mid y)=\frac{{f(x, y)}}{f_Y(y)} \\ &F_{Y \mid X}(y \mid x)=\int_{-\infty}^y \frac{{f(x, t)}}{f_X(x)} \mathrm{d} t\quad&f_{Y \mid X}(y \mid x)=\frac{{f(x, y)}}{f_X(x)} \end{align}

    • 直线与概率密度定义域的交集就是条件密度的定义域
    • 注意排除边缘概率等于0的点
  4. 求非独立时的联合分布函数
    • 已知(X,Y)(X,Y)的联合概率密度f(x,y)f(x,y),求(g(X),h(Y))(g(X),h(Y))的联合概率密度
      根据F(g(X),h(Y))(x,y)=P{g(X)x,h(Y)y}F_{(g(X),h(Y))}(x,y)=\mathrm P\{g(X)\le x,h(Y)\le y\},确定X,YX,Y的取值范围DX,DYD_X,D_Y,从而F(g(X),h(Y))(x,y)=DXdxDyf(x,y)dyF_{(g(X),h(Y))}(x,y)=\int_{D_X}dx\int_{Dy}f(x,y)dy
    • 已知独立变量X,YX,Y的概率密度f(x,y)f(x,y),求(g(X,Y),h(X,Y))(g(X,Y),h(X,Y))的联合概率密度
      F((g(X,Y),h(X,Y)))(x,y)=P{g(X,Y)x,h(X,Y)y}=P{(g(X,Y)x)(h(X,Y)y)}F_{((g(X,Y),h(X,Y)))}(x,y)=\mathrm P\{g(X,Y)\le x,h(X,Y)\le y\}=\mathrm P\{(g(X,Y)\le x)(h(X,Y)\le y)\},用概率公式化简,最终带入FX(x),FY(y)F_X(x),F_Y(y),从而f(g(X,Y),h(X,Y))(x,y)=2xyF(g(X,Y),h(X,Y))(x,y)f_{(g(X,Y),h(X,Y))}(x,y)=\frac{\partial^2}{\partial x \partial y}F_{(g(X,Y),h(X,Y))}(x,y)
    • 注意确定定义域分段时,不仅要单独看x,yx,y,还要考虑它们的相互关系

二维正态分布

  1. 定义
    f(x,y)N(μ1,μ2,σ12,σ22,ρ)=12πσ1σ21ρ2e12(1ρ2)[(xμ1)2σ12+(yμ2)2σ222ρ(xμ1)(yμ2)σ1σ2] f(x,y)\sim\mathrm N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma^2_1}+\frac{(y-\mu_2)^2}{\sigma^2_2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}\right]}
  2. 性质
    • 独立性:X,YX,Y相互独立ρ=0\Leftrightarrow \rho=0
    • abcd0\begin{vmatrix} a & b\\ c &d\end{vmatrix}\ne 0,则(aX+bY,cX+dY)(aX+bY,cX+dY)也服从二维正态分布

混合型

  1. 定义
    • XX为离散型随机变量,YY为混合型随机变量,则(X,Y)(X,Y)二维混合型随机变量
    • 联合分布函数
      F(x,y)=xiXP{X=xi}E({yiyiY,yiy}X=xi) F(x,y)=\sum_{x_i\in X}\mathrm P\{X=x_i\} \mathrm E(\{y_i|y_i\in Y,y_i\le y\}|X=x_i)
    • 复合分布函数Z=g(X,Y)Z=g(X,Y)
      FZ(z)=P{g(X,Y)z}=xiXP{X=xi}P{g(xi,Y)z} F_Z(z)=\mathrm P\{g(X,Y)\le z\}=\sum_{x_i\in X}P\{X=x_i\}P\{g(x_i,Y)\le z\}
  2. 联合分布
    • 求每一个部分的分布和定义域,合成得到总的分布和定义域

数字特征

期望和方差

  1. 期望的性质
    • CC是常数,则有E(C)=C\mathrm{E}(C)=C
    • XX是随机变量, CC是常数,则有E(CX)=CE(X)\mathrm{E}(C X)=C \mathrm{E}(X)
    • XXYY是两个任意随机变量,则有E(X±Y)=E(X)±E(Y)\mathrm{E}(X \pm Y)=\mathrm{E}(X) \pm \mathrm{E}(Y)
    • XXYY是两个独立随机变量,则有E(XY)=E(X)E(Y)\mathrm{E}(X Y)=\mathrm{E}(X) \mathrm{E}(Y)
  2. 方差的性质
    • D(X)=E{[XE(X)]2}=E(X2)E2(X)\mathrm{D}(X)=\mathrm{E}\left\{[X-\mathrm{E}(X)]^2\right\}=\mathrm{E}\left(X^2\right)-\mathrm{E}^2(X)
    • CC是常数,则D(C)=0\mathrm{D}(C)=0;反过来不成立,只能得到P{X=E(X)}=1\mathrm{P}\{X=\mathrm{E}(X)\}=1
    • XX是随机变量, CC是常数,则有D(X+C)=D(X),D(CX)=C2D(X)\mathrm{D}(X+C)=\mathrm{D}(X),\mathrm{D}(C X)=C^2\mathrm{D}(X)
    • 设随机变量XXYY相互独立,则有D(X±Y)=D(X)+D(Y)\mathrm{D}(X \pm Y)=\mathrm{D}(X)+\mathrm{D}(Y)

协方差和相关系数

  1. 协方差的性质
    • Cov(X,Y)=E{[XE(X)][YE(Y)]}=E(XY)E(X)E(Y)\mathrm{Cov}(X, Y)=\mathrm{E}\{[X-\mathrm{E} (X)][Y-\mathrm{E} (Y)]\}=\mathrm{E}(X Y)-\mathrm{E}(X) \mathrm{E}(Y)
    • D(X±Y)=D(X)+D(Y)±2Cov(X,Y)\mathrm{D}(X \pm Y)=\mathrm{D} (X)+\mathrm{D} (Y) \pm2\mathrm{Cov}(X, Y)
    • Cov(X,Y)=Cov(Y,X)\mathrm{Cov}(X, Y)=\mathrm{Cov}(Y, X)
    • Cov(X,X)=D(X)\mathrm{Cov}(X, X)=\mathrm{D}(X)
    • Cov(aX,bY)=abCov(X,Y)\mathrm{Cov}(a X, b Y)=a b \mathrm{Cov}(X, Y)
    • Cov(A+B,CD)=Cov(A,C)Cov(A,D)+Cov(B,C)Cov(B,D)\mathrm{Cov}(A+B, C-D)=\mathrm{Cov}(A,C)-\mathrm{Cov}(A,D)+\mathrm{Cov}(B,C)-\mathrm{Cov}(B,D)
  2. 相关系数的性质
    • ρXY=Cov(X,Y)D(X)D(Y)\rho_{X Y}=\frac{\mathrm{Cov}(X, Y)}{\sqrt{\mathrm{D} (X)} \sqrt{\mathrm{D} (Y)}}
    • ρXY1\left|\rho_{X Y}\right| \leqslant1,取等的充要条件是存在常数a,ba,b,使得P{Y=aX+b}=1\mathrm{P}\{Y=a X+b\}=1a>0a\gt 0ρ=1\rho=1,a<0a\lt 0ρ=1\rho=-1
    • ρXY=0  X\rho_{X Y}=0\ \Leftrightarrow\ XYY不相关  E(XY)=E(X)E(Y)  D(X±Y)=D(X)+D(Y)\ \Leftrightarrow\ \mathrm E(XY)=\mathrm E(X)\mathrm E(Y)\ \Leftrightarrow\ \mathrm D(X\pm Y)=\mathrm D(X)+\mathrm D(Y)
    • 独立一定不相关,不相关不一定独立
    • 对于二维正态分布和二维0-1分布,独立等于不相关

随机变量的矩

  1. 零点矩μk\mu_k
    μk=E(Xk) \mu_k=\mathrm E\left(X^k\right)
  2. 中心矩νk\nu_k
    νk=E[XE(X)]k \nu_k=\mathrm E\left[X-\mathrm E(X)\right]^k

数理统计

随机变量序列

切比雪夫不等式

  1. 定义
    P{XE(X)ε}D(X)ε2P{XE(X)<ε}1D(X)ε2 \begin{align} &\mathrm P\{|X-\mathrm E(X)|\ge \varepsilon\}\le \frac{\mathrm D(X)}{ \varepsilon^2} \\ &\mathrm P\{|X-\mathrm E(X)|\lt \varepsilon\}\ge 1- \frac{\mathrm D(X)}{ \varepsilon^2} \end{align}
  2. 作用
    • 估计XX落在(EXε,EX+ε)(EX-\varepsilon,EX+\varepsilon)的概率

依概率收敛

  1. 定义
    • 对于随机变量序列Y1,,YnY_1,\cdots,Y_n\cdots,若对于常数aa,对于任意正数ε\varepsilon,有
      limnP{Yna<ε}=1 \lim_{n\rightarrow\infty}\mathrm P\{\left|Y_n-a\right|\lt\varepsilon\}=1
      Y1,,YnY_1,\cdots,Y_n\cdots依概率收敛为aa,记作YnPaY_n\overset{P}{\rightarrow}a
    • 表示实验次数越多,XnX_n落在(aε,a+ε)(a-\varepsilon,a+\varepsilon)的概率越趋向于1
  2. 性质
    • XnPx,YnPyX_n\overset{P}{\rightarrow}x,Y_n\overset{P}{\rightarrow}y,若g(x,y)g(x,y)(a,b)(a,b)连续,则
      g(Xn,Yn)Pg(x,y) g(X_n,Y_n)\overset{P}{\rightarrow}g(x,y)

大数定律

  1. 切比雪夫大数定律
    • 随机变量之间独立,随机变量的期望存在、方差存在且有限
    • 样本均值P\overset{P}{\rightarrow}对应的随机变量期望的均值
  2. 伯努利大数定律
    • 对于二项分布XnB(n,p)X_n\sim\mathrm B(n,p)
    • 样本中实验发生概率Pp\overset{P}{\rightarrow}p
  3. 辛钦大数定律
    • 考虑切比雪夫大数定律中,若随机变量同分布
    • XPE(Xi)\overline X \overset{P}{\rightarrow}\mathrm E(X_i)
    • 更进一步,由独立性的性质可得g(X)PE(g(Xi))\overline{g(X)} \overset{P}{\rightarrow}\mathrm E(g(X_i))

中心极限定理

  1. 列维-林德伯格定理
    • 随机变量之间独立同分布,随机变量的期望存在、方差存在且有限
    • 期望为μ\mu,方差为σ2\sigma^2,则XnLN(μ,σ2n)\overline X\xrightarrow[n]{L} \mathrm N(\mu,\frac{\sigma^2}{n})
  2. 棣莫弗-拉普拉斯定理
    • XnB(n,p)X_n\sim\mathrm B(n,p),随着nn增大,XnX_n趋向正态分布
    • XnnLN(np,np(1p))X_n\xrightarrow[n]{L} \mathrm N(np,np(1-p))

统计量

总体与样本

  1. 相互独立且与总体XX同分布的随机变量X1,,XnX_1,\cdots,X_n称为样本
    • nn为样本容量,x1,,xnx_1,\cdots,x_n为样本值,或X1,,XnX_1,\cdots,X_n的观测值,可以来源于XXnn次简单随机抽样
    • 样本的联合分布函数FX1,,Xn(x1,,xn)=FX(xi)F_{X_1,\cdots,X_n}(x_1,\cdots,x_n)=\prod F_X(x_i)
    • 样本的概率密度函数fX1,,Xn(x1,,xn)=fX(xi)f_{X_1,\cdots,X_n}(x_1,\cdots,x_n)=\prod f_X(x_i)
    • 样本的分布律P{X1=x1,,Xn=xn}=P{X=xi}\mathrm P\{X_1=x_1,\cdots,X_n=x_n\}=\prod \mathrm P\{X=x_i\}
  2. 样本的值域为分布的非0区域

统计量的性质

  1. 统计量的概念
    • g(X1,,Xn)g(X_1,\cdots,X_n)X1,,XnX_1,\cdots,X_n的一个统计量,g(x1,,xn)g(x_1,\cdots,x_n)为统计量的一个观测值
    • 统计量也是随机变量
  2. 常用统计量
    • 样本均值X=1nXi\overline X=\frac{1}{n}\sum X_i
    • 样本方差S2=1n1(XiX)2S^2=\frac{1}{n-1}\sum (X_i-\overline X)^2
    • 样本协方差SXY2=(nX1)SX2+(nY1)SY2nX+nY2S^2_{XY}=\frac{(n_X-1)S^2_X+(n_Y-1)S^2_Y}{n_X+n_Y-2}
    • 样本原点矩Ak=1nXikA_k=\frac{1}{n}\sum X_i^k
    • 样本中心矩Bk=1n(XiX)kB_k=\frac{1}{n}\sum (X_i-\overline X)^k
  3. 统计量与实际值
    • E(Xi)=E(X)=μ,D(Xi)=D(X)=σ2\mathrm E\left(X_i\right)=\mathrm E\left(X\right)=\mu,\mathrm D\left(X_i\right)=\mathrm D\left(X\right)=\sigma^2
    • E(X)=μ,D(X)=σ2n\mathrm E\left(\overline X\right)=\mu,\mathrm D\left(\overline X\right)=\frac{\sigma^2}{n}
    • E(S2)=σ2,D(S2)=ν4nn3n(n1)σ4\mathrm E\left(S^2\right)=\sigma^2,\mathrm D\left(S^2\right)=\frac{\nu_4}{n}-\frac{n-3}{n(n-1)} \sigma^4

统计量的分布

  1. XN(μ,σ2)X\sim\mathrm N(\mu,\sigma^2),则
    • X\overline X
      Xμσ/nNXμS/nτ(n1) \frac{\overline X-\mu}{\sigma/\sqrt n}\sim\mathcal N\quad\quad \frac{\overline X-\mu}{S/\sqrt n}\sim\tau(n-1)
    • S2S^2
      (n1)S2σ2χ2(n1) \frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)
    • X\overline XS2S^2相互独立
  2. XN(μX,σX2),YN(μY,σY2)X\sim\mathrm N(\mu_X,\sigma^2_X),Y\sim\mathrm N(\mu_Y,\sigma^2_Y)X,YX,Y独立,则
    • XY\overline X-\overline Y
      (XY)(μXμY)σX2/nX+σY2/nYN若总体同方差 (XY)(μXμY)sXY1/nX+1/nYτ(nX+nY2) \begin{align} &\frac{(\overline X-\overline Y)-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2/n_X+\sigma_Y^2/n_Y}}\sim\mathcal N \\ 若总体同方差\ &\frac{(\overline X-\overline Y)-(\mu_X-\mu_Y)}{s_{XY}\sqrt{1/n_X+1/n_Y}}\sim\tau(n_X+n_Y-2) \end{align}
    • SX2/SY2{S^2_X}/{S^2_Y}
      SX2/SY2σX2/σY2F(nX1,nY1) \frac{{S^2_X}/{S^2_Y}}{\sigma^2_X/\sigma^2_Y}\sim\mathcal F(n_X-1,n_Y-1)
    • 若总体同方差,SXY2S^2_{XY}
      (nX+nY2)SXY2σ2χ2(nX+nY2) \frac{(n_X+n_Y-2)S^2_{XY}}{\sigma^2}\sim\chi^2(n_X+n_Y-2)

参数估计

矩估计法

  1. 计算总体的1k1\sim k阶原点矩
    • 离散型
      μl(θ1,θ2,,θk)=E(Xl)=i=1xilp(xi;θ1,θ2,,θk)l=1,2,,k \mu_l\left(\theta_1, \theta_2, \cdots, \theta_k\right)=\mathrm{E}\left(X^l\right)=\sum_{i=1}^{\infty} x_i{ }^l p\left(x_i ; \theta_1, \theta_2, \cdots, \theta_k\right)\quad l=1,2, \cdots, k
    • 连续型
      μl(θ1,θ2,,θk)=E(Xl)=+xlf(x;θ1,θ2,,θk)dxl=1,2,,k \mu_l\left(\theta_1, \theta_2, \cdots, \theta_k\right)=\mathrm{E}\left(X^l\right)=\int_{-\infty}^{+\infty} x^l f\left(x ; \theta_1, \theta_2, \cdots, \theta_k\right) \mathrm{d} x\quad l=1,2, \cdots, k
  2. 样本矩等于总体矩
    Xil=E(Xl)(l=1,2,,k) \overline{X_i^l}=\mathrm{E}\left(X^l\right) \quad(l=1,2, \cdots, k)

    • 得到关于θ1,θ2,,θk\theta_1, \theta_2, \cdots, \theta_kkk个方程
    • 如果某一个等式中不含θi\theta_i,则需要计算k+1k+1阶原点矩然后令样本矩等于总体矩,重复此步直到得到新的关于θi\theta_i的等式
    • 多个解时,利用E(X)=Xˉ,D(X)=E(X2)E2(X)=S2\mathrm E(X)=\bar X,\mathrm D(X)=\mathrm E(X^2)-\mathrm E^2(X)=S^2求解
  3. 求解
    • 得到θl\theta_l矩估计量θ^l(X1,,Xn)\hat{\theta}_l\left(X_1, \cdots, X_n\right)
    • θ^l(x1,,xn)\hat{\theta}_l\left(x_1, \cdots, x_n\right)矩估计值
  4. 性质
    • θ^\hat{\theta}θ{\theta}的矩估计量,则g(θ^)g(\hat{\theta})不是g(θ)g(\theta)的矩估计量
    • E(X)\mathrm E(X)的矩估计量为Xˉ\bar XD(X)\mathrm D(X)的矩估计量为n1nS2\frac{n-1}{n}S^2
    • 根据θ^\hat\thetaXiX_i的关系确定Fθ^(θ),fθ^(θ)F_{\hat\theta}(\theta),f_{\hat\theta}(\theta)

最大似然估计

  1. 构造似然函数
    • 离散型
      L(θ)=p(xi,θ) L(\theta)=\prod p(x_i,\theta)
    • 连续型
      L(θ)=f(xi,θ) L(\theta)=\prod f(x_i,\theta)
    • 表示样本观测值为x1,,xnx_1,\cdots,x_n的概率
  2. 找到使似然函数最大的θ\theta
    dlnL(θ)dθ=0 \frac{\mathrm{d} \ln L(\theta)}{\mathrm{d} \theta}=0

    • 得到θ\theta极大似然估计值θ^l(x1,,xn)\hat{\theta}_l\left(x_1, \cdots, x_n\right)
    • θ^l(X1,,Xn)\hat{\theta}_l\left(X_1, \cdots, X_n\right)极大似然估计量
    • 若包含多个要估计的量则为
      lnL(μ,σ2)μ=0lnL(μ,σ2)σ2=0 \frac{\partial \ln L(\mu,\sigma^2)}{\partial \mu}=0\quad\quad\frac{\partial \ln L(\mu,\sigma^2)}{\partial \sigma^2}=0
  3. 特殊情况
    • lnL(θ)\ln L(\theta)单调递增,则θ\theta越大越好,由于样本x1,,xnx_1,\cdots,x_n有范围,因此θ^=min(x1,,xn)\hat{\theta}=\min(x_1,\cdots,x_n)
    • lnL(θ)\ln L(\theta)单调递减,则θ\theta越小越好,由于样本x1,,xnx_1,\cdots,x_n有范围,因此θ^=max(x1,,xn)\hat{\theta}=\max(x_1,\cdots,x_n)
    • 对于分段L(θ)L(\theta),则列出(Xi)(X_i)在不同取值下的似然函数,该函数取最大值时的参数就是估计值,从而得到估计值关于(Xi)(X_i)的分段关系式
      如求出来的估计值不在参数范围内,用该方法
    • 对于常函数L(θ)L(\theta),任何满足定义域的(xi)(x_i)都取到最大值,因此xi[a,b]x_i\in [a,b],满足min(xi)a,max(xi)b\min (x_i)\ge a,\max(x_i)\le bg(xi)g(x_i)都是估计值
      这说明最大似然估计量不一定唯一,也有可能不存在
  4. 性质
    • θ^\hat{\theta}θ{\theta}的极大似然估计量,则g(θ^)g(\hat{\theta})也是g(θ)g(\theta)的极大似然估计量
    • 根据θ^\hat\thetaXiX_i的关系确定Fθ^(θ),fθ^(θ)F_{\hat\theta}(\theta),f_{\hat\theta}(\theta)

其它

伽马函数

0+xαexdx=Γ(α+1)=α!(12)!=π2,(12)!=π \begin{align} &\int_0^{+\infty} x^{\alpha}e^{-x}\mathrm d x=\Gamma(\alpha + 1)=\alpha ! \\ &\left(\frac{1}{2}\right)!=\frac{\sqrt\pi}{2},\left(-\frac{1}{2}\right)!=\sqrt\pi \end{align}

卷积公式

  1. Z=g(X,Y)Z=g(X,Y)的分布
    • Z,XZ,X表示YY,即Y=h(Z,X)Y=h(Z,X)
    • Df(x,y)dxdy=Df(x,h)hzdxdz\iint_Df(x,y)dxdy=\iint_{D^\prime}f(x,h)\left|\frac{\partial h}{\partial z} \right|dxdz
    • (X,Z)(X,Z)的概率密度为f(x,h)hzf(x,h)\left|\frac{\partial h}{\partial z} \right|
    • fZ(z)=+f(x,h)hzdxf_Z(z)=\int_{-\infty}^{+\infty} f(x,h)\left|\frac{\partial h}{\partial z} \right|dx
    • 同理也可以用Z,YZ,Y表示XX
  2. 确定积分域
    • 积分域是使得f(x,h)f(x,h)不为零的范围,因此xx位于fX(x)f_X(x)的定义域且hh位于fY(y)f_Y(y)的定义域
    • xx位于fX(x)f_X(x)定义域得与zz无关的固定区间,hh位于fY(y)f_Y(y)的定义域与zz有关的动态区间,积分域就是这两区间的交集
    • 具体方法:在z,xz,x为横纵坐标的坐标系中根据条件画出有效域,往zz轴投影就是zz的范围,从下往上穿线就是xx的积分域
  3. 常见组合
    • Z=aX+bYZ=aX+bYfZ(z)=+f(x,1bzabx)1bdx=+f(1azbay,y)1adyf_Z(z)=\int_{-\infty}^{+\infty} f\left(x,\frac{1}{b}z-\frac{a}{b}x\right)\left|\frac{1}{b} \right|dx=\int_{-\infty}^{+\infty} f\left(\frac{1}{a}z-\frac{b}{a}y,y\right)\left|\frac{1}{a} \right|dy

关于min,max

  1. Z=min(X,Y)Z=\min(X,Y)
    • FZ(z)=P{min(X,Y)z}=1P{X>z,Y>z}F_Z(z)=\mathrm P\{\min(X,Y)\le z\}=1-P\{X\gt z,Y\gt z\}
    • Z=12(X+YXY)Z=\frac{1}{2}(X+Y-|X-Y|)
  2. Z=max(X,Y)Z=\max(X,Y)
    • FZ(z)=P{max(X,Y)z}=P{Xz,Yz}F_Z(z)=\mathrm P\{\max(X,Y)\le z\}=P\{X\le z,Y\le z\}
    • Z=12(X+Y+XY)Z=\frac{1}{2}(X+Y+|X-Y|)
  3. P{max(X1,X2)X3}P\{\max(X_1,X_2)\le X_3\}
    • 先确定Y=max(X1,X2)Y=\max(X_1,X_2)X3X_3的概率分布
    • 由独立性得到(Y,X3)(Y,X_3)的联合概率分布
    • 在区域YX3Y\le X_3内对联合概率分布积分得到结果

发表评论 取消回复
表情 图片 链接 代码