金融随机分析

realhuhu 215 0

测度论

可测空间

  1. 空间X

    • 任意非空集合,例如\{0,1,2,\ldots\}
    • 元素记为x
  2. 集合A,B,C,\cdots

    • 空间X子集,例如\{0,1\},\{2,6,9\},\ldots
    • 空集\varnothing
  3. 集合族\mathscr{A},\mathscr{B},\cdots

    • 定义:由X的集合构成的集合
    • 通常可以写成
      \mathscr{A}=\{S_d,d\in D\}
      D被称为标志集,标志集不一定存在,例如\{\{0\},\{0,1\},\{0,1,2\}, \ldots\}
    • 集合序列:标志集为\mathbb{N}的集合族,\left\{S_n, n=1,2, \cdots\right\}
  4. \sigma代数\mathscr{F}

    • 定义:满足一定条件的集合族
      包含空间:X\in\mathscr{F}
      对补集封闭:A\in\mathscr{F}\Rightarrow A^c\in\mathscr{F}
      对可数并封闭:A_1, A_2, \ldots \in \mathscr{F} \Rightarrow \bigcup_{n=1}^{\infty} A_n \in \mathscr{F}
    • 最小的\sigma代数:\{\varnothing,X\}
      最大的\sigma代数:所有X的子集构成的集合,记作2^X
    • 原子:两两不交且所有之并为X,构成了对X的一种划分
      所有原子构成的集合族称为原子族,原子族与\mathscr{F}代数一一对应,包含其全部信息,因此可以记作\mathrm{At}(\mathscr{F})
    • \sigma代数的生成:对于定义在X上的集合族\mathscr{A}\sigma(\mathscr{A})表示包含\mathscr{A}的最小\sigma代数
      这让我们可以根据给定的集合系快速修补\sigma代数
      计算方式:根据X\mathscr{A}中元素计算原子族,对原子族生成\sigma代数
    • 示例:X=\{1,2,3,4,5\},\mathscr C=\{\{2,3,4\},\{3,4,5\}\}
      \mathrm{At}(\sigma(\mathscr C))=\{\{1\},\{2\},\{3,4\},\{5\}\}
      \sigma(\mathscr C)=\left\{\bigcup C:C\subseteq \mathrm{At}(\sigma(\mathscr C))\right\}
  5. 可测空间(X,\mathscr{F})

    • 其中\mathscr{F}是定义在X上的\sigma代数,\mathscr{F}中的每个集合称为可测集
    • 为什么要求可测空间中的\mathscr{F}\sigma代数?为了使得可测空间具有良好性质
    • \mathscr{G}也是X上的\sigma代数,且\mathscr{G}\subseteq \mathscr F,则称\mathscr{G}\mathscr{F}上的\sigma代数

概率空间

  1. 测度
    • 对于可测空间(X,\mathscr{F}),若存在函数\mu,满足
      \begin{aligned} &\mu: \mathscr{F}\rightarrow [0,\infty] \\ &\mu(\varnothing)=0 \\ &\mu\left(\bigcup_{n=1}^{\infty} A_n\right)=\sum_{n=1}^{\infty} \mu\left(A_n\right) \end{aligned}
      其中A_1,A_2,\ldots\in\mathscr{F}且两两不交
      则称\mu测度
    • 测度的引入使得我们可以计算可测集的"大小"
  2. 从可测空间到测度空间
    • 对于可测空间(X,\mathscr{F})和测度\mu,得到测度空间
      (X,\mathscr{F},\mu)
    • 对于不同的任务,我们可以构造不同的测度空间
      Lebesgue测度:定义了长度、面积、体积等
      Lebesgue积分:定义了面积、质量、期望等
      函数空间:广泛用于泛函分析、偏微分方程、信号处理和量子力学
  3. 从测度空间到概率空间
    • 样本空间\Omega代替空间X,得到可测空间(\Omega,\mathscr{F})
    • 对于可测空间(\Omega,\mathscr{F}),定义函数\mathbb P,满足
      \begin{aligned} &\mathbb P: \mathscr{F}\rightarrow [0,1] \\ &\mathbb P(\varnothing)=0,\mathbb P(\Omega)=1 \\ &\mathbb P\left(\bigcup_{n=1}^{\infty} A_n\right)=\sum_{n=1}^{\infty} \mathbb P\left(A_n\right) \end{aligned}
      可以发现\mathbb P是测度,还满足了额外条件,将其定义为概率
    • 由此得到概率空间(\Omega,\mathscr{F},\mathbb P)
      将集合A\in\mathscr F, A\subseteq\Omega称为事件,可见事件一定可测
      将元素\omega\in\Omega称为样本点
    • 考虑概率空间(\Omega,\mathscr{F},\mathbb P),对于事件A和非零概率事件B,定义条件概率
      \mathbb P(A\mid B)=\frac{\mathbb P(A\cap B)}{\mathbb P(B)}
      或者写成\mathbb P_B(A),可以发现\mathbb P_B也是(\Omega,\mathscr{F})上的概率测度

概率论

随机变量

  1. 可测函数
    • 对于可测空间(X,\mathscr{F})(Y,\mathscr{G}),若存在函数f,满足
      \begin{aligned} &f:X\rightarrow Y \\ &G\in \mathscr{G}\Rightarrow f^{-1}(G)\in\mathscr{F} \end{aligned}
      则称f可测函数
    • 注意,f^{-1}表示原像而不是反函数,因为可测函数不一定存在反函数。原像的定义为
      f^{-1}(G)=\{x\in X: f(x)\in G\}
  2. Borel空间
    • 取实数集\mathbb{R}为空间X,Borel \sigma代数为\mathscr{F},得到一个特殊的可测空间
      (\mathbb{R}, \mathscr{B}_{\mathbb{R}})
      称为实直线上的Borel可测空间,简称为Borel空间
    • Borel集合系\mathscr{B}_{\mathbb{R}}是由\mathbb{R}中所有开集生成的\sigma代数
  3. 随机变量
    • 对于概率空间(\Omega,\mathscr{F},\mathbb P)和Borel空间(\mathbb{R}, \mathscr{B}_{\mathbb{R}}),其可测函数f称为有限值实值随机变量
    • 通常用X而不是f表示随机变量,这里有一点符号混淆,不要和空间X弄混了
      \begin{aligned} &X:\Omega\to\mathbb R \\ &B\in \mathscr{B}_{\mathbb{R}}\Rightarrow X^{-1}(B)\in\mathscr F \end{aligned}
    • X是随机变量的充要条件X\mathscr{F}的同一个原子中的元素取值相同
  4. 随机变量的\sigma代数
    • 随机变量Y\sigma代数\sigma(Y)定义为
      \sigma(Y)=\{Y^{-1}(B):B\in\mathscr B(\mathbb R)\}.
      或者说,\sigma(Y)的原子集是同一个值的样本点集合构成的集合系
      \forall \omega \in A,Y(\omega)\equiv c_A\quad\mathrm{s.t.}\quad A\in\mathrm{At}(\sigma(Y))
    • 例如
      \begin{aligned} &\Omega=\{1,2,3,4\},Y(1)=Y(2)=0,Y(3)=Y(4)=1 \\ &Y^{-1}(0)=\{1,2\},Y^{-1}(1)=\{3,4\} \end{aligned}
      因此原子集为\{\{1,2\},\{3,4\}\}\sigma(Y)=\sigma(\{\{1,2\},\{3,4\}\})=\{\varnothing,\{1,2\},\{3,4\},\Omega\}
  5. 指示随机变量(示性函数)
    • 对于事件A,定义指示随机变量为
      \mathbb I_A(\omega) = \begin{cases} 1, & \omega\in A,\\ 0, & \omega\notin A. \end{cases}
      表示事件A发生时取1,其他情况取0的随机变量
    • 性质
      指示随机变量的期望
      \begin{aligned} &\mathbb E(\mathbb I_A)=\mathbb P(A) \\ &\mathbb E(X\mathbb I_A)=\int_\Omega X(\omega)\mathbb I_A(\omega)\mathrm{d}\mathbb P(\omega)=\int_A X(\omega)\mathrm{d}\mathbb P(\omega) \\ &\mathbb E(g(X)\mathbb I_A)=\int_\Omega g(X(\omega))\mathbb I_A(\omega)\mathrm{d}\mathbb P(\omega)=\int_A g(X(\omega))\mathrm{d}\mathbb P(\omega) \end{aligned}
      随机变量的分解
      X=\sum_{A\in \mathrm{At}(\sigma(X))}\mathbb c_AI_{A}

概率结构

  1. 背景
    • 对于概率空间(\Omega,\mathscr{F},\mathbb P)和Borel空间(\mathbb{R}, \mathscr{B}_{\mathbb{R}}),我们有概率\mathbb P和随机变量X
      \begin{aligned} &\mathbb P:\mathscr F\to[0,1] \\ &X:\Omega\to \mathbb R \end{aligned}
    • 在此基础上,我们可以定义分布、期望等概率论结构
  2. 期望和分布
    • 随机变量X期望\mathbb E[X]定义为
      \mathbb E[X]=\int_\Omega X(\omega)\mathrm{d}\mathbb P(\omega)
    • 类似的,可以定义\mathbb E[g(X)]
      \mathbb E[g(X)]=\int_\Omega g(X(\omega))\mathrm{d}\mathbb P(\omega)
      选择不同的g从而定义矩
    • 根据测度的推前,可以化简\mathbb E[g(X)]
      \mathbb E[g(X)]=\int_{-\infty}^{+\infty} g(x)\mathrm d F_X(x)
      其中F_X(x)=\mathbb P(X\le x),由此我们由概率\mathbb P定义出分布函数F_X
    • 根据测度的性质,有
      F_X(x)=\mathbb P(X\le x)=\mathbb P(\{\omega:X(\omega)\in (-\infty,x]\})=\mathbb P(X^{-1}((-\infty,x]))=\mathbb P_X((-\infty,x])
      其中\mathbb P_X=\mathbb P\circ X^{-1},定义为随机变量X分布
  3. 给定\sigma代数的条件期望和条件分布
    • 随机变量X关于子\sigma代数\mathscr G上的条件期望\mathbb E[X\mid \mathscr G]定义为
      \mathbb E[X\mid\mathscr G]=\sum_{A\in\operatorname{At}(\mathscr G)}\mathbb{I}_A\cdot \frac{1}{\mathbb P(A)}\int_A X(\omega)\mathrm{d}\mathbb P(\omega)=\sum_{A\in\operatorname{At}(\mathscr G)}\mathbb{I}_A\cdot\frac{\mathbb E[X\mathbb{I}_A]}{P(A)}
    • 类似的,可以定义\mathbb E[g(X)\mid\mathscr G]
      \mathbb E[g(X)\mid\mathscr G]=\sum_{A\in\operatorname{At}(\mathscr G)}\mathbb{I}_A\cdot \frac{1}{\mathbb P(A)}\int_A g(X(\omega))\mathrm{d}\mathbb P(\omega)=\sum_{A\in\operatorname{At}(\mathscr G)}\mathbb{I}_A\cdot\frac{\mathbb E[g(X)\mathbb{I}_A]}{P(A)}
    • 根据测度的推前,可以化简\mathbb E[g(X)\mid\mathscr G]
      \mathbb E[g(X)\mid\mathscr G]=\sum_{A\in\operatorname{At}(\mathscr G)}\mathbb{I}_A\cdot \int_{-\infty}^{+\infty} g(x)\mathrm{d} F_{X\mid A}(x)
      其中F_{X\mid A}(x)=\mathbb P_A(X\le x),由此我们由条件概率\mathbb P_A定义出条件分布函数F_{X\mid A}
    • 根据测度的性质,有
      F_{X\mid A}(x)=\mathbb P(X\le x\mid A)=\mathbb P_A(\{\omega:X(\omega)\in (-\infty,x]\})=\mathbb P_A(X^{-1}((-\infty,x]))=\mathbb P_{X\mid A}((-\infty,x])
      其中\mathbb P_{X\mid A}=\mathbb P_A\circ X^{-1},定义为随机变量X在条件A下的条件分布
  4. 给定随机变量的条件期望和条件分布
    • 随机变量X关于随机变量Y的条件期望定义为
      \mathbb E[X\mid Y]=\mathbb E[X\mid\sigma(Y)]
    • 若有\mathbb E[X\mid Y]=h(Y),则定义\mathbb E[X\mid Y=y]=h(y),绝大多数情况下利用h函数可以实现两种条件期望的相互推导,一般是后推前

随机过程

基本概念

金融随机分析

  1. 随机过程

    • 随机过程是定义在同一概率空间上的一族随机变量,通常记为
      \{X_t,t\in T\} \quad\text{或}\quad \{X_t\}_{t\in T} \quad\text{或}\quad \{X_t\}
      其中T是指标集,例如时间集合
    • 若给定概率空间(\Omega,\mathscr F,\mathbb P),随机过程可以形式化地表示为
      (t,\omega)\mapsto X_t(\omega):T\times\Omega\to S
      其中S为状态空间
    • 对于固定的样本点\omega\in\Omega,映射
      t\mapsto X_t(\omega)
      称为一条样本轨道
    • 对于固定的时刻t\in T,映射
      \omega\mapsto X_t(\omega)
      是一个随机变量
    • 若指标集为\mathbb N\mathbb Z,又称为随机序列
      \{X_n,n\in\mathbb N\}
  2. 滤过

    • 使用\mathscr F_t表示时刻t之前已经获得的信息,为了描述信息随时间逐渐增加的过程,引入一族\sigma代数
      \{\mathscr F_t\}_{t\geq 0}
      若对于任意0\leq s\leq t,满足
      \mathscr F_s\subseteq\mathscr F_t\subseteq\mathscr F
      则称\{\mathscr F_t\}_{t\geq 0}为一个滤过
    • 四元组
      (\Omega,\mathscr F,\{\mathscr F_t\}_{t\geq 0},\mathbb P)
      称为带滤过的概率空间
    • 使用\mathscr F_t^X包含随机过程\{X_t\}_{t\geq 0}直到时刻t所能获得的全部信息,则称
      \mathscr F_t^X=\sigma(X_s:0\leq s\leq t)
      为过程X自然滤过
  3. 适应过程

    • 若对于任意t\geq 0,随机变量X_t都是\mathscr F_t可测的,则称随机过程\{X_t\}关于滤过\{\mathscr F_t\}适应的
    • 适应性表示X_t只能依赖当前及过去的信息,不能依赖未来的信息
    • (X_t,\mathscr F_t)称为适应过程X_t称为适应随机过程
  4. 可料过程

    • 若对于任意t\geq 0,随机变量X_t都是\mathscr F_{t-1}可测的,则称随机过程\{X_t\}关于滤过\{\mathscr F_t\}可料的
    • 可料性表示X_t只能依赖过去的信息,不能依赖当前和未来的信息
    • (X_t,\mathscr F_t)称为可料过程X_t称为可料随机过程
  5. 鞅过程

    • 若适应过程(X_n,\mathscr F_n)满足
      \mathbb E[|X_n|]\lt\infty,\mathbb E[X_{n+1}\mid\mathscr F_n]=X_n
      则称其为离散时间鞅
    • 若适应过程(M_n,\mathscr F_n)满足
      \mathbb E[|M_t|]\lt\infty,\mathbb E[M_t\mid\mathscr F_s]=M_s\quad(t\gt s)
      则称其为连续时间鞅
    • 这表明,对于鞅的条件期望,时间小于等于s的部分可以直接移到期望外

鞅的性质

  1. 常见鞅
    • X_1,\cdots,X_n,\cdots独立同分布,S_n=s_0+\sum_{i=1}^n X_i,则可以构造以下鞅
      S_n-n\mathbb E(X_1)\qquad(S_n-n\mathbb E(X_1))^2-n\mathrm{Var}(X_1)\qquad\frac{e^{\theta S_n}}{\left(\mathbb E\left(e^{\theta X_1}\right)\right)^n}
    • X_1,\cdots,X_n,\cdots独立同分布,S_n=S_0\prod_{i=1}^n X_i,则可以构造以下鞅
      \frac{S_n^\theta}{\left(\mathbb E\left(X_1^\theta\right)\right)^n}\qquad\ln S_n-n\mathbb E(\ln X_1)\qquad(\ln S_n-n\mathbb E(\ln X_1))^2-n\mathrm{Var}(\ln X_1)
  2. 鞅变换
    • 对于随机过程\{X_n\}和可料过程(M_n,\mathscr F_n),则随机过程
      (M\cdot X)_n=M_0X_0+\sum_{i=1}^n M_i(X_i-X_{i-1})
      称为由M导出的X变化,若(X_n,\mathscr F_n)为鞅过程,则称M\cdot X鞅变换
    • Doob鞅基本定理:鞅变换仍然是鞅

鞅的停时

  1. 停时
    • 停止: 根据当前和过去的信息,若满足约定条件,则称为停止,例如
      第一次达到某个阈值
      第二次亏损超过某个界限
      第三次随机过程离开某个区域
    • 停时:第一次触发停止的时间,记作\tau,是个随机变量
      严格定义:设有滤过\{\mathscr F_t\}和扩展非负随机变量\tau:\Omega\to[0,\infty],如果对于任意t\ge0,都有
      \{\tau\le t\}=\tau^{-1}([0,t])=\{\omega\in\Omega:\tau(\omega)\in[0,t]\}\in\mathscr F_t
      则称\tau为关于\{\mathscr F_t\}的停时,这个公式唯一表示的是停止规则不能依赖未来信息。若停止规则依赖未来信息则不能称为停时
    • 对于样本点\omega,其停时\tau(\omega)记作
      \tau(\omega)=\inf\{n\ge0:X_n(\omega)\in A\}
      其中A表示触发停止状态的集合,\inf表示集合中最小的元素,因此\tau(\omega)表示样本\omega首次触发停止的时间
    • 停时的\sigma代数\mathscr F_\tau的原子:\operatorname{At}(\mathscr F_\tau)=\text{所有非空的 }\bigl(C\cap\{\tau=t\}\bigr),\quad C\in\operatorname{At}(\mathscr F_t)
  2. 停止过程
    • 对于随机过程\{X_t\}和停时\tau,定义新过程
      X_t^\tau=X_{t\wedge\tau}
      为停止过程,其中t\wedge\tau=\min(t,\tau)
    • 停止过程在\tau时刻后,其值始终为X_{\tau},对于样本点\omega,表现为X_{t\wedge\tau}(\omega)\equiv X_{\tau}(\omega)\quad(t\ge\tau)
    • 对于随机序列\{X_n\},适应过程的停止过程仍然适应,鞅过程的停止过程仍然是鞅
  3. 可选停时定理
    • 对于鞅(M_n,\mathscr F_n)和关于\mathscr F_n的停时\tau,在适当条件下则有
      \mathbb E[M_\tau]=\mathbb E[M_0]
    • 常用适当条件
      停时有界:\tau\le N
      停时过程有界:|M_{t\wedge\tau}|\le C
    • 这表明如果M_n是公平过程,只要停止规则\tau不能预知,那么在随机时间\tau停止后,平均收益仍不改变

布朗运动

  1. 定义
    • 随机过程\{W_t\}_{t\geq 0}若满足W_0=0,样本轨道连续,且对于任意0\leq s\lt t,有
      W_t-W_s\sim N(0,t-s)
      并且不相交时间区间上的增量相互独立,则称为标准布朗运动。标准布朗运动是一种特殊的鞅
    • 标准化后布朗运动
      Z=\frac{W_t}{\sqrt t}\sim\mathrm N(0,1)
      标准化后布朗运动既不是鞅页不是标准布朗运动
  2. 性质
    • 构造鞅
      W_t,\qquad W_t^2-t,\qquad e^{\theta W_t-\frac{1}{2}\theta^2t}
    • 独立增量
      \begin{aligned} &\mathbb E[g(W_t-W_s)\mid\mathscr F_s]=\mathbb E[g(W_t-W_s)] \\ &\mathbb E[g(W_t-W_s)h(W_s)\mid\mathscr F_s]=h(W_s)\mathbb E[g(W_t-W_s)] \\ &\mathbb E[g(W_{t+\Delta t}-W_{s+\Delta t})h(W_{s+\Delta t})\mid\mathscr F_s]=\mathbb E(h(W_{s+\Delta t})\mid \mathscr F_s)\mathbb E[g(W_t-W_s)] \end{aligned}
    • 平移不变
      \{W_{t+a}-W_a\}_{t\geq 0} \text{是标准布朗运动}
    • 马尔科夫性
      独立增量
      \mathbb E(g(W_{t+\tau}-W_\tau)\mid\mathscr F_\tau)=\mathrm E(g(W_{t+\tau}-W_\tau))
      平移不变
      \{W_{t+\tau}-W_\tau\}_{t\geq 0} \text{是标准布朗运动}
    • 期望和矩
      有条件:0\le s\lt t
      \begin{aligned} &\mathbb E[W_t\mid\mathscr F_s]=W_s \\ &\mathbb E[W_t^2-t\mid\mathscr F_s]=W_s^2-s \\ &\mathrm{Var}[W_t\mid\mathscr F_s]=t-s \\ &\mathbb E[e^{\theta W_t-\frac{1}{2}\theta^2 t}\mid\mathscr F_s]=e^{\theta W_s-\frac12\theta^2 s} \end{aligned}
      无条件:将有条件的s换成0即可,此外
      \begin{aligned} &\mathrm{Cov}(W_s,W_t)=\mathbb E(W_tW_s)=s\wedge t \\ &\mathbb E(e^{a Z}\mathbb I_{\{Z\gt b\}})=e^{\frac{1}{2}a^2}\mathrm N(a-b) \end{aligned}
  3. 首中时
    • 定义布朗运动首次达到m的时间\tau_m为首中时
      \tau_m=\inf\{t\ge0:W_t=m\}
    • 首中时分布
      \mathbb P(\tau_m\le t)=2\mathbb P(W_t\ge m)=2\left[1-\Phi\left(\frac{m}{\sqrt t}\right)\right]
  4. 最大值
    • 定义布朗运动在t时刻前的最大值为最大值分布M_t
      M_t=\max_{0\le s\le t}W_s
    • 最大值分布的性质
      \begin{aligned} &M_t\ge W_t\ge 0 \\ &\mathbb P(M_t\ge m)=\mathbb P(\tau_m\le t) \end{aligned}
  5. GBM模型
    • 股价S_t服从微分方程
      dS_t=(r-\delta) S_t\mathrm dt+\sigma S_t\mathrm dW_t
    • 根据Itô公式求\mathrm d\ln S_t后再积分,解得t时刻股价S_t
      S_t=S_0e^{\left(r-\delta-\frac{1}{2}\sigma^2\right)t+\sigma W_t}
      表明S_t服从对数正态分布
      \begin{aligned} &S_t\sim S_0\ln\mathrm N\left(\left(r-\delta-\frac{1}{2}\sigma^2\right)t,\sigma^2 t\right) \\ &\mathbb E(S_t)=S_0e^{(r-\delta)t} \end{aligned}
    • r\ne\delta,则首中时的停止过程S_{t\wedge\tau_K}不是鞅,可选的鞅为
      M_t=e^{-(r-\delta)t}S_t=S_0e^{-\frac{1}{2}\sigma^2t+\sigma W_t}
      其停止过程M_{t\wedge\tau_K}是鞅
  6. 控制收敛定理
    • M_t=g(X_t,t)是鞅,\tau_mX_t的停时,根据可选停时定理
      \mathbb E[M_{t\wedge\tau_m}]=\mathbb E[M_{0\wedge\tau_m}]=\mathbb E[M_0]
    • 若满足控制收敛条件,令t\rightarrow \infty,则t\wedge\tau_m\rightarrow\tau_m,X_{t\wedge\tau_m}\rightarrow m,因此
      \mathbb E[M_0]=\lim_{t\rightarrow\infty}\mathbb E[M_{t\wedge\tau_m}]=\lim_{t\rightarrow\infty}\mathbb E[g(X_{t\wedge\tau_m},{t\wedge\tau_m})]=\mathbb E[g(m,\tau_m)]
      从而构建求解\mathbb E(\tau_m)的等式。控制收敛条件:存在与t无关的函数G,使得|M_{t\wedge\tau_m}|\lt G
    • 对于GBM,可以证明
      \mathbb E(e^{-\alpha\tau_m})=e^{-|m|\sqrt{2\alpha}}
      其中\alpha=\frac{1}{2}\sigma^2

随机积分

随机微分

  1. 常微分方程

    • 考虑常微分方程
      \frac{\mathrm dx_t}{\mathrm dt} = b(t,x_t)
    • 使用微分记号,可以写成
      \mathrm dx_t=b(t,x_t)\mathrm dt
    • 更严格地说,该方程表示积分方程
      x_t = x_0+ \int_0^tb(s,x_s)\mathrm ds
  2. 随机扰动

    • 为了描述随机扰动,可以在常微分方程中加入布朗运动的增量。定义
      \mathrm dX_t = b(t,X_t)\mathrm dt + \sigma(t,X_t)\mathrm dW_t, \qquad X_0=x_0
      表示积分方程
      X_t = x_0 + \int_0^tb(s,X_s)\mathrm ds + \int_0^t\sigma(s,X_s)\mathrm dW_s
    • 第一项为初始值
    • 第二项为普通积分,表示确定性趋势
    • 第三项为 Itô 积分,表示随机扰动
  3. 与常微分方程的差异

    • 布朗运动的增量满足
      W_{t+\Delta t}-W_t \sim N(0,\Delta t)
    • 因此,\Delta W_t的典型大小为
      \sqrt{\Delta t}
      而不是\Delta t
    • 布朗运动的样本轨道连续,但几乎处处不可导。因此,表达式
      \frac{\mathrm dW_t}{\mathrm dt}
      通常没有普通函数意义
    • 为了严格解释随机微分方程,需要定义关于布朗运动的随机积分
      \int_0^tH_s\mathrm dW_s

二次变差

  1. 时间分割

    • 对区间[0,t]进行分割
      \Pi = \{0=t_0\lt t_1\lt\cdots\lt t_n=t\}
    • 分割的最大长度记为
      |\Pi| = \max_{0\leq i\leq n-1} (t_{i+1}-t_i)
  2. 有限变差过程

    • 对于连续过程X_t,考虑沿分割的增量绝对值之和
      \sum_{i=0}^{n-1} |X_{t_{i+1}}-X_{t_i}|
    • 若对于任意t\geq 0
      \sup_{\Pi} \sum_{i=0}^{n-1} |X_{t_{i+1}}-X_{t_i}| \lt\infty
      则称X_t[0,t]上具有有限变差
    • 可微函数以及单调函数都是有限变差函数
    • 连续有限变差过程的二次变差为零
  3. 二次变差

    • 对于连续过程X_t,考虑沿分割的增量平方和
      \sum_{i=0}^{n-1} \left( X_{t_{i+1}}-X_{t_i} \right)^2
    • 当分割逐渐变细时,若上述平方和存在极限,则定义
      [X]_t = [X,X]_t = \lim_{|\Pi|\to 0} \sum_{i=0}^{n-1} \left( X_{t_{i+1}}-X_{t_i} \right)^2
    • [X]_t称为过程X_t二次变差
  4. 布朗运动的二次变差

    • 布朗运动虽然具有无限变差,但具有确定的二次变差
      [W]_t=t
    • 使用微分记号,可以简写为
      (\mathrm dW_t)^2=\mathrm dt
    • 该式不是普通代数恒等式,而是布朗运动二次变差的简写
  5. 二次协变差

    • 为了处理两个过程的乘积,进一步定义连续过程X_tY_t二次协变差
      [X,Y]_t = \lim_{|\Pi|\to 0} \sum_{i=0}^{n-1} \left( X_{t_{i+1}}-X_{t_i} \right) \left( Y_{t_{i+1}}-Y_{t_i} \right)
    • 二次变差是二次协变差的特殊情形
      [X]_t=[X,X]_t
    • A_t是连续有限变差过程,则
      [A,X]_t=0

Itô 积分

  1. 简单过程

    • 首先考虑分段常数过程
      H_s = \sum_{i=0}^{n-1} H_{t_i} \mathbf 1_{(t_i,t_{i+1}]}(s)
    • 其中,H_{t_i}\mathscr F_{t_i}可测的随机变量
    • 这意味着在区间(t_i,t_{i+1}]上使用的系数,只能依赖时刻t_i之前的信息
    • 定义简单过程的 Itô 积分为
      \int_0^tH_s\mathrm dW_s = \sum_{i=0}^{n-1} H_{t_i} \left( W_{t_{i+1}}-W_{t_i} \right)
  2. 一般过程

    • 若适应过程H_t满足
      \mathbb E \left[ \int_0^tH_s^2\mathrm ds \right] \lt\infty
      则可以使用简单过程逼近H_t
    • 通过取极限,定义一般的 Itô 积分
      \int_0^tH_s\mathrm dW_s
  3. 基本性质

    • 线性性:
      \int_0^t (aH_s+bG_s) \mathrm dW_s = a\int_0^tH_s\mathrm dW_s + b\int_0^tG_s\mathrm dW_s
    • 二次变差:
      \left[ \int_0^\cdot H_s\mathrm dW_s \right]_t = \int_0^tH_s^2\mathrm ds
    • Itô 等距公式
      \mathbb E \left[ \left( \int_0^tH_s\mathrm dW_s \right)^2 \right] = \mathbb E \left[ \int_0^tH_s^2\mathrm ds \right]
    • 期望公式
      \mathbb E \left[ \int_0^tH_s\mathrm dW_s \right] = 0
    • 方差公式
      \mathrm{Var} \left( \int_0^tH_s\mathrm dW_s \right) = \mathbb E \left[ \left( \int_0^tH_s\mathrm dW_s \right)^2 \right] = \mathbb E \left[ \int_0^tH_s^2\mathrm ds \right]
    • 协方差公式
      \mathrm{Cov} \left( \int_0^aH_{s,a}\mathrm dW_s,\int_0^bH_{s,b}\mathrm dW_s \right) = \mathbb E \left[ \int_0^{a\wedge b} H_{s,a}H_{s,b}\mathrm ds \right]
    • 正态性:若H_s为确定性函数则积分服从均值为0、方差含t的正态分布
  4. 微分记号


    • M_t = \int_0^tH_s\mathrm dW_s
      则可以简写为
      \mathrm dM_t=H_t\mathrm dW_t

Itô 过程

  1. 定义

    • 若过程X_t可以表示为
      X_t = X_0 + \int_0^ta_s\mathrm ds + \int_0^tb_s\mathrm dW_s
      则称X_tItô 过程
    • 其微分形式为
      \mathrm dX_t = a_t\mathrm dt+b_t\mathrm dW_t
  2. Itô 微分规则

    • 在随机微积分中,通常使用以下简写:
      (\mathrm dt)^2=0, \qquad \mathrm dt\,\mathrm dW_t=0, \qquad (\mathrm dW_t)^2=\mathrm dt
    • 前两项消失,是因为它们相对于\mathrm dt属于更高阶小量
    • 第三项保留,是因为布朗运动的增量具有\sqrt{\mathrm dt}的数量级
  3. 二次变差

    • 对于
      \mathrm dX_t = a_t\mathrm dt+b_t\mathrm dW_t
      漂移部分属于有限变差过程,不影响二次变差
    • 因此
      \mathrm d[X]_t=b_t^2\mathrm dt
      并且
      [X]_t = \int_0^tb_s^2\mathrm ds
  4. 二次协变差


    • \begin{aligned} \mathrm dX_t &= a_t\mathrm dt+b_t\mathrm dW_t \\ \mathrm dY_t &= c_t\mathrm dt+e_t\mathrm dW_t \end{aligned}

      \mathrm d[X,Y]_t = b_te_t\mathrm dt
    • 使用 Itô 乘法规则,也可以简写为
      \mathrm dX_t\,\mathrm dY_t = \mathrm d[X,Y]_t = b_te_t\mathrm dt

Itô 公式

  1. 引入

    • 对于普通可微函数,链式法则为
      \mathrm df(t,x_t) = \frac{\partial f}{\partial t}\mathrm dt + \frac{\partial f}{\partial x}\mathrm dx_t
    • 对于 Itô 过程,由于
      (\mathrm dW_t)^2=\mathrm dt
      二阶项不能忽略
    • 因此,普通链式法则需要修改
  2. 一维 Itô 公式


    • \mathrm dX_t = a_t\mathrm dt+b_t\mathrm dW_t
      f(t,x)具有足够光滑性,则
      \begin{aligned} \mathrm df(t,X_t) &= \left( \frac{\partial f}{\partial t} + a_t\frac{\partial f}{\partial x} + \frac{1}{2} b_t^2 \frac{\partial^2f}{\partial x^2} \right) \mathrm dt \\ &\quad+ b_t \frac{\partial f}{\partial x} \mathrm dW_t \end{aligned}
  3. 简写形式

    • 由于
      (\mathrm dX_t)^2 = b_t^2\mathrm dt
      Itô 公式也可以写成
      \mathrm df(t,X_t) = \frac{\partial f}{\partial t}\mathrm dt + \frac{\partial f}{\partial x}\mathrm dX_t + \frac{1}{2} \frac{\partial^2f}{\partial x^2} (\mathrm dX_t)^2
  4. 平方公式

    • f(x)=x^2,得到
      \mathrm d(X_t^2) = 2X_t\mathrm dX_t + (\mathrm dX_t)^2

    • \mathrm dX_t = a_t\mathrm dt+b_t\mathrm dW_t

      \mathrm d(X_t^2) = (2X_ta_t+b_t^2)\mathrm dt + 2X_tb_t\mathrm dW_t
  5. 平方根型随机微分方程

    • 基本形式
      一类常见的随机微分方程为
      \mathrm dY_t = (a-bY_t)\mathrm dt + c\sqrt{Y_t}\mathrm dW_t
      由于扩散系数中含有\sqrt{Y_t},通常需要讨论解的非负性
    • 平方构造
      当方程中同时出现Y_t\sqrt{Y_t}时,可以尝试构造
      Y_t=X_t^2
      根据平方公式,
      \mathrm d(X_t^2) = 2X_t\mathrm dX_t + (\mathrm dX_t)^2
      通过选择适当的X_t,可以使平方后的漂移项和扩散项与目标方程匹配
    • 布朗运动的变换
      X_t为适应过程,可以定义
      W_t = \int_0^t \operatorname{sgn}(X_s) \mathrm dB_s
      在适当条件下,W_t仍然是布朗运动,并且
      X_t\mathrm dB_t = |X_t|\mathrm dW_t
      Y_t=X_t^2,则
      |X_t|=\sqrt{Y_t}
      该方法通常用于构造弱解。变换前后的布朗运动一般不是同一个过程

Itô 乘积公式

  1. 一般形式

    • 对于连续 Itô 过程X_tY_t
      \mathrm d(X_tY_t) = X_t\mathrm dY_t + Y_t\mathrm dX_t + \mathrm d[X,Y]_t
    • 与普通乘积公式相比,多出二次协变差项
  2. 展开计算


    • \begin{aligned} \mathrm dX_t &= a_t\mathrm dt+b_t\mathrm dW_t \\ \mathrm dY_t &= c_t\mathrm dt+e_t\mathrm dW_t \end{aligned}

      \begin{aligned} \mathrm d[X,Y]_t &= \mathrm dX_t\,\mathrm dY_t \\ &= (a_t\mathrm dt+b_t\mathrm dW_t) (c_t\mathrm dt+e_t\mathrm dW_t) \\ &= b_te_t\mathrm dt \end{aligned}
  3. 确定性函数

    • g(t)为确定性可微函数,则g(t)是有限变差过程
    • 因此
      \mathrm d[g,X]_t=0
      并且
      \mathrm d(g(t)X_t) = g(t)\mathrm dX_t + X_tg'(t)\mathrm dt
  4. 线性随机微分方程

    • 考虑线性随机微分方程
      \mathrm dX_t = a(t)X_t\mathrm dt + \sigma(t)\mathrm dW_t, \qquad X_0=x_0
    • 定义积分因子
      I_t = \exp \left( -\int_0^ta(s)\mathrm ds \right)
    • 由于I_t是确定性有限变差过程,
      \mathrm d[I,X]_t=0
    • 使用 Itô 乘积公式:
      \mathrm d(I_tX_t) = I_t\mathrm dX_t + X_t\mathrm dI_t
    • 整理得到
      \mathrm d(I_tX_t) = I_t\sigma(t)\mathrm dW_t
    • 两边积分后得到
      X_t = \exp \left( \int_0^ta(s)\mathrm ds \right) \left[ x_0 + \int_0^t \exp \left( -\int_0^sa(u)\mathrm du \right) \sigma(s)\mathrm dW_s \right]

矩的计算

  1. 一阶矩

    • 若随机微分方程已经写成积分形式
      X_t = X_0 + \int_0^ta_s\mathrm ds + \int_0^tb_s\mathrm dW_s
      则可以对两边取期望
    • 在满足可积条件时,
      \mathbb E \left[ \int_0^tb_s\mathrm dW_s \right] =0
    • 因此
      \mathbb E[X_t] = \mathbb E[X_0] + \int_0^t \mathbb E[a_s] \mathrm ds
  2. 二阶矩

    • X_t^2使用 Itô 公式
      \mathrm d(X_t^2) = 2X_t\mathrm dX_t + (\mathrm dX_t)^2
    • 再对所得等式取期望,可以得到二阶矩
      \mathbb E[X_t^2]
      满足的积分方程或微分方程
  3. 方差

    • 得到一阶矩与二阶矩后,可以使用
      \operatorname{Var}(X_t) = \mathbb E[X_t^2] - \left( \mathbb E[X_t] \right)^2
      计算方差

发表评论 取消回复
表情 图片 链接 代码

分享