常数变易法的原理及推广

2 minute read

Published:

本文介绍了常数变易法的原理,并给出在多个方程的情况下的推广.

参考书籍 Hale, J.K. (1980) Ordinary Differential Equations. Second Edition, Wiley Interscience, New York.

一阶线性微分方程组

在高等数学中,我们常见的一阶线性方程可以写成如下形式:

\[x'(t) = a(t) x(t) + b(t)\]

对于 \(n\) 个方程,其构成一个一阶线性方程组,可以写成(为了方便,下文中我们省略自变量,如无特殊说明,自变量均为 \(t\))

\[x'_i = \sum_{j=1}^n a_{ij} x_j + b_i ,\quad j=1,2,\dots,n\]

上式可以用矩阵来表示:

\[\mathbf{x}' = \mathbf{A} \mathbf{x} + \mathbf{b}\]

其中,\(\mathbf{x}, \mathbf{b} \in C^{n \times 1}\),\(\mathbf{A} \in C^{n \times n}\),\(C\) 为函数空间1(即其中的每一个元素都是一个函数)

下文中粗体符号(如 \(\mathbf{x}\))之类的默认表示一个函数矩阵,没有粗体的(如 \(x\))表示一个函数.

当上式中的非齐次项 \(\mathbf{b} = \mathbf{0}\) 时,上述方程变为 \(\mathbf{x}' = \mathbf{A} \mathbf{x}\) 称为一阶线性齐次方程组.

同时,上面式子中,求导可以看成是某种线性变换(显然求导是线性的),记求导的线性算符为 \(\mathrm{D}\),并定义对于一个函数矩阵 \(\mathbf{X}\),当求导算符 \(\mathrm{D}\) 作用在 \(\mathbf{X}\) 之上时,记为 \(\mathrm{D}[\mathbf{X}]\),表示对 \(\mathbf{X}\) 中的每一个元素(\(\mathbf{X}\) 是函数矩阵,其每一个元素都是一个函数)进行求导,并组成一个新的矩阵,即

\[\mathrm{D}:C^{m \times n} \to C^{m \times n}, \quad \mathbf{X} = (x_{ij})_{m \times n}, \quad \mathrm{D}[\mathbf{X}] = (x_{ij}')_{m \times n}\]

对偶方程

首先,我们先来研究较为简单的齐次的情况:

对于齐次方程组,若我们可以得到 \(n\) 个线性无关的特解2 \(\mathbf{x}_1,\mathbf{x}_2,\dots,\mathbf{x}_n \in C^{n \times 1}\),这 \(n\) 个解构成解空间 \(V_{sol}\) 的一组完备的基底,因此我们可以通过这一组特解得到所有的解. 同时,这一组特解可以拼接成一个 \(n \times n\) 的函数矩阵 \(\mathbf{X}\):

\[\mathbf{X} = [\mathbf{x_1}, \mathbf{x_2}, \dots, \mathbf{x_n}]\]

我们称这个矩阵为基解矩阵,此矩阵表示一个 \(\mathbb{R}^{n \times 1} \to V_{sol}\) 的线性变换,其输入一组坐标,输出一个通过这一组基底表示的特解. 实际上,当我们从齐次方程的通解待定常数计算符合我们的初值条件的特解时,其本质就是在求特解通过这一组基底表示时的坐标.

由于 \(\mathbf{x}_1,\mathbf{x}_2,\dots ,\mathbf{x_n}\) 线性无关,因此 \(\det \mathbf{X} \neq 0\),有逆矩阵 \(\mathbf{X}^{-1}\) 存在,且 \(\mathbf{X}^{-1} \mathbf{X} = \mathbf{I}\)(\(\mathbf{I}\) 为单位矩阵),显然,逆矩阵 \(\mathbf{X}^{-1}\) 表示一个从 \(V_{sol} \to \mathbb{R}^{n \times 1}\) 的映射,其输入一个特解,输出在这组基底下的坐标.

现在我们给出如下 Lemma:

\(\mathbf{Lemma.}\) 如果 \(\mathbf{X}\) 是齐次方程 \(\mathbf{x}' = \mathbf{A} \mathbf{x}\) 的基解矩阵,则其逆矩阵 \(\mathbf{X}^{-1}\) 是如下对偶方程的基解矩阵:

\[\mathbf{y}' = - \mathbf{y} \mathbf{A}\]

其中 \(y \in C^{1 \times n}\),即 \(\mathbf{X}^{-1}\) 的每个行向量都是对偶方程的解.

\(\mathbf{Proof:}\) 由于 \(\mathbf{X}^{-1} \mathbf{X} = \mathbf{I}\),两端求导,得到 \(\mathrm{D}[\mathbf{X}^{-1}] \mathbf{X} + \mathbf{X}^{-1} \mathrm{D}[\mathbf{X}] = 0\),由于 \(\mathrm{D}[\mathbf{X}] = \mathbf{A} \mathbf{X}\),得到 \(\mathrm{D}[\mathbf{X}^{-1}] \mathbf{X} = -\mathbf{X}^{-1} \mathbf{A} \mathbf{X}\),两端乘上 \(\mathbf{X}^{-1}\),得到 \(\mathrm{D}[\mathbf{X}^{-1}] = - \mathbf{X}^{-1} \mathbf{A}\),因此,\(\mathbf{X}^{-1}\) 是方程 \(\mathbf{y}' = -\mathbf{y} \mathbf{A}\) 的基解矩阵. \(\square\)

这里 \(\mathbf{y}\) 是行向量而不是列向量是因为 \(-\mathbf{X}^{-1} \mathbf{A}\) 这里的 \(\mathbf{A}\) 是右乘,因此其 \(\mathbf{X}^{-1}\) 只能是行向量的解拼接得到的矩阵.

常数变易法

前文我们一直在研究齐次的情况,现在我们来研究非齐次的情况. 对于非齐次方程:

\[\begin{equation} \mathbf{x}' = \mathbf{A} \mathbf{x} + \mathbf{b} \end{equation}\]

上式可以改写为 \(\mathbf{x}' - \mathbf{A} \mathbf{x} = \mathbf{b}\). 记 \(\mathbf{X}\) 是上述方程对应的齐次方程 \(\mathbf{x}' = \mathbf{A} \mathbf{x}\) 的基解矩阵,设 \(\mathbf{x}\) 是非齐次方程 \(\mathbf{x}'=\mathbf{A} \mathbf{x}+\mathbf{b}\) 的解,现在,我们计算:

\[\mathrm{D}[\mathbf{X}^{-1} \mathbf{x}] = \mathrm{D}[\mathbf{X}^{-1}] \mathbf{x} + \mathbf{X}^{-1} \mathrm{D}[\mathbf{x}]\]

现在,我们使用前文的 \(\mathbf{Lemma}\),有 \(\mathrm{D}[\mathbf{X}^{-1}] = - \mathbf{X}^{-1} \mathbf{A}\),同时,由原方程 \((1)\),有:

\[\mathrm{D}[\mathbf{X}^{-1} \mathbf{x}] = - \mathbf{X}^{-1} \mathbf{A} \mathbf{x} + \mathbf{X}^{-1} (\mathbf{A} \mathbf{x} + \mathbf{b})\]

因此,我们可以得到:

\[\begin{equation} \boxed{\mathrm{D}[\mathbf{X}^{-1} \mathbf{x}] = \mathbf{X}^{-1} \mathbf{b}} \end{equation}\]

现在我们来讨论一下上式的意义. 不难发现,当 \(\mathbf{b}=0\) 即齐次的情况时,\(\mathrm{D}[\mathbf{X}^{-1}\mathbf{x}] = \mathbf{0}\),即微分方程的解 \(\mathbf{x}\) 用齐次方程的基解矩阵 \(\mathbf{X}\) 对应的基底表示时的坐标为常数,保持不变,此即常数变易法中的常数.

但当 \(\mathbf{b} \neq \mathbf{0}\) 时,即非齐次的情况,我们可以得到,微分方程的解 \(\mathbf{x}\) 用齐次方程的基解矩阵 \(\mathbf{X}\) 对应的坐标表示时的坐标随时间发生了变化,即原本的常数 \(\mathbf{c} \in \mathbb{R}^n\) 变成了函数 \(\mathbf{c} \in C^n\),在原本的常数变易法中就是把常数 \(c_i\) 换成了函数 \(c_i(t)\)(\(i = 1,2,\dots,n\)),再通过“待定函数”具体求出 \(c_i(t)\).

非齐次方程的解

有了前文的式 \((2)\),我们便可以得出一般情况下非齐次的一阶线性微分的解:

\(\mathbf{Theorem}.\) 若 \(\mathbf{X}\) 是齐次方程 \(\mathbf{x}'=\mathbf{A}\mathbf{x}\) 的基解矩阵,则非齐次方程 \(\mathbf{x}'=\mathbf{A}\mathbf{x}+\mathbf{b}\) 的解为:

\[\mathbf{x}(t) = \mathbf{X}(t) \left[ \mathbf{X}^{-1}(\tau) \mathbf{x}(\tau) + \int_\tau^t \mathbf{X}^{-1}(s) \mathbf{b}(s) \ \mathrm{d} s \right]\]

其中 \(\tau\) 是一个常数. \(\mathbf{x}(\tau)\) 即方程的初值条件.

上述的证明在有了前文常数变易法的推导后变得非常简单:

\(\mathbf{Proof}:\) 根据前文,式 \((2)\) 两端积分,得到:

\[\mathbf{X}^{-1}(t) \mathbf{x}(t) - \mathbf{X}^{-1}(\tau) \mathbf{x}(\tau) = \int_\tau^t \mathbf{X}^{-1}(s)\mathbf{b}(s) \ \mathrm{d} s\]

移项后乘上 \(\mathbf{X}(t)\) 后便得到要证明的结论. \(\square\)

  1. 这里我们不对此处的函数空间的性质做严格说明,我们相信这里的函数空间的性质足够好(雾). 

  2. 实际上,当系数矩阵在区间上连续时,我们总能得到 \(n\) 个线性无关的特解,此处证明略.