Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
новый онлайн-сервис
число, сумма и дата прописью

Часовой пояс: UTC + 3 часа [ Летнее время ]


Функции от матриц

Функции от матриц


Пусть A — числовая квадратная матрица и f(\lambda) — скалярная функция переменной \lambda. В этом разделе понятие функции распространяется на матричные значения аргумента. Если f(\lambda) — многочлен, то задача нахождения многочлена f(A), получающегося при подстановке матрицы A вместо переменной \lambda, была решена ранее. Требуется определить, что следует понимать под выражением f(A) для достаточно произвольной функции f(\lambda). Разумеется, что определение функции от матрицы, когда функция является многочленом, должно совпадать с определением многочлена от матрицы.


Функции, определенные на спектре матрицы


Напомним, что спектром квадратной матрицы A называется совокупность всех ее собственных значений (корней характеристического многочлена). Все собственные значения являются также корнями минимального многочлена (см. свойство 3 минимального многочлена):


\mu_A(\lambda)= (\lambda-\lambda_1)^{m_1}\cdot(\lambda-\lambda_2)^{m_2}\cdot \ldots\cdot (\lambda-\lambda_k)^{m_k},
(7.54)

где \lambda_1 — корень кратности m_1, \lambda_2 — корень кратности m_2 и т.д. Степень \nu минимального многочлена не превосходит порядка n матрицы A: \nu=m_1+ m_2+\ldots+m_k\leqslant n.


Говорят, что скалярная функция f(\lambda) переменной \lambda определена на спектре матрицы A, если для функции f(\lambda) определены значения


f(\lambda_i),\quad f'(\lambda_i),\quad \ldots,\quad f^{(m_i-1)}(\lambda_i),~ i=1,2,\ldots,k.
(7.55)

т.е. функция f(\lambda) определена в окрестности каждой точки \lambda=\lambda_i~(i=1,\ldots,k) вместе со своими производными до указанного порядка. Совокупность (7.55) значений функции и ее производных будем обозначать f(\Lambda_A).


Две функции f(\lambda) и g(\lambda) называются равными на спектре матрицы A, если


f(\lambda_i)=g(\lambda_i),\,~f'(\lambda_i)= g'(\lambda_i),\,~\ldots,\,~ f^{(m_i-1)}(\lambda_i)= g^{(m_i-1)}(\lambda_i),~ i=1,2,\ldots,k.
(7.56)

Эти равенства будем записывать в форме f(\Lambda_A)=g(\Lambda_A).




Теорема 7.10 (основное свойство многочленов от матриц). Если f(\lambda) и g(\lambda) — многочлены, то


f(\Lambda_A)=g(\Lambda_A) \quad \Leftrightarrow\quad f(A)=g(A),
(7.57)

т.е. многочлены, равные на спектре матрицы, имеют равные матричные значения, и наоборот, если равны матричные значения многочленов, то равны их значения на спектре матрицы. Другими словами, значения f(\Lambda_A) многочлена на спектре матрицы полностью определяют его значение f(A) от матрицы A.


В самом деле, пусть f(A)=g(A), тогда разность d(\lambda)= f(\lambda)-g(\lambda) является аннулирующим многочленом: d(A)=O. Разделим его на минимальный многочлен d(\lambda)=p(\lambda)\cdot\mu_A(\lambda) (свойство 1 в разд.7.2.4). Из (7.54) следует, что число \lambda_i является корнем многочлена d(\lambda), причем его кратность больше или равна m_i. Тогда:


d(\lambda_i)=0,\quad d'(\lambda_i)=0,\quad\ldots, \quad d^{(m_i-1)}(\lambda_i),\quad i=1,2,\ldots,k,

что равносильно (7.56). Следовательно, f(\Lambda_A)=g(\Lambda_A). Достаточность доказана. Для доказательства необходимости нужно все рассуждения провести в обратном порядке, либо вернуться ко второму способу нахождения многочлена от матрицы: в системе (7.46), которая позволяет найти коэффициенты искомого многочлена, левые части уравнений являются значениями многочлена f(\lambda) на спектре матрицы A.




Определение и свойства функций от матриц


Основное свойство (7.57), справедливое для многочленов, переносится на произвольные функции и фактически берется за основу определения функции от матрицы.


Пусть f(A) — произвольная функция, определенная на спектре матрицы A. Значение f(A) функции f(\lambda) от матрицы A определяется равенством


f(A)=g(A),
(7.58)

где g(A) — любой многочлен, принимающий на спектре матрицы A те же значения, что f(\lambda) \colon f(\Lambda_A)=g(\Lambda_A).


Поскольку функции от матриц определяются через многочлены, то на них переносятся свойства многочленов от матриц.


1. Функции от подобных матриц подобны.


2. Функция от блочно-диагональной матрицы является блочно- диагональной матрицей, т.е. если матрица A имеет вид A=\operatorname{diag}(A_1,\ldots,A_k), где A_1,\ldots,A_k некоторые квадратные матрицы, то


f(A)=\operatorname{diag}\Bigl(f(A_1),f(A_2),\ldots,f(A_k)\Bigr).

3. Функция f(\lambda) от жордановой клетки J_r(\lambda_0) имеет вид


f\bigl(J_r(\lambda_0)\bigr)= \begin{pmatrix} f(\lambda_0)& \dfrac{1}{1!}f'(\lambda_0)&\cdots&\dfrac{1}{(r-1)!}f^{(r-1)}(\lambda_0)\\[8pt] 0&f(\lambda_0)& \cdots&\dfrac{1}{(r-2)!}f^{(r-2)}(\lambda_0)\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&f(\lambda_0) \end{pmatrix}\!.
(7.59)

Это верхняя треугольная матрица r-го порядка, на главной диагонали которой стоят значения функции f(\lambda) в точке \lambda_0, над диагональю — значения первой производной в этой же точке и т.д., т.е. коэффициенты формулы Тейлора для функции f(\lambda).




Способы нахождения функций от матриц


Из определения функции от матрицы следует, что первый и второй способы нахождения многочлена от матрицы, пригодны и для любой функции, определенной на спектре матрицы. Поэтому они могут считаться первым и вторым способами нахождения функции от матрицы. Далее излагается третий (интерполяционный) способ решения этой же задачи.


Пример 7.21. Найти функцию f(\lambda)= e^{\lambda} от матрицы A=\begin{pmatrix}4&4\\ -1&0 \end{pmatrix}.


Решение. Первый способ. 1. Жорданова форма J_A и преобразующая матрица S были найдены в примере 7.15:


J_A=\begin{pmatrix}2&1\\0&2 \end{pmatrix}\!,\qquad S=\begin{pmatrix}2&1\\-1&0 \end{pmatrix}\!,\qquad S^{-1}=\begin{pmatrix}0&-1\\ 1&2 \end{pmatrix}\!.

2. Жорданова форма J_A состоит из одной жордановой клетки J_A=J_2(2) 2-го порядка, соответствующей собственному значению \lambda=2. Найдем значение функции f(2)=e^2 и ее производной f'(2)=e^2. Запишем функцию от жордановой формы (7.59):


f(J_A)=\begin{pmatrix} e^2&e^2\\ 0&e^2\end{pmatrix}= e^2\cdot\! \begin{pmatrix} 1&1\\0&1 \end{pmatrix}\!.

3. Найдем функцию от матрицы A:


f(A)=e^A=S\cdot f(J_A)\cdot S^{-1}= \begin{pmatrix} 2&1\\ -1&0 \end{pmatrix}\!\cdot e^2\cdot\! \begin{pmatrix}1&1\\0&1\end{pmatrix}\!\cdot\! \begin{pmatrix} 0&-1\\ 1&2 \end{pmatrix}= e^2\cdot\! \begin{pmatrix} 3&4\\ -1&-1 \end{pmatrix}\!.

Второй способ. 1. Минимальный многочлен матрицы А найден в примере 7.18: \mu_A(\lambda)=e_2(\lambda)=(\lambda-2)^2. Степень v минимального многочлена равна 2. Значит, многочлен (7.44) линейный: r(\lambda)=r_1 \lambda+r_0.


2. Для двойного корня \lambda=\lambda_1=2~(m_1=2) составляем уравнения (7.46):


\begin{cases}f(2)= r(2),\\f'(2)= r'(2),\end{cases} \Rightarrow\quad \begin{cases}e^2=r_1\cdot2+r_0,\\ e^2=r_1.\end{cases}

3. Решая систему, получаем r_1=e^2,~ r_0=-e^2 и r(\lambda)=e^2 \lambda-e^2.


4. Находим функцию от матрицы A:


f(A)=e^A=r(A)= e^2\cdot\! \begin{pmatrix}4&4\\ -1&0\end{pmatrix}- e^2\cdot\! \begin{pmatrix}1&0\\0&1\end{pmatrix}= e^2\cdot\! \begin{pmatrix}3&4\\ -1&-1 \end{pmatrix}\!.

Полученные разными способами результаты, разумеется, совпадают.




Интерполяционный способ нахождения функции от матрицы


Рассмотрим сначала частный случай, когда все корни минимального многочлена простые: \textstyle{\mu_A(\lambda)= \prod\limits_{i=1}^{\nu}(\lambda-\lambda_i)} . В этом случае значения функции на спектре матрицы A — это совокупность значений функции f(\lambda) в точках \lambda_1,\lambda_2,\ldots,\lambda_{\nu}: f(\Lambda)=\{f(\lambda_1),f(\lambda_2),\ldots,f(\lambda_{\nu})\}. Обозначим через r(\lambda) интерполяционный многочлен Лагранжа:


r(\lambda)=\sum_{i=1}^{\nu}\frac{(\lambda-\lambda_1)\cdot\ldots \cdot(\lambda- \lambda_{i-1})\cdot (\lambda-\lambda_{i+1})\cdot \ldots\cdot(\lambda-\lambda_{\nu})}{(\lambda_i- \lambda_1)\cdot\ldots \cdot(\lambda_i-\lambda_{i-1})\cdot (\lambda_i-\lambda_{i+1})\cdot \ldots\cdot (\lambda_i-\lambda_{\nu})}\cdot f(\lambda_i),
(7.60)

для которого r(\lambda_i)= f(\lambda_i),~ i=1,2,\ldots,\nu. Тогда


f(A)= r(A)=\sum_{i=1}^{\nu}\frac{(A-\lambda_1E)\cdot\ldots \cdot(A- \lambda_{i-1}E)\cdot (A-\lambda_{i+1}E)\cdot \ldots\cdot(A-\lambda_{\nu}E)}{(\lambda_i- \lambda_1)\cdot\ldots \cdot(\lambda_i-\lambda_{i-1})\cdot (\lambda_i-\lambda_{i+1})\cdot \ldots\cdot (\lambda_i-\lambda_{\nu})}\cdot f(\lambda_i).

Таким образом, для нахождения функции f(\lambda) от матрицы A в случае простых корней минимального многочлена, нужно выполнить следующие действия.


1. Найти минимальный многочлен \mu_A(\lambda) одним из способов, рассмотренных ранее. Убедиться в том, что все корни \lambda_1,\lambda_2,\ldots,\lambda_v минимального многочлена простые.


2. Вычислить значения f(\lambda_1),f(\lambda_2), \ldots,f(\lambda_v) функции на спектре матрицы A и составить по формуле (7.60) интерполяционный многочлен Лагранжа r(\lambda).


3. Найти значение функции от матрицы f(A)=r(A).




Пример 7.22. Найти функцию f(\lambda)=e^{\lambda} от матрицы C=\begin{pmatrix} 1&1&1\\1&1&1\\ 1&1&1\end{pmatrix}.


Решение. Интерполяционный способ (случай простых корней). 1. Минимальный многочлен найден в примере 7.12: \mu_C(\lambda)=\lambda(\lambda-3). Все его корни \lambda_1=0, \lambda_2=3 простые.


2. Находим значения функции на спектре матрицы f(0)=1,~f(3)=e^3. Составляем по формуле (7.60) интерполяционный многочлен Лагранжа:


r(\lambda)=\frac{\lambda-3}{0-3}\cdot1+ \frac{\lambda-0}{3-0}\cdot e^3=\frac{e^3-1}{3}\cdot\lambda+1.

3. Находим функцию от матрицы C:


f(C)=e^C=r(C)= \frac{e^3-1}{3}\cdot\! \begin{pmatrix} 1&1&1\\1&1&1\\ 1&1&1 \end{pmatrix}+ \begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}= \frac{1}{3}\cdot\! \begin{pmatrix} e^3+2& e^3-1& e^3-1\\ e^3-1& e^3+2& e^3-1\\ e^3-1& e^3-1& e^3+2 \end{pmatrix}\!.



Рассмотрим общий случай, когда минимальный многочлен (7.54)


\nu_A(\lambda)=(\lambda-\lambda_1)^{m_1}\cdot (\lambda-\lambda_2)^{m_2} \cdot\ldots\cdot (\lambda-\lambda_k)^{m_k}

имеет кратные корни: \lambda_1 — корень кратности от m_1, \lambda_2 — корень кратности m_2 и т.д. Степень \nu минимального многочлена не превосходит порядка n матрицы A: \nu=m_1+m_2+\ldots+m_k\leqslant n.


Многочлен r(\lambda) степени меньшей, чем \nu, удовлетворяющий условиям:


f(\lambda_i)=r(\lambda_i),~~ f'(\lambda_i)=r'(\lambda_i),~~ \ldots,~~ f^{(m_i-1)}(\lambda_i)=r^{(m_i-1)}(\lambda_i),~~i=1,2,\ldots,k,

называется интерполяционным многочленом Лагранжа-Сильвестра для функции f(\lambda), определенной на спектре матрицы A.


Многочлен Лагранжа-Сильвестра однозначно определяется значениями функции на спектре матрицы и находится по формуле:


r(\lambda)= \sum_{i=1}^{k}\Bigl[r_{i\,0}+ r_{i\,1}(\lambda-\lambda_i)+ \ldots+ r_{i\,m_i-1}(\lambda-\lambda_i)^{m_i-1}\Bigr]\cdot\psi_i(\lambda),
(7.61)

где \psi_i(\lambda) — многочлен, равный отношению минимального многочлена и соответствующего элементарного делителя: \psi_i(\lambda)= \frac{\mu_A(\lambda)}{(\lambda-\lambda_i)^{m_i}}, а выражение в квадратных скобках равно сумме первых от, членов разложения функции \frac{f(\lambda)}{\psi_i(\lambda)} по формуле Тейлора, то есть


r_{ij}=\frac{1}{j!}\cdot\! \left.{\frac{d^j}{d \lambda^j}\! \left[\frac{f(\lambda)}{\psi_i(\lambda)}\right]}\!\right|_{\lambda=\lambda_i},\quad j=0,1,\ldots, m_i-1;~i=1,2,\ldots,k



Замечания 7.10.


1. Если минимальный многочлен имеет один корень (кратности \nu): \mu_A(\lambda)=(\lambda-\lambda_1)^{\mu} то многочлен Лагранжа-Сильвестра совпадает с многочленом Тейлора. Действительно, в этом случае k=1, m_1=\nu, \psi_1(\lambda)=1 , поэтому формула (7.61) принимает вид


r(\lambda)= f(\lambda_i)+ \frac{1}{1!}\cdot f'(\lambda_1)\cdot (\lambda-\lambda_1)+\ldots +\frac{1}{(\nu-1)!}\cdot f^{(\nu-1)}(\lambda_1)\cdot(\lambda-\lambda_1)^{\nu-1},

что совпадает с первыми \nu членами ряда Тейлора.


2. Если все корни минимального многочлена простые: \textstyle{\mu_A(\lambda)}= \prod\limits_{i=1}^{k}(\lambda-\lambda_i), тогда


\nu=k,\quad m_1=m_2=\ldots=m_k=1,\quad \psi_i(\lambda)= (\lambda-\lambda_1)\cdot\ldots \cdot(\lambda-\lambda_{i-1})\cdot (\lambda-\lambda_{i+1})\cdot \ldots\cdot(\lambda-\lambda_k),

поэтому формула (7.61) принимает вид (7.60), т.е. многочлен Лагранжа-Сильвестра совпадает с многочленом Лагранжа.


Для нахождения функции f(x) от матрицы A при наличии кратных корней минимального многочлена нужно выполнить следующие действия.


1. Найти минимальный многочлен матрицы A одним из способов, рассмотренных ранее:


\mu_A(\lambda)= (\lambda-\lambda_1)^{m_1}\cdot (\lambda-\lambda_2)^{m_2}\cdot \ldots\cdot (\lambda-\lambda_k)^{m_k}

2. Для каждого корня \lambda_i кратности m_i~(i=1,2,\ldots,k) найти многочлен \psi_i(\lambda)= \frac{\mu_A(\lambda)}{(\lambda-\lambda_i)^{m_i}} и вычислить коэффициенты r_{ij} разложения функции \frac{f(\lambda)}{\psi_i(\lambda)} в точке \lambda_i по формуле Тейлора:


r_{ij}=\frac{1}{j!}\cdot\! \left.{\frac{d^j}{d\lambda^j}\! \left[\frac{f(\lambda)}{\psi_i(\lambda)}\right]}\right|_{\lambda=\lambda_i},\quad j=0,1,\ldots,m_i-1;~~ i=1,2,\ldots,k.

3. Составить по формуле (7.61) интерполяционный многочлен r(\lambda) Лагранжа-Сильвестра.


4. Найти значение функции от матрицы f(A)=r(A).




Пример 7.23. Найти функцию f(\lambda)=e^{\lambda} от матрицы D= \begin{pmatrix} -2&5&-3\\ -2&5&-3\\ 1&-1&0 \end{pmatrix}.


Решение. Интерполяционный способ (случай кратных корней). 1. Минимальный многочлен найден в примере7.15: \mu_D(\lambda)=e_3(\lambda)= \lambda^2(\lambda-3). Корень \lambda_1=0 — двойной, а \lambda_2=3 — простой, т.е. количество различных корней k=2, кратности корней m_1=2,~m_2=1.


2. Для двойного корня \lambda_1=0 находим многочлен \psi_1(\lambda)= \frac{\mu_D(\lambda)}{(\lambda-0)^2}=\lambda-3 и соответствующие коэффициенты


\left.{r_{1\,0}=\frac{e^{\lambda}}{\lambda-3}}\right|_{\lambda=0}=-\frac{1}{3}\,;\quad \left.{r_{1\,1}= \frac{1}{1!}\cdot \frac{d}{d\lambda} \frac{e^{\lambda}}{\lambda-3}}\right|_{\lambda=0}= \left.{\frac{e^{\lambda}(\lambda-3)-e^{\lambda}}{(\lambda-3)^2}}\right|_{\lambda=0}= -\frac{4}{9}\,.

Для простого корня \lambda_2=3 находим многочлен \psi_2(\lambda)= \frac{\mu_D(\lambda)}{\lambda-3}=\lambda^2 и коэффициент \left.{r_{2\,0}=\frac{e^{\lambda}}{\lambda}}\right|_{\lambda=3}= \frac{e^3}{9}.


3. Составляем по формуле (7.61) интерполяционный многочлен Лагранжа–Сильвестра:


r(\lambda)= \Bigl[r_{1\,0}+r_{1\,1}(\lambda-\lambda_1)\Bigr]\psi_1(\lambda)+ r_{2\,0}\psi_2(\lambda)= \left(-\frac{1}{3}-\frac{4}{9}\lambda\right)\!(\lambda-3)+ \frac{e^3}{9}\lambda^2= \frac{e^3-4}{9}\lambda^2+\lambda+1.

4. Находим функцию от матрицы D:


\begin{aligned}f(D)&=e^D=\frac{e^3-4}{9}\,D^2+D+E= \frac{e^3-4}{9}\cdot\! \begin{pmatrix}-9&18&-9\\ -9&18&-9\\ 0&0&0 \end{pmatrix}+\\[2pt] &+ \begin{pmatrix}-2&5&-3\\ -2&5&-3\\ 1&-1&0 \end{pmatrix}+ \begin{pmatrix}1&0&0\\0&1&0\\ 0&0&1\end{pmatrix}= \begin{pmatrix} 3-e^3&2e^3-3&1-e^3\\ 2-e^3&2e^3-2&1-e^3\\ 1&-1&1 \end{pmatrix}\!.\end{aligned}

Проверим полученный результат, используя первый способ нахождения функции от матрицы.


1. В примере 7.15 были найдены жорданова форма матрицы D и преобразующая матрица S:


J_D=\begin{pmatrix} 0&1&0\\ 0&0&0\\ 0&0&3 \end{pmatrix}\!;\quad S=\frac{1}{9}\! \begin{pmatrix}3&5&9\\ 3&2&9\\ 3&-1&0\end{pmatrix}\!;\quad S^{-1}= \begin{pmatrix} 1&-1&3\\ 3&-3&0\\ -1&2&-1\end{pmatrix}\!.

2. Жорданова форма J_D состоит из двух жордановых клеток 2-го и 1-го порядков J_D=\operatorname{diag}\Bigl(J_2(0),\,J_1(3)\Bigr), соответствующих собственным значениям \lambda=0 и \lambda=3. Найдем значения функции на спектре матрицы: f(0)=1, f'(0)=1 и f(3)=e^3. Запишем функцию от жордановой формы


f(J_D) =\operatorname{diag}\Bigl(J_2(0),\,J_1(3)\Bigr)= \begin{pmatrix}1&1&0\\ 0&1&0\\ 0&0&e^3 \end{pmatrix}\!.

Найдем функцию от матрицы D:


f(D)=e^D=S\,f(J_D)\,S^{-1}= \frac{1}{9}\!\begin{pmatrix} 3&5&9\\ 3&2&9\\ 3&-1&0\end{pmatrix}\!\cdot\! \begin{pmatrix} 1&1&0\\ 0&1&0\\ 0&0&e^3 \end{pmatrix}\! \cdot\! \begin{pmatrix} 1&-1&3\\ 3&-3&0\\ -1&2&-1 \end{pmatrix} =\begin{pmatrix} 3-e^3& 2e^3-3&1-e^3\\ 2-e^3&2e^3-2&1-e^3\\ 1&-1&1\end{pmatrix}\!.

Результаты, полученные разными способами, совпадают.




Свойства функций от матриц


Многие свойства функций скалярного аргумента распространяются на функции от матриц. Рассмотрим некоторые из них.


1. Если функция f(\lambda) разлагается в степенной ряд


f(\lambda)=\sum_{k=0}^{\infty}c_k(\lambda-\lambda_0)^k,
(7.62)

сходящийся в круге |\lambda-\lambda_0|<R, то для любой матрицы A, собственные значения которой лежат внутри круга сходимости, справедливо разложение


f(A)=\sum_{k=0}^{\infty}c_k(A-\lambda_0E)^k.
(7.63)

Здесь предел последовательности матриц (частичных сумм ряда) понимается поэлементно, как совокупность пределов элементов матрицы. Напомним, что (A-\lambda_0E)^0=E.


В самом деле, степенной ряд можно почленно дифференцировать любое число раз внутри круга сходимости. Поэтому функция f(\lambda) определена на спектре любой матрицы, собственные значения которой лежат внутри круга сходимости.


Из свойства 1 следуют, например, разложения в ряд (7.62) при c_k= \left.{\frac{1}{k!} \frac{d^kf(\lambda)}{d\lambda^k}} \right|_{\lambda=\lambda_0},~ \lambda_0=0:


\begin{aligned} e^A&= E+ \frac{1}{1!}\,A+ \frac{1}{2!}\,A^2+\ldots+ \frac{1}{k!}\,A^k+\ldots\,;\\[5pt] \cos{A}&= E- \frac{1}{2!}\,A+\frac{1}{4!}\,A^2+ \ldots+ \frac{(-1)^k}{(2k)!}\,A^{2k}+\ldots\,;\\[5pt] \sin{A}&= \frac{1}{1!}\,A-\frac{1}{3!}\,A^3+ \ldots+ \frac{(-1)^k}{(2k+1)!}\,A^{2k+1}+\ldots\,.\end{aligned}

справедливые для любой квадратной матрицы A.


2. Если функция f(\lambda) разлагается в степенной ряд, а собственные значения функциональной матрицы At при всех t лежат внутри круга сходимости этого ряда, то определена сложная функция f(At), производная которой находится по формуле:


\frac{df(At)}{dt}=A\cdot\frac{df(At)}{d \lambda}\,.

В самом деле, подставим в ряд (7.62) вместо \lambda матрицу At:


f(At)=\sum_{k=0}^{\infty}c_k(At-\lambda_0E)^k.

Найдем производную этой матричной функции. Учитывая, что многочлены от одной и той же матрицы перестановочны, по правилу 3 дифференцирования произведения матриц получаем


\begin{aligned}\frac{d(At-\lambda_0E)^2}{dt}&= \frac{d(At-\lambda_0E)}{dt}\cdot ( At-\lambda_0E)+ (At-\lambda_0E)\cdot \frac{d(At-\lambda_0E)}{dt}=\\[2pt] &= A(At-\lambda_0E)+( At-\lambda_0E)A= 2A(At-\lambda_0E),\\[5pt] \frac{d(At-\lambda_0E)^3}{dt}&= \frac{d(At- \lambda_0E)^2}{dt} \cdot(At-\lambda_0E)+ (At-\lambda_0E)^2\cdot \frac{d(At-\lambda_0E)}{dt}=\\[2pt] &=2A(At-\lambda_0E)^2+ (At-\lambda_0E)^2A= 3A(At-\lambda_0E)^2~\ldots \end{aligned}

то есть \frac{d(At-\lambda_0E)^k}{dt}= kA(At-\lambda_0E)^{k-1}. Поэтому \frac{df(At)}{dt}=A\cdot \sum_{k=1}^{\infty} kc_k(At-\lambda_0E)^{k-1}..


Сравнивая полученный ряд с производной \frac{df(\lambda)}{dt}= \sum_{k=1}^{\infty} kc_k(At-\lambda_0E)^{k-1} ряда (7.62) при подстановке вместо \lambda матрицы At, приходим к доказываемому равенству.




Пример 7.24. Используя разложение в степенной ряд, найти матричную функцию


f(D)=e^D, где D=\begin{pmatrix} -2&5&-3\\ -2&5&-3\\ 1&-1&0 \end{pmatrix}\!.

Решение. Запишем степенной ряд (7.63)


\begin{gathered} e^D=E+\frac{1}{1!}\,D+ \frac{1}{2!}\,D^2+ \ldots+ \frac{1}{k!}\, D^k+\ldots= \begin{pmatrix}1&0&0\\ 0&1&0\\ 0&0&1 \end{pmatrix}+ \begin{pmatrix}-2&5&-3\\ -2&5&-3\\ 1&-1&0\end{pmatrix}+\\[2pt] \frac{9}{2!}\! \begin{pmatrix} -1&2&-1\\ -1&2&-1\\ 0&0&0 \end{pmatrix}+ \frac{27}{3!}\! \begin{pmatrix}-1&2&-1\\ -1&2&-1\\ 0&0&0\end{pmatrix}+\ldots+ \frac{3^k}{k!}\! \begin{pmatrix} -1&2&-1\\ -1&2&-1\\ 0&0&0\end{pmatrix}+\ldots=\\[2pt] =\begin{pmatrix} -1&5&-3\\ -2&6&-3\\ 1&-1&1 \end{pmatrix}+ \begin{pmatrix}-1&2&-1\\ -1&2&-1\\ 0&0&0\end{pmatrix}\!\cdot\! \begin{pmatrix}\dfrac{9}{2!}+ \dfrac{27}{3!}+\ldots+ \dfrac{3^k}{k!}+\ldots\end{pmatrix}\!.\end{gathered}

Учитывая разложение e^3=1+\frac{3}{1!}+\frac{9}{2!}+\ldots+\frac{3^k}{k!}+\ldots, получаем


e^D=\begin{pmatrix}-1&5&-3\\ -2&6&-3\\ 1&-1&1\end{pmatrix}+ \begin{pmatrix} -1&2&-1\\ -1&2&-1\\ 0&0&0\end{pmatrix}\!\cdot(e^3-4)= \begin{pmatrix} 3-e^3&2e^3-3&1-e^3\\ 2-e^3&2e^3-2&1-e^3\\ 1&-1&1\end{pmatrix}\!.

Результат совпадает с полученным в примере 7.23.




Применение функций от матриц для решения систем дифференциальных уравнений


Рассмотрим систему линейных дифференциальных уравнений с постоянными коэффициентами


\begin{cases} \dfrac{dx_1(t)}{dt}= a_{11}x_1(t)+ a_{12}x_2(t)+ \ldots+ a_{1n}x_n(t)+f_1(t),\\ \cdots\cdots\cdots\cdots\cdots\\ \dfrac{dx_n(t)}{dt}= a_{n1}x_1(t)+ a_{n2}x_2(t)+ \ldots+a_{nn}x_n(t)+f_n(t). \end{cases}
(7.64)

где a_{ij} — коэффициенты системы, f_i(t) — заданные, a x_i(t) — неизвестные функции аргумента t\in[t_0;+\infty). При описании непрерывных динамических систем аргумент t обозначает время.


Систему (7.64) можно записать в матричном виде:


\frac{dx(t)}{dt}=A\cdot x(t)+f(t),
(7.65)

где A — квадратная матрица n-го порядка, f(t)=\begin{pmatrix} f_1(t)&\cdots&f_n(t)\end{pmatrix}^T — столбец заданных функций, a x(t)=\begin{pmatrix} x_1(t)&\cdots&x_n(t)\end{pmatrix}^T — столбец неизвестных.


Решением системы (7.65) называют столбец x(t)=\begin{pmatrix} x_1(t)& \cdots& x_n(t) \end{pmatrix}^T дифференцируемых функций, при подстановке которых в (7.65) получаются верные равенства, тождественно выполняющиеся при t\in[t_0;+\infty).


Поставим задачу нахождения решения системы (7.65), удовлетворяющего начальным условиям


x(t_0)=x_0,
(7.66)

где x_0=\begin{pmatrix} x_{10}&\cdots& x_{n0}\end{pmatrix}^T — заданный столбец.


Как известно, решение системы (7.65) с начальными условиями (7.66) имеет вид:


x(t)=\exp[A(t-t_0)]\cdot x_0\int\limits_{t_0}^{t}\exp[A(t-\tau)]\cdot r(\tau)\,d\tau\,.
(7.67)

В самом деле, найдем производную функции (7.67). Применяя правило Лейбница


\frac{d}{dt}\int\limits_{u(t)}^{v(t)}f(t,\tau)\,d\tau= \int\limits_{u(t)}^{v(t)}\frac{\partial f(t,\tau)}{\partial t}\,d\tau+ f(t,v(t))\,\frac{dv}{dt}- f(t,u(t))\,\frac{du}{dt}

и свойство 2 функций от матриц, получаем


\frac{dx(t)}{dt}= A\cdot \exp[A(t-t_0)]\cdot x_0+ \int\limits_{t_0}^{t} A\exp[A(t-\tau)] f(\tau)\,d\tau+ f(t)= A\cdot x(t)+f(t),

т.е. x(t) является решением системы (7.65). При t=t_0 формула (7.67) дает x(t_0)=e^{O}x_0=Ex_0=x_0, где O — нулевая, а E — единичная матрицы. Равенство e^{O}=E следует, например, из разложения в ряд функции e^{A}. Следовательно, решение (7.67) удовлетворяет и начальным условиям (7.66).


Поэтому для нахождения решения нужно выполнить следующие действия.


1. Найти выражение для функции e^{At} одним из способов, рассмотренных ранее.

2. Записать искомое решение по формуле (7.67).




Замечания 7.11.


1. Нахождение функции f(\lambda) от функциональной матрицы At облегчается, если учитывать, что собственные значения \lambda_i(t) матрицы At пропорциональны собственным значениям \lambda_i матрицы A\colon\,\lambda_1(t)=t\,\lambda_i. Действительно, характеристический многочлен матрицы At имеет вид


\begin{aligned} \Delta_{At}(\lambda)= \det(At-\lambda E)&= \det\!\left[(tE)\! \left(A- \frac{\lambda}{t}\,E\right)\right]= \det(tE)\cdot \det\!\left(A-\frac{\lambda}{t}\,E\right)=\\[2pt] &=t^n\cdot \det\!\left(A-\frac{\lambda}{t}\,E\right)= t^n\cdot \Delta_{A}\!\left(\frac{\lambda}{t}\right)\!. \end{aligned}

Поэтому, если число \lambda_i — корень характеристического многочлена матрицы A\colon\,\Delta_{A}(\lambda_i)=0, то число \lambda=t\,\lambda_i — корень многочлена \Delta_{At}(\lambda), причем той же кратности. Такая же связь между корнями минимальных многочленов \mu_{A}(\lambda) и \mu_{At} (\lambda): если \lambda_i — корень минимального многочлена \mu_{A} (\lambda), то \lambda=t\,\lambda_i — корень минимального многочлена \mu_{At}(\lambda).


2. Решение линейного дифференциального уравнения с постоянными коэффициентами a_nx^{(n)}(t)+ \ldots+a_1x'(t)+a_0x(t)=b_0(t) сводится к решению системы вида (7.64), получающейся после замены x_1(t)=x(t), x_2(t)=x'(t),\,\ldots, x_n(t)=x^{(n-1)}(t).


3. Для нахождения функции \exp[A(t-\tau)] можно использовать следующий способ. Найти n линейно независимых решений \varphi_1(t),\ldots, \varphi_n(t) однородной системы \frac{dx(t)}{dt}=Ax(t) и составить из этих столбцов фундаментальную матрицу \varphi(t)= \begin{pmatrix} \varphi_1(t)&\cdots &\varphi_n(t)\end{pmatrix} системы (7.65). В силу линейной независимости столбцов \varphi_1(t),\ldots, \varphi_n(t) определитель фундаментальной матрицы (определитель Вронского) отличен от нуля: \det\varphi(t)\ne0 для t\geqslant t_0. Поэтому определена обратная матрица \varphi^{-1}(t). Функция \exp[A(t-\tau)] (называемая матрицей Коши, или переходной матрицей) может быть найдена по формуле


\exp[A(t-\tau)]= \varphi(t)\cdot \varphi^{-1}(\tau).



Пример 7.25. Найти решение системы дифференциальных уравнений, удовлетворяющее начальным условиям x_1(0)=1, x_2(0)=2, матричным способом:


\begin{cases} \dfrac{dx_1(t)}{dt}= 4x_1(t)+4x_2(t)+4,\\[8pt] \dfrac{dx_2(t)}{dt}=-x_1(t)-2. \end{cases}

Решение. 1. Составим матрицу A коэффициентов системы: A=\begin{pmatrix} 4&4\\-1&0\end{pmatrix} и функцию f(t)=\begin{pmatrix} 4\\-2 \end{pmatrix}. Найдем выражение для функции e^{\lambda} от матрицы \lambda=At (т.е. функции e^{At}), используя второй способ нахождения функции от матрицы. Минимальный многочлен \mu_A(\lambda)=(\lambda-2)^2 матрицы A был найден в примере 7.18. Согласно пункту 1 замечаний 7.11, минимальный многочлен матрицы At имеет вид \mu_{At}(\lambda)=(\lambda-2t)^2. Степень \nu минимального многочлена равна 2. Значит, многочлен (7.44) линейный: r(\lambda)=r_1\lambda+r_0. Для двойного корня \lambda=\lambda_1=2t (m_1=2) составляем уравнения (7.46) (см. пример 7.21): \begin{cases} e^{2t}= r_1\cdot2t+r_0,\\ e^{2t}=r_1.\end{cases}


Решая систему, получаем r_1=e^{2t},~r_0=e^{2t}(1-2t) и r(\lambda)= e^{2t}\lambda+ e^{2t}(1-2t). Находим функцию e^{\lambda} от матрицы AT:


e^{At}= r(At)= r_1At+r_0E= e^{2t}\cdot\! \begin{pmatrix}4&4\\-1&0 \end{pmatrix}\!\cdot t+e^{2t}()\cdot\! \begin{pmatrix}1&0\\ 0&1 \end{pmatrix}= e^{2t}\cdot\! \begin{pmatrix} 1+2t&4t\\ -t&1-2t\end{pmatrix}\!.

По формуле (7.67) записываем искомое решение (t_0=0)\colon


\begin{aligned} x(t)&= e^{2t}\! \begin{pmatrix}1+2t&4t\\ -t&1-2t \end{pmatrix}\!\cdot\! \begin{pmatrix}1\\2\end{pmatrix}+ \int\limits_{0}^{t}e^{2(t-\tau)}\! \begin{pmatrix} 1+2(t-\tau)& 4(t-\tau)\\ -(t-\tau)&1-2(t-\tau) \end{pmatrix}\!\! \begin{pmatrix}4\\-2\end{pmatrix}\!d\tau=\\ &=e^{2t}\! \begin{pmatrix}1+10t\\2-5t\end{pmatrix}+ \int\limits_{0}^{t}e^{2(t-\tau)}\! \begin{pmatrix} 4\\-2 \end{pmatrix}\!d\tau= e^{2t}\! \begin{pmatrix}1+10t\\2-5t\end{pmatrix}- \frac{1}{2}\! \begin{pmatrix} 4\\-2\end{pmatrix}\!\cdot \Bigl.{e^{2(t-\tau)}}\Bigr|_{\tau=0}^{\tau=t}=\\[2pt] &= e^{2t}\! \begin{pmatrix}1+10t\\2-5t\end{pmatrix}- \frac{1}{2}\! \begin{pmatrix} 4\\-2 \end{pmatrix}\! \cdot(1-e^{2t})= e^{2t}\! \begin{pmatrix} 3+10t\\ 1-5t\end{pmatrix}+ \begin{pmatrix} -2\\1 \end{pmatrix}\!. \end{aligned}
Математический форум (помощь с решением задач, обсуждение вопросов по математике).
Кнопка "Поделиться"
Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.

Часовой пояс: UTC + 3 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2021 MathHelpPlanet.com. All rights reserved