Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Теорема Гамильтона-Кэли. Минимальный многочлен матрицы
ОглавлениеЛинейная алгебра

Теорема Гамильтона-Кэли. Минимальный многочлен матрицы


Многочлен [math]p(\lambda)[/math] переменной [math]\lambda[/math] называется аннулирующим для квадратной матрицы [math]A[/math], если при подстановке в многочлен матрицы [math]A[/math] вместо переменной [math]\lambda[/math] получаем нулевую матрицу, т.е. [math]p(A)=O[/math].


Напомним, что для любой квадратной матрицы [math]A[/math] многочлен [math]\Delta_{A}(\lambda)=\det(A-\lambda E)[/math] называется характеристическим.


Теорема 7.7 Гамильтона–Кэли. Характеристический многочлен матрицы является аннулирующим для нее, т.е. [math]\Delta_{A}(A)=O[/math].


В самом деле, обозначим через [math](A-\lambda E)^{+}[/math] матрицу, присоединенную к характеристической матрице [math](A-\lambda E)[/math]. Тогда из (7.7) следует


[math](A-\lambda E)\cdot(A-\lambda E)^{+}=\Delta_{A}(\lambda)\cdot E,\quad (A-\lambda E)^{+}\cdot(A-\lambda E)=\Delta_{A}(\lambda)\cdot E.[/math]
(7.27)

Правые части этих равенств можно рассматривать как многочлены с матричными коэффициентами (каждый коэффициент характеристического многочлена умножается на единичную матрицу). Из (7.27) следует, что λ-матрица [math]\Delta_{A}(\lambda)E[/math] делится на [math](A-\lambda E)[/math] слева и справа без остатка, т.е. остаток равен нулевой матрице. По обобщенной теореме Безу остаток равен левому и правому значениям многочлена [math]\Delta_{A}(\lambda)E[/math] при подстановке матрицы [math]A[/math] вместо [math]A[/math]. Отсюда получаем [math]\Delta_{A}(\lambda)E=O[/math], т.е. [math]\Delta_{A}(\lambda)=O[/math], что и требовалось доказать.




Пример 7.11. Показать, что характеристический многочлен матрицы [math]A=\begin{pmatrix} 1&1&1\\ 1&1&1\\ 1&1&1 \end{pmatrix}[/math] является для нее аннулирующим.


Решение. Находим характеристический многочлен матрицы (см. пример 7.8)


[math]\Delta_{A}(\lambda)=\det(A-\lambda E)= \begin{vmatrix}1-\lambda&1&1\\1&1-\lambda&1\\1&1&1-\lambda\end{vmatrix}= (1-\lambda)^3+2-3(1-\lambda)=3 \lambda^2-\lambda^3.[/math]

Подставляя вместо переменной [math]\lambda[/math] матрицу [math]A[/math], получаем


[math]\Delta_{A}=3A^2-A^3= 3\! \begin{pmatrix} 1&1&1\\ 1&1&1\\ 1&1&1\end{pmatrix}^2-\begin{pmatrix} 1&1&1\\ 1&1&1\\ 1&1&1 \end{pmatrix}^3= 3\! \begin{pmatrix}3&3&3\\3&3&3\\ 3&3&3 \end{pmatrix}- \begin{pmatrix}9&9&9\\9&9&9\\9&9&9\end{pmatrix}=O.[/math]
что и требовалось показать.



Теорема Гамильтона-Кэли говорит о том, что для квадратной матрицы [math]A[/math] n-го порядка всегда найдется аннулирующий многочлен n-й степени (характеристический многочлен имеет n-ю степень). Возникает вопрос о существовании аннулирующего многочлена меньшей степени.


Минимальным многочленом матрицы [math]A[/math] называется ее аннулирующий многочлен наименьшей степени (со старшим коэффициентом, равным единице). Минимальный многочлен будем обозначать [math]\mu_{A}(\lambda)[/math].




Свойства минимального многочлена матрицы


1. Любой аннулирующий многочлен матрицы делится на минимальный многочлен (без остатка). В частности, характеристический многочлен делится на минимальный многочлен.


Действительно, предположим противное, пусть аннулирующий многочлен [math]p(\lambda)[/math] делится на минимальный многочлен [math]\mu_{A}(\lambda)[/math] с остатком:


[math]p(\lambda)=q(\lambda)\cdot\mu_{A}(\lambda)+r(\lambda),[/math]

причем степень остатка [math]r(\lambda)[/math] меньше степени делителя [math]\mu_{A}(\lambda)[/math]. Тогда, подставляя вместо [math]\lambda[/math] матрицу [math]A[/math], получаем [math]r(A)=O[/math], так как [math]p(A)=O[/math] и [math]\mu_{A}(\lambda)=O[/math]. Следовательно, [math]r(\lambda)[/math] — аннулирующий многочлен, степень которого меньше, чем степень минимального многочлена, что противоречит определению минимального многочлена. Таким образом, предположение оказалось ложным, т.е. любой аннулирующий многочлен делится на минимальный (без остатка). Поскольку по теореме Гамильтона-Кэли характеристический многочлен является аннулирующим, то он также делится на минимальный многочлен.

2. Для каждой квадратной матрицы [math]A[/math] минимальный многочлен единственный.


В самом деле, если бы существовали два минимальных многочлена, то они имели бы одну и ту же степень и делились бы друг на друга, т.е. отличались бы только постоянным множителем. Однако, старшие коэффициенты этих многочленов равны единице, поэтому такие многочлены совпадают.


3. Все собственные значения матрицы являются корнями минимального многочлена.


Действительно, из равенства [math]\mu_{A}(\lambda)=O[/math] следует, что λ-матрица [math]\mu_{A}(\lambda)\cdot E[/math] делится (например, слева) на характеристическую матрицу [math](A-\lambda E)[/math], то есть [math]\mu_{A}(\lambda)\cdot E=(A-\lambda E)\cdot S(\lambda)[/math], где [math]S(\lambda)[/math] — некоторая λ-матрица (левое частное). Найдем определитель левой и правой частей последнего равенства с учетом теоремы 2.2 и пункт З замечаний 2.2:


[math][\mu_{A}(\lambda)]^n=\Delta_{A}(\lambda)\cdot\det{S(\lambda)}.[/math]
(7.28)

Подставляя в равенство (7.28) любой корень [math]\lambda_i,~i=1,\ldots,n[/math] характеристического многочлена, получаем [math][\mu_{A}(\lambda_i)]^n=0[/math], т.е. [math]\mu_{A}(\lambda_i)=0[/math], что и требовалось показать.


4. Если характеристический многочлен имеет вид (7.24), то минимальный многочлен этой матрицы можно представить в форме


[math]\mu_{A}(\lambda)= (\lambda-\lambda_1)^{m_1}\cdot (\lambda-\lambda_2)^{m_2}\cdot\ldots\cdot(\lambda-\lambda_k)^{m_k},[/math]
(7.29)

где [math]1\leqslant m_1\leqslant n_1,~1\leqslant m_2\leqslant n_2[/math] и т.д., причем [math]m_1+m_2+\ldots+m_k=m\leqslant n[/math].


Это утверждение следует из свойства 3.


5. Минимальный многочлен матрицы [math]A[/math] находится по формуле


[math]\mu_{A}(\lambda)=\frac{(-1)^n\Delta_A(\lambda)}{d_{n-1}(\lambda)}\,,[/math]
(7.30)

где [math]d_{n-1}(\lambda)[/math] — наибольший общий делитель миноров (n-1)-го порядка характеристической матрицы [math](A-\lambda E)[/math].


Действительно, по свойству 1 характеристический многочлен [math]\Delta_{A}(\lambda)[/math] делится на минимальный многочлен, т.е. [math]\Delta_{A}(\lambda)=(-1)^n p(\lambda)\mu_{A}(\lambda)[/math], где [math]p(\lambda)[/math] — некоторый многочлен со старшим коэффициентом, равным единице. Умножив обе части равенства [math]\mu_{A}(\lambda)\cdot E=(A-\lambda E)\cdot S(\lambda)[/math] (см. свойство 3) на [math](-1)^n p(\lambda)[/math], получим в левой части характеристический многочлен, умноженный на единичную матрицу:


[math]\Delta_{A}(\lambda)\cdot E=(-1)^n\cdot(A-\lambda E)\cdot p(\lambda)\cdot S(\lambda).[/math]

Сравним это равенство с (7.27):

[math]\Delta_A(\lambda)\cdot E=(A-\lambda E)\cdot(A-\lambda E)^{+}.[/math]
(7.31)

При делении λ-матрицы [math]\Delta_A(\lambda)\cdot E[/math] слева на характеристическую матрицу [math](A-\lambda E)[/math] частные (левые) должны совпадать в силу единственности деления. Поэтому


[math](-1)^n\cdot p(\lambda)\cdot S(\lambda)=(A-\lambda E)^{+},[/math]

т.е. многочлен [math]p(\lambda)[/math] — делитель всех элементов присоединенной матрицы. Заметим, что степень многочлена [math]p(\lambda)[/math] должна быть максимальной, так как минимальный многочлен [math]\mu_A(\lambda)[/math] имеет наименьшую возможную степень, а сумма степеней этих двух многочленов в силу равенства [math]\Delta_A(\lambda)=(-1)^n p(\lambda) \mu_A(\lambda)[/math] фиксирована и равна [math]n[/math]. Поэтому многочлен [math]p(\lambda)[/math] — это наибольший общий делитель элементов присоединенной матрицы [math](A-\lambda E)^{+}[/math]. Так как элементы присоединенной матрицы пропорциональны минорам (n-1)-го порядка характеристической матрицы, то [math]p(\lambda)=d_{n-1}(\lambda)[/math].


Таким образом, [math]\Delta_A(\lambda)=(-1)^n\cdot d_{n-1}(\lambda)\cdot\mu_A(\lambda)[/math], откуда следует формула (7.30).


6. Минимальный многочлен матрицы [math]A[/math] совпадает с последним инвариантным множителем [math]e_n(\lambda)[/math] характеристической матрицы [math](A-\lambda E)[/math].


В самом деле, наибольший общий делитель [math]d_{n}(\lambda)[/math] единственного минора n-го порядка характеристической матрицы [math](A-\lambda E)[/math] отличается от определителя этой матрицы множителем [math](-1)^n[/math], т.е. [math]\Delta_A(\lambda)=(-1)^n d_{n}(\lambda)[/math]. Подставляя это выражение в (7.30), получаем


[math]\mu_A(\lambda)=\frac{(-1)^n\cdot(-1)^n\cdot d_n(\lambda)}{d_{n-1}(\lambda)}=\frac{d_n(\lambda)}{d_{n-1}(\lambda)}=e_n(\lambda).[/math]



Способы нахождения минимального многочлена матрицы


Пусть [math]A[/math] — квадратная матрица n-го порядка. Требуется найти ее минимальный многочлен.


Первый способ.


1. Составить характеристическую матрицу [math](A-\lambda E)[/math].

2. Привести ее к нормальному диагональному виду [math](A-\lambda E)\sim \operatorname{diag} \Bigl(e_1(\lambda),e_2(\lambda), \ldots,e_n(\lambda)\Bigr)[/math].


Последний инвариантный множитель [math]e_n(\lambda)[/math] является минимальным многочленом матрицы [math]A[/math] (по свойству 6).


Второй способ.


1. Составить характеристическую матрицу [math](A-\lambda E)[/math].

2. Найти характеристический многочлен [math]\Delta_A(\lambda)=\det(A-\lambda E)[/math].

3. Найти наибольший общий делитель [math]d_{n-1}(\lambda)[/math] миноров (n-l)-ro порядка λ-матрицы [math](A-\lambda E)[/math].

4. По формуле (7.30) получить минимальный многочлен.




Пример 7.12. Найти минимальный многочлен матрицы [math]A=\begin{pmatrix}1&1&1\\1&1&1\\1&1&1\end{pmatrix}[/math], используя минимальный многочлен, найти степень [math]A^m[/math] с натуральным показателем [math]m\in\mathbb{N}[/math].


Решение. Первый способ. 1. Составляем характеристическую матрицу


[math]A-\lambda E=\begin{pmatrix}1-\lambda &1&1\\1&1-\lambda&1\\1&1&1-\lambda \end{pmatrix}\!.[/math]
(7.30)

2. Приводим эту λ-матрицу к нормальному диагональному виду. Поменяем местами первую и третью строки. Выберем в качестве ведущего элемента единицу, оказавшуюся в левом верхнем углу матрицы. При помощи ведущего элемента делаем равными нулю остальные элементы первой строки и первого столбца:


[math]A-\lambda E=\begin{pmatrix}1-\lambda &1&1\\1&1-\lambda&1\\1&1&1-\lambda \end{pmatrix}\sim \begin{pmatrix}1&1&1-\lambda\\1&1-\lambda&1\\1-\lambda&1&1\end{pmatrix}\sim \begin{pmatrix}1&0&0\\0&-\lambda&\lambda\\0&\lambda&2 \lambda-\lambda^2 \end{pmatrix}\!.[/math]

Берем в качестве ведущего элемент [math](-\lambda)[/math] и делаем равными нулю все остальные элементы второй строки и второго столбца. Затем умножаем вторую и третью строки на (-1), чтобы старшие коэффициенты диагональных элементов оказались равными единице. Получим нормальный диагональный вид:


[math]A-\lambda E\sim\begin{pmatrix}1&0&0\\0&-\lambda&\lambda\\0&\lambda&2 \lambda-\lambda^2 \end{pmatrix}\sim \begin{pmatrix}1&0&0\\ 0&-\lambda&0\\0&0&3 \lambda-\lambda^2 \end{pmatrix}\sim \begin{pmatrix}1&0&0\\ 0&\lambda&0\\ 0&0&\lambda^2-3 \lambda \end{pmatrix}\!.[/math]

Минимальный многочлен матрицы [math]\mu_A(\lambda)=e_3(\lambda)=\lambda^2-3 \lambda[/math].


Второй способ. 1. Составляем характеристическую матрицу (7.32).


2. Находим характеристический многочлен [math]\Delta_A(\lambda)=3 \lambda^2-\lambda^3[/math] (см. пример 7.11).


3. Находим миноры второго порядка характеристической матрицы [math](A-\lambda E)[/math]. Ограничимся минорами, расположенными в первых двух строках:


[math]M_{{}_{1\,2}}^{{}^{1\,2}}=\begin{vmatrix}1-\lambda&1\\ 1&1-\lambda \end{vmatrix}=\lambda^2-2 \lambda,\quad M_{{}_{1\,3}}^{{}^{1\,2}}=\begin{vmatrix}1-\lambda&1\\ 1&1\end{vmatrix}=-\lambda,\quad M_{{}_{2\,3}}^{{}^{1\,2}}=\begin{vmatrix}1&1\\ 1-\lambda&1 \end{vmatrix}=\lambda.[/math]

Выражения для остальных миноров совпадают с найденными. Наибольший общий делитель многочленов [math]\lambda^2-2 \lambda,\,(-\lambda),\, \lambda[/math] равен [math]\lambda[/math], т.е. [math]d_2(\lambda)=\lambda[/math].


4. По формуле (7.30) получаем: [math]\mu_A(\lambda)=\frac{(-1)^3(3 \lambda^2-\lambda^3)}{\lambda}= \lambda^2-3 \lambda[/math].


Для проверки вычислим


[math]\mu_A(A)=A^2-3A= \begin{pmatrix}1&1&1\\1&1&1\\1&1&1\end{pmatrix}^2-3\! \begin{pmatrix}1&1&1\\1&1&1\\1&1&1\end{pmatrix}= \begin{pmatrix}3&3&3\\3&3&3\\ 3&3&3 \end{pmatrix}-3\! \begin{pmatrix}1&1&1\\1&1&1\\1&1&1\end{pmatrix}=O.[/math]

Действительно, минимальный многочлен [math]\mu_A(\lambda)[/math] является аннулирующим, т.е. [math]\mu_A(A)=O[/math]. Заметим, что для матрицы [math]A[/math] минимальный и характеристический многочлены отличаются только множителем [math](-\lambda)[/math].


Найдем теперь степень [math]A^m[/math] матрицы [math]A[/math]. Для этого рассмотрим многочлен [math]\lambda^m[/math]. Разделим его на минимальный многочлен [math]\mu_A(\lambda)[/math]. Остаток от деления (многочлен степени не выше первой) представим в виде [math]\alpha\,\lambda+\beta[/math]. Получим


[math]\lambda^m=p(\lambda)(\lambda^2-3 \lambda)+\alpha\cdot \lambda+\beta,[/math]

где [math]p(\lambda)[/math] — частное, а [math](\alpha\cdot\lambda+\beta)[/math] — остаток. Найдем коэффициенты [math]\alpha[/math] и [math]\beta[/math], подставляя в равенство корни минимального многочлена:


– при [math]\lambda=0[/math] имеем: [math]0^m=p(\lambda) \cdot0+\alpha\cdot0+\beta[/math];

– при [math]\lambda=3[/math] имеем: [math]3^m=p(\lambda) \cdot0+\alpha\cdot3+\beta[/math];


Следовательно, [math]\alpha=3^{m-1},~\beta=0[/math]. Поэтому [math]\lambda^m=p(\lambda) (\lambda^2-3 \lambda)+3^{m-1}\lambda[/math]. Теперь подставим вместо переменной [math]\lambda[/math] матрицу [math]A:[/math]


[math]A^m=p(A)\cdot(A^2-3\cdot A)+3^{m-1}\cdot A=p(A)\cdot O+3^{m-1}\cdot A= 3^{m-1}\cdot\! \begin{pmatrix}1&1&1\\ 1&1&1\\ 1&1&1 \end{pmatrix}\!.[/math]

Результат совпадает с полученным в примере 7.10.


Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved