Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Свойства собственных векторов линейных операторов (преобразований)
ОглавлениеЛинейная алгебра

Свойства собственных векторов линейных операторов (преобразований)


1. Собственные векторы линейного преобразования, принадлежащие различным собственным значениям, линейно независимы.


Аналогичное утверждение было доказано для собственных векторов матрицы (см. свойство 1).


2. Все собственные векторы линейного преобразования [math]\mathcal{A}\colon V\to V[/math], принадлежащие одному собственному значению, совместно с нулевым вектором образуют линейное подпространство, инвариантное относительно преобразования [math]\mathcal{A}[/math]. Такое линейное подпространство называется собственным для преобразования [math]\mathcal{A}[/math].


В самом деле, условие (9.5) можно записать в виде [math](\mathcal{A}- \lambda\mathcal{E}) (\boldsymbol{s})=\boldsymbol{o}[/math], где [math]\mathcal{E}\colon V\to V[/math] — тождественное преобразование. Множество векторов [math]\boldsymbol{s}[/math], удовлетворяющих последнему равенству, составляет ядро линейного преобразования [math](\mathcal{A}-\lambda \mathcal{E})[/math], т.е. является линейным подпространством [math]\ker (\mathcal{A}-\lambda \mathcal{E})\triangleleft V[/math] (собственное подпространство, отвечающее собственному значению [math]\lambda[/math]). Покажем, что это подпространство инвариантно относительно преобразования [math]\mathcal{A}[/math]. Действительно, любой вектор [math]\boldsymbol{s}\in \ker (\mathcal{A}-\lambda\mathcal{E})[/math] в силу равенств [math](\mathcal{A}-\lambda \mathcal{E})(\boldsymbol{s})=\boldsymbol{o}~ \Leftrightarrow~ \mathcal{A} (\boldsymbol{s})=\lambda \boldsymbol{s}[/math] отображается в коллинеарный ему вектор [math]\lambda\cdot \boldsymbol{s}[/math], также принадлежащий [math]\ker (\mathcal{A}-\lambda\mathcal{E})[/math].


3. Для собственного значения [math]\lambda[/math] линейного преобразования [math]\mathcal{A}\colon V\to V[/math] существует цепочка инвариантных подпространств


[math]\{\boldsymbol{o}\}\triangleleft \boldsymbol{K}_{\lambda}^1\triangleleft \boldsymbol{K}_{\lambda}^2\triangleleft \ldots\triangleleft \boldsymbol{K}_{\lambda}^m\triangleleft V,[/math]
(9.8)

где [math]\boldsymbol{K}_{\lambda}^1= \ker (\mathcal{A}-\lambda\mathcal{E}),~ \boldsymbol{K}_{\lambda}^2= \ker (\mathcal{A}-\lambda\mathcal{E})^2,~\ldots,~ \boldsymbol{K}_{\lambda}^m= \ker (\mathcal{A}-\lambda\mathcal{E})^m[/math]; [math]m[/math] — некоторое натуральное число [math](m\leqslant n=\dim{V})[/math].


Все перечисленные в цепочке (9.8) множества [math]\boldsymbol{K}_{\lambda}^k,~ k=1,\ldots,m[/math], являются линейными подпространствами по свойству ядра линейного преобразования. Каждое из подпространств [math]\boldsymbol{K}_{\lambda}^k[/math] инвариантно относительно преобразования [math]\mathcal{A}[/math], поскольку для любого вектора [math]\boldsymbol{v}\in \boldsymbol{K}_{\lambda}^k[/math] его образ [math]\boldsymbol{w}= \mathcal{A} (\boldsymbol{v})\in \boldsymbol{K}_{\lambda}^k[/math], так как в силу перестановочности многочленов от одного и того же линейного преобразования (см. пункт 2 замечаний 9.3)


[math](\mathcal{A}-\lambda\cdot\mathcal{E})^k(\boldsymbol{w})= (\mathcal{A}-\lambda\cdot \mathcal{E})^k \mathcal{A}(\boldsymbol{v})= \mathcal{A}(\mathcal{A}-\lambda\cdot \mathcal{E})^k(\boldsymbol{v})= \mathcal{A}(\boldsymbol{o})=\boldsymbol{o},[/math]

так как [math](\mathcal{A}-\lambda \mathcal{E})^k(\boldsymbol{v})=\boldsymbol{o}~ \forall \boldsymbol{v}\in \boldsymbol{K}_{\lambda}^k[/math] согласно определения ядра оператора.


Докажем включение [math]\boldsymbol{K}_{\lambda}^1\triangleleft \boldsymbol{K}_{\lambda}^2[/math]. Если [math]\boldsymbol{v}\in \boldsymbol{K}_{\lambda}^1[/math], то [math](\mathcal{A}-\lambda \mathcal{E}) (\boldsymbol{v})=\boldsymbol{o}[/math], при этом очевидно, что


[math](\mathcal{A}-\lambda\cdot \mathcal{E})\cdot (\mathcal{A}- \lambda\cdot \mathcal{E})(\boldsymbol{v})= (\mathcal{A}-\lambda\cdot\mathcal{E}) (\mathcal{o})= \boldsymbol{0},[/math] то есть [math]\boldsymbol{v}\in \boldsymbol{K}_{\lambda}^2.[/math]

Остальные включения доказываются аналогично.


Из цепочки (9.8) "расширяющихся" подпространств следует, что их размерности не убывают


[math]0\leqslant \dim \boldsymbol{K}_{\lambda}^1\leqslant \dim \boldsymbol{K}_{\lambda}^2 \leqslant \ldots\leqslant \dim \boldsymbol{K}_{\lambda}^m\leqslant\dim{V},[/math]

поэтому в силу конечномерности пространства [math]V[/math] существует такое [math]m[/math], что [math]\dim \boldsymbol{K}_{\lambda}^m=\dim \boldsymbol{K}_{\lambda}^{m+1}[/math], т.е. [math]\boldsymbol{K}_{\lambda}^m= \boldsymbol{K}_{\lambda}^{m+1}[/math]. Покажем, что дальнейшего "увеличения" подпространств нет, т.е. [math]\boldsymbol{K}_{\lambda}^m= \boldsymbol{K}_{\lambda}^{m+1}=\ldots= \boldsymbol{K}_{\lambda}^{m+k}[/math] для любого натурального [math]k[/math]. Предположим противное. Пусть [math]\boldsymbol{K}_{\lambda}^m= \boldsymbol{K}_{\lambda}^{m+1}[/math] и для некоторого [math]k>1[/math] пространства не совпадают: [math]\boldsymbol{K}_{\lambda}^{m+k}\ne \boldsymbol{K}_{\lambda}^{m+k+1}[/math], то есть существует вектор [math]\boldsymbol{v}\in \boldsymbol{K}_{\lambda}^{m+k+1}[/math], который не принадлежит пространству [math]\boldsymbol{K}_{\lambda}^{m+k}[/math]. Обозначим [math]\boldsymbol{w}= (\mathcal{A}-\lambda \mathcal{E})^k(\boldsymbol{v})[/math]. Тогда, с одной стороны, [math]\boldsymbol{w}\in \boldsymbol{K}_{\lambda}^{m+1}[/math], так как [math](\mathcal{A}- \lambda \mathcal{E})^{m+1}(\boldsymbol{w})=(\mathcal{A}-\lambda \mathcal{E})^{m+k+1}(\boldsymbol{v})=\boldsymbol{o}[/math], поскольку [math]\boldsymbol{v}\in \boldsymbol{K}_{\lambda}^{m+k+1}[/math]. С другой стороны, [math]\boldsymbol{w}\notin \boldsymbol{K}_{\lambda}^m[/math], так как [math](\mathcal{A}- \lambda \mathcal{E})^m(\boldsymbol{w})= (\mathcal{A}- \lambda \mathcal{E})^{m+k} (\boldsymbol{v})\ne \boldsymbol{o}[/math], поскольку [math]\boldsymbol{v}\notin \boldsymbol{K}_{\lambda}^{m+k}[/math]. Следовательно, и [math]\boldsymbol{w}\in \boldsymbol{K}_{\lambda}^{m+1}[/math] и [math]\boldsymbol{w}\notin \boldsymbol{K}_{\lambda}^m[/math] одновременно, что противоречит предположению [math]\boldsymbol{K}_{\lambda}^m= \boldsymbol{K}_{\lambda}^{m+1}[/math].


Таким образом, в цепочке (9.8) размерности пространств [math]\boldsymbol{K}_{\lambda}^k,~ k=1,\ldots,m[/math], возрастают. Поэтому [math]m\leqslant n=\dim{V}[/math].


Корневым подпространством линейного преобразования [math]\mathcal{A}[/math] для собственного значения [math]\lambda[/math] называется линейное подпространство [math]\boldsymbol{K}_{\lambda}^m= \ker (\mathcal{A}-\lambda \mathcal{E})^m[/math] с наименьшим натуральным показателем [math]m[/math], для которого [math]\boldsymbol{K}_{\lambda}^m= \boldsymbol{K}_{\lambda}^{m+1}[/math].


4. Если [math]\lambda[/math] — собственное значение линейного преобразования [math]\mathcal{A}\colon V\to V[/math], то пространство [math]V[/math] можно представить в виде прямой суммы [math]V= \boldsymbol{K}_{\lambda}^m\oplus L[/math], где [math]\boldsymbol{K}_{\lambda}^m[/math] — корневое подпространство, а [math]L=\operatorname{Lin} (\mathcal{A}-\lambda\mathcal{E})^m[/math] — инвариантное относительно [math]L[/math] подпространство, в котором нет собственных векторов, принадлежащих собственному значению [math]\lambda[/math].


В самом деле, покажем, что пересечение этих подпространств есть нулевой вектор: [math]\boldsymbol{K}_{\lambda}^m \cap L=\{\boldsymbol{o}\}[/math]. Выберем вектор [math]\boldsymbol{e}\in \boldsymbol{K}_{\lambda}^m\cap L[/math]. Так как вектор [math]\boldsymbol{w}\in L[/math], то существует такой вектор [math]\boldsymbol{v}\in V[/math], что [math]\boldsymbol{w}=(\mathcal{A}- \lambda\mathcal{E})^m (\boldsymbol{v})[/math]. Поскольку [math]\boldsymbol{w}\in \boldsymbol{K}_{\lambda}^m[/math], то [math](\mathcal{A}- \lambda \mathcal{E})^m (\boldsymbol{w})= \boldsymbol{o}[/math]. Тогда [math](\mathcal{A}- \lambda\mathcal{E})^{2m}(\boldsymbol{v})= (\mathcal{A}- \lambda \mathcal{E})^m (\boldsymbol{w})= \boldsymbol{o}[/math]. Следовательно, вектор [math]\boldsymbol{v}\in \boldsymbol{K}_{\lambda}^{2m}[/math], но [math]\boldsymbol{K}_{\lambda}^{2m}= \boldsymbol{K}_{\lambda}^m[/math], так как [math]\boldsymbol{K}_{\lambda}^m[/math] — корневое подпространство. Значит,


[math]\boldsymbol{v}\in \boldsymbol{K}_{\lambda}^m~~\Rightarrow~~ \boldsymbol{w}= (\mathcal{A}- \lambda \mathcal{E})^m (\boldsymbol{v})= \boldsymbol{o}[/math] то есть [math]\boldsymbol{K}_{\lambda}^m\cap L=\{\boldsymbol{o}\}[/math]

По теореме 9.1 о размерности ядра и образа получаем, что [math]\dim \boldsymbol{K}_{\lambda}^m+ \dim{L}= \dim{V}[/math]. Следовательно, пространство [math]V[/math] можно представить в виде прямой суммы подпространств [math]V\in \boldsymbol{K}_{\lambda}^m \oplus L[/math] (см. признаки прямых сумм подпространств).


Докажем, что в [math]L[/math] нет собственных векторов, принадлежащих собственному значению [math]\lambda[/math]. Действительно, пусть [math]\boldsymbol{s}[/math] — собственный вектор, соответствующий собственному значению [math]\lambda[/math]. Тогда [math]\boldsymbol{s}\in \boldsymbol{K}_{\lambda}^1[/math] и в силу (9.8) [math]\boldsymbol{}\in \boldsymbol{K}_{\lambda}^m[/math]. Подпространство [math]L[/math] имеет с [math]\boldsymbol{K}_{\lambda}^m[/math] только один общий вектор (нулевой). Поэтому [math]\boldsymbol{s}\notin L[/math], так как [math]\boldsymbol{s}\ne \boldsymbol{o}[/math]. Инвариантность подпространства [math]L[/math] следует из перестановочности операторов [math]\mathcal{A}[/math] и [math](\mathcal{A}- \lambda \mathcal{E})^m[/math] (см. пункт 2 замечаний 9.3). В самом деле, для любого вектора [math]\boldsymbol{w}\in L[/math] существует прообраз [math]\boldsymbol{v}\in V\colon[/math] [math]\boldsymbol{w}=(\mathcal{A}- \lambda \mathcal{E})^m (\boldsymbol{v})[/math]. Поэтому в силу перестановочности операторов


[math]\mathcal{A}(\boldsymbol{w})= \mathcal{A}(\mathcal{A}- \lambda\cdot \mathcal{E})^m (\boldsymbol{v})= (\mathcal{A}-\lambda\cdot \mathcal{E})^m \mathcal{A} (\boldsymbol{v})\in L,[/math]

поскольку [math]\mathcal{A}(\boldsymbol{v})\in V[/math] и [math]L=\operatorname{Lin} (\mathcal{A}-\lambda \mathcal{E})^m[/math]. Таким образом, инвариантность подпространства [math]L[/math]доказана, так как [math]\mathcal{A}(\boldsymbol{w})\in L~ \forall \boldsymbol{w}in L[/math].




Теорема (9.5) о разложении пространства в сумму корневых подпространств


Если все различные корни [math]\lambda_1,\ldots,\lambda_2,\lambda_k[/math] характеристического уравнения линейного преобразования [math]\mathcal{A}\colon V\to V[/math] являются его собственными значениями, то пространство [math]V[/math] можно разложить в прямую сумму инвариантных (корневых) подпространств:


[math]V= \boldsymbol{K}_{\lambda_1}^{m_1}\oplus \boldsymbol{K}_{\lambda_2}^{k_2} \oplus \ldots\oplus \boldsymbol{K}_{\lambda_k}^{m_k},[/math]
(9.9)

где [math]\boldsymbol{K}_{\lambda_i}^{m_i}= \ker (\mathcal{A}- \lambda_i \mathcal{E})^{m_1}[/math] — корневое подпространство, соответствующее собственному значению [math]\lambda_1,~ i=1,2,\ldots,k[/math].


В самом деле, по свойству 4 можно "отщепить" корневое подпространство [math]\boldsymbol{K}_{\lambda_1}^{m_1}[/math], т.е. представить пространство [math]V[/math] в виде прямой суммы инвариантных подпространств [math]V= \boldsymbol{K}_{\lambda_1}^{m_1} \oplus L_1[/math], причем в [math]L_1[/math] нет собственных векторов, принадлежащих собственному значению [math]\lambda_1[/math]. В пространстве [math]L_1[/math] определено сужение [math]\mathcal{A}_{L_1}\colon L_1\to L_1[/math] преобразования [math]\mathcal{A}[/math]. Применяя свойство 4 к сужению [math]\mathcal{A}_{L_1}\colon L_1\to L_1[/math], аналогичным образом можно "отщепить" корневое подпространство [math]\boldsymbol{K}_{\lambda_2}^{m_2}[/math], т.е. представить пространство [math]L_1[/math] в виде прямой суммы инвариантных подпространств: [math]L_1= \boldsymbol{K}_{\lambda_2}^{m_2} \oplus L_2[/math]. Этот процесс следует продолжить до тех пор, пока не исчерпаются все корни характеристического уравнения.


Следствие. Если все различные корни [math]\lambda_1,\lambda_2,\ldots,\lambda_k[/math] характеристического уравнения линейного преобразования [math]\mathcal{A}\colon V\to V[/math] являются его собственными значениями, то существует базис пространства [math]V[/math], в котором матрица [math]A[/math] линейного преобразования имеет блочно-диагональный вид


[math]A= \operatorname{diag}(A_1,A_2,\ldots,A_k),[/math]

где [math]A_1,A_2,\ldots,A_k[/math] — матрицы сужений [math]\mathcal{A}_{\boldsymbol{k}_i}\colon \boldsymbol{k}_i \to \boldsymbol{k}_i~ (\boldsymbol{k}_i=\boldsymbol{K}_{\lambda_i}^{m_i},~ i=1,\ldots,k)[/math], преобразования [math]\mathcal{A}[/math] на корневые подпространства.


Согласно следствию из теоремы 9.2, такой базис можно получить, записывая последовательно базисы корневых подпространств (9.9).




Алгебраическая и геометрическая кратности собственных значений


Алгебраической кратностью собственного значения [math]\lambda_1[/math] линейного оператора (преобразования) [math]\mathcal{A}\colon V\to V[/math] называется кратность корня [math]\lambda=\lambda_1[/math] характеристического многочлена [math]\Delta_{\mathcal{A}} (\lambda)[/math] (или, что то же самое, кратность корня характеристического уравнения [math]\Delta_{\mathcal{A}}(\lambda)[/math]).


Геометрической кратностью собственного значения [math]\lambda_1[/math] линейного оператора (преобразования) [math]\mathcal{A}\colon V\to V[/math] называется размерность собственного подпространства [math]\boldsymbol{K}_{\lambda_1}^1= \ker (\mathcal{A}-\lambda_1 \mathcal{E})[/math], соответствующего этому собственному значению.


Теорема 9.6 о кратностях собственных значений оператора. Геометрическая кратность собственного значения не превосходит его алгебраической кратности.


Представим пространство [math]V[/math] в виде прямой суммы [math]V=\boldsymbol{K}_{\lambda_1}^{m_1}\oplus L[/math] (см. свойство 4) и обозначим [math]r=\dim\boldsymbol{K}_{\lambda_1}^{m_1}[/math]. Выбрав базис пространства [math]\boldsymbol{K}_{\lambda_1}^{m_1}[/math], дополним его до базиса всего пространства. В этом базисе, согласно следствию теоремы 9.5, матрица [math]A[/math] преобразования [math]\mathcal{A}[/math] будет иметь блочно-диагональный вид [math]A=\operatorname{diag} (A_1,A_2)[/math], где квадратная матрица [math]A_1[/math] порядка [math]r[/math] является матрицей сужения [math]\mathcal{A}_{\boldsymbol{K}_{\lambda_1}^{m_1}}[/math] преобразования [math]\mathcal{A}[/math] на подпространство [math]\boldsymbol{K}_{\lambda_1}^{m_1}[/math], а матрица [math]A_2[/math] является матрицей сужения [math]\mathcal{A}_L[/math]. Характеристический многочлен матрицы [math]A[/math] имеет вид (см. определитель блочно-диагональной матрицы)


[math]\det(A-\lambda E)= \det(A_1-\lambda E)\cdot \det(A_2-\lambda E)= p_1(\lambda)\cdot p_2(\lambda),[/math]

где [math]p_1(\lambda),\,p_2(\lambda)[/math] — многочлены степеней [math]r[/math] и [math](n-r)[/math] соответственно. Так как сужение [math]\mathcal{A}_{\boldsymbol{K}_{\lambda_1}^{m_1}}[/math] не имеет собственных значений, отличных от [math]\lambda_1[/math], то [math]p_1(\lambda)= (-r)^r(\lambda-\lambda_1)^r[/math], в силу того, что [math]p_1(\lambda_1)=0[/math] и основной теоремы алгебры. Поскольку сужение [math]\mathcal{A}_L[/math] не имеет собственных векторов, принадлежащих собственному значению [math]\lambda_1[/math], то [math]p_2(\lambda_1)\ne0[/math]. Следовательно, [math]r[/math] -алгебраическая кратность собственного значения [math]\lambda_1[/math]. Тогда утверждение теоремы следует из включения (9.8): [math]\dim \boldsymbol{K}_{\lambda_1}^{1} \leqslant \dim\boldsymbol{K}_{\lambda_1}^{m_1}[/math], так как [math]\boldsymbol{K}_{\lambda_1}^{1}\triangleleft \boldsymbol{K}_{\lambda_1}^{m_1}[/math].



Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved