Оглавление — Линейная алгебра
Линейные преобразования евклидовых пространств
Рассмотрим линейное преобразование [math]\mathcal{A}\colon \mathbb{E}\to \mathbb{E}[/math] n-мерного евклидова пространства [math]\mathbb{E}[/math]. Напомним, что евклидово пространство является вещественным линейным пространством со скалярным произведением. Поэтому все понятия и свойства линейных преобразований вещественных линейных пространств полностью переносятся на линейные преобразования евклидовых пространств. Наличие скалярного произведения позволяет определить важные свойства таких преобразований.
Ортогональные преобразования евклидовых пространств
Преобразование [math]\mathcal{A}\colon \mathbb{E}\to \mathbb{E}[/math] n-мерного евклидова пространства [math]\mathbb{E}[/math] называется ортогональным, если оно сохраняет скалярное произведение векторов, т.е.
[math]\langle \mathcal{A}(\boldsymbol{v}),\mathcal{A}(\boldsymbol{w})\rangle= \langle \boldsymbol{v},\boldsymbol{w}\rangle\quad \forall \boldsymbol{v},\boldsymbol{w}\in \mathbb{E}.[/math](9.16)
Из определения следуют простейшие свойства: при ортогональном преобразовании евклидова пространства не изменяются длины векторов [math](|\boldsymbol{v}|,\,|\boldsymbol{w}|)[/math], а также углы между векторами [math]\bigl(\varphi= \angle(\boldsymbol{v} ,\boldsymbol{w})\bigr)[/math], поскольку
[math]|\mathcal{A}(\boldsymbol{v})|^2= \langle \mathcal{A}(\boldsymbol{v}), \mathcal{A}(\boldsymbol{v})\rangle= \langle \boldsymbol{v},\boldsymbol{v} \rangle= |\boldsymbol{v}|^2[/math] и для ненулевых векторов [math]\cos\varphi= \frac{\langle \boldsymbol{v},\boldsymbol{w} \rangle}{|\boldsymbol{v}|\cdot |\boldsymbol{w}|}= \frac{\langle \mathcal{A}(\boldsymbol{v}), \mathcal{A}(\boldsymbol{w}) \rangle}{|\mathcal{A} (\boldsymbol{v})|\cdot |\mathcal{A}(\boldsymbol{w})|}\,.[/math]
Перейдем к изучению других свойств ортогональных преобразований.
Свойства ортогональных преобразований евклидовых пространств
1. Ортогональное преобразование евклидова пространства — линейное.
В определении намеренно не говорится о линейности преобразования [math]\mathcal{A}[/math], поскольку она следует из (9.16). Действительно, выберем в [math]\mathbb{E}[/math] ортонормированный базис [math](\boldsymbol{e})= (\boldsymbol{e}_1,\ldots, \boldsymbol{e}_n)[/math]. Тогда векторы [math]\mathcal{A}(\boldsymbol{e}_1), \ldots,\mathcal{A} (\boldsymbol{e}_n)[/math] также образуют ортонормированный базис пространства [math]\mathbb{E}[/math], так как по определению
[math]\Bigl\langle \mathcal{A}(\boldsymbol{e}_i), \mathcal{A} (\boldsymbol{e}_j) \Bigr\rangle= \langle \boldsymbol{e}_i,\boldsymbol{e}_j\rangle= \begin{cases} 1,&i=j,\\ 0,&i\ne j. \end{cases}[/math](9.17)
Найдем координаты образа [math]\mathcal{A}(\boldsymbol{v})[/math] произвольного вектора [math]\boldsymbol{v}=v_1 \boldsymbol{e}_1+\ldots+v_n \boldsymbol{e}_n[/math] в базисе [math]\mathcal{A}(\boldsymbol{e}_1), \ldots,\mathcal{A} (\boldsymbol{e}_n)[/math]. Так как [math]\langle \mathcal{A}(\boldsymbol{v}),\mathcal{A}(\boldsymbol{e}_i)\rangle= \langle \boldsymbol{v},\boldsymbol{e}_i\rangle= \boldsymbol{v}_i[/math] [math](i=1,\ldots,n)[/math], получаем
[math]\mathcal{A}(\boldsymbol{v})= v_1 \mathcal{A}(\boldsymbol{e}_1)+ v_2 \mathcal{A}(\boldsymbol{e}_2)+ \ldots+ v_n \mathcal{A}(\boldsymbol{e}_n).[/math](9.18)
Найдем образ произведения вектора [math]\boldsymbol{v}[/math] на число [math]\lambda:[/math]
[math]\mathcal{A}(\lambda\cdot \boldsymbol{v})= (\lambda v_1) \mathcal{A} (\boldsymbol{e}_1)+\ldots+ (\lambda v_n) \mathcal{A}(\boldsymbol{e}_n)= \lambda \Bigl[v_1 \mathcal{A}(\boldsymbol{e}_1)+ \ldots+ v_n \mathcal{A}(\boldsymbol{e}_n)\Bigr]= \lambda\cdot \mathcal{A}(\boldsymbol{v}).[/math]
Следовательно, преобразование [math]\mathcal{A}[/math] — однородное. Аддитивность доказывается аналогично.
2. Линейное преобразование ортогонально тогда и только тогда, когда оно отображает ортонормированный базис в ортонормированный.
Необходимость следует из (9.17). Докажем достаточность. Пусть [math]\boldsymbol{e}_1, \ldots, \boldsymbol{e}_n[/math] и [math]\mathcal{A}(\boldsymbol{e}_1), \ldots,\mathcal{A} (\boldsymbol{e}_n)[/math] — ортонормированные базисы евклидова пространства [math]\mathbb{E}[/math]. В силу линейности преобразования для любого вектора [math]\boldsymbol{v}= v_1 \boldsymbol{e}_1+\ldots+ v_n \boldsymbol{e}_n[/math] справедливо (9.18). Поэтому
[math]\begin{aligned} \bigl\langle \mathcal{A}(\boldsymbol{v}), \mathcal{A}(\boldsymbol{w}) \bigr\rangle&= \Biggl\langle \sum_{i=1}^{n}v_i \mathcal{A}(\boldsymbol{e}_i),\, \sum_{j=1}^{n}w_j \mathcal{A}(\boldsymbol{e}_j)\Biggr\rangle= \sum_{i=1}^{n}\sum_{j=1}^{n}v_iw_i \bigl\langle \mathcal{A}(\boldsymbol{e}_i), \mathcal{A}(\boldsymbol{e}_j) \bigr\rangle=\\[2pt] &= \sum_{i=1}^{n} v_iw_i= \sum_{i=1}^{n}\sum_{j=1}^{n}v_iw_i \langle\boldsymbol{e}_i, \boldsymbol{e}_j \rangle= \Biggl\langle \sum_{i=1}^{n}v_i \boldsymbol{e}_i,\, \sum_{j=1}^{n}w_j \boldsymbol{e}_j \Biggr\rangle= \langle \boldsymbol{v},\boldsymbol{w}\rangle,\end{aligned}[/math] что и требовалось доказать.
3. Линейное преобразование [math]\mathcal{A}\colon \mathbb{E}\to \mathbb{E}[/math] ортогонально тогда и только тогда, когда его матрица [math]A[/math] в любом ортонормированном базисе является ортогональной, т.е. [math]A^T=A^{-1}[/math].
В самом деле, пусть в ортонормированном базисе [math](\boldsymbol{e})=(\boldsymbol{e}_1, \ldots, \boldsymbol{e}_n)[/math] ортогональное преобразование [math]\mathcal{A}[/math] имеет матрицу [math]A[/math]. Найдем произведение образов [math]\mathcal{A}(\boldsymbol{e}_i)= \sum_{k=1}^{n} a_{k i}\boldsymbol{e}_k[/math] и [math]\mathcal{A}(\boldsymbol{e}_j)= \sum_{k=1}^{n} a_{\ell j}\boldsymbol{e}_{\ell}[/math] базисных векторов. Согласно (9.17) имеем
[math]\bigl\langle \mathcal{A}(\boldsymbol{e}_i),\mathcal{A}(\boldsymbol{e}_j)\bigr\rangle= \Biggl\langle \sum_{k=1}^{n}a_{ki}\boldsymbol{e}_{k},\, \sum_{\ell=1}^{n}a_{\ell j} \boldsymbol{e}_{\ell} \Biggr\rangle= \sum_{k=1}^{n}\sum_{\ell=1}^{n} a_{k i}a_{\ell j}\bigl\langle \boldsymbol{e}_{k}, \boldsymbol{e}_{\ell} \bigr\rangle= \sum_{k=1}^{n}a_{ki}a_{kj}= \begin{cases}1,&i=j,\\ 0,&i\ne j.\end{cases}[/math]
Последнюю сумму можно рассматривать как произведение элементов i-й строки транспонированной матрицы [math]A^T[/math] на соответствующие элементы j-го столбца матрицы [math]A[/math]. Поэтому [math]A^TA=E[/math], тогда и [math]AA^T=E[/math]. Следовательно, [math]A^T=A^{-1}[/math]. Для доказательства достаточности проводим рассуждения в обратном порядке и приходим к заключению, что преобразование [math]\mathcal{A}[/math] (с ортогональной матрицей [math]A[/math]) отображает один ортонормированный базис в другой. По свойству 2 такое преобразование ортогональное.
4. Ортогональное преобразование обратимо, т.е. инъективно и сюръективно: [math]\boldsymbol{Ker}\mathcal{A}=\{\boldsymbol{o}\},[/math] [math]\boldsymbol{Im}\mathcal{A}= \mathcal{E}[/math]. Это следует из свойств ядра и образа линейного отображения .
5. Корни характеристического уравнения ортогонального преобразования по модулю равны единице (собственные значения равны +1 или –1).
Действительно, пусть [math]A[/math] — матрица ортогонального преобразования в ортонормированием базисе. Характеристическое уравнение имеет действительные коэффициенты, так как матрица [math]A[/math] действительная. Если [math]\lambda_{1,2}= \alpha\pm\beta i[/math] — пара комплексных сопряженных корней характеристического уравнения, то найдется ненулевой столбец [math]{z}[/math] (с комплексными элементами), для которого [math]Az=\lambda z[/math], Выполняя комплексное сопряжение и транспонирование обеих частей равенства, получаем [math]z^{\ast}A^{\ast}= \overline{\lambda}z^{\ast}[/math]. Перемножим оба равенства: [math]z^{\ast}A^{\ast}Az= \lambda \overline{\lambda}z^{\ast}z[/math]. Так как [math]A^{\ast}= A^T=A^{-1}[/math], то [math]z^{\ast}z= \lambda\overline{z}z^{\ast}z[/math]. Для ненулевого столбца [math](z\ne o)~ z^{\ast}z\ne0[/math] и, следовательно, [math]\lambda\overline{\lambda}= |\lambda|^2=1[/math]. Поэтому для собственных значений, которые являются действительными числами, получаем [math]\lambda=\pm1[/math].
6. Определитель матрицы ортогонального преобразования равен +1 или –1. Это свойство следует из равенства [math]AA^T=E[/math], так как
[math](\det{A})^2= \det{A}\cdot\det{A^T}= \det(AA^T)= \det{E}=1\quad \Rightarrow\quad \det{A}=\pm1.[/math]
Ортогональное преобразование [math]\mathcal{A}[/math] называется собственным, если [math]\det{A}=1[/math] и несобственным, если [math]\det{A}=-1[/math].
7. Пусть [math]L[/math] — инвариантное относительно ортогонального преобразования [math]\mathcal{A}\colon \mathbb{E}\to \mathbb{E}[/math] подпространство [math]\mathbb{E}[/math]. Тогда его ортогональное дополнение [math]L^{\perp}[/math] также инвариантно по отношению к преобразованию [math]\mathcal{A}[/math].
По свойству 4 ортогональное преобразование [math]\mathcal{A}_{L}\colon L\to L[/math] (сужение преобразования [math]\mathcal{A}\colon \mathbb{E}\to \mathbb{E}[/math] на инвариантное подпространство [math]L\triangleleft \mathbb{E}[/math]) обратимо. Поэтому для любого [math]\boldsymbol{w}\in L[/math] найдется прообраз [math]\boldsymbol{v}\in L\colon\, \boldsymbol{w}= \mathcal{A}(\boldsymbol{v})[/math]. Тогда для любого [math]\boldsymbol{u}\in L^{\perp}[/math] имеем [math]\bigl\langle \mathcal{A}(u),\boldsymbol{w}\bigr\rangle= \bigl\langle \mathcal{A}(u), \mathcal{A}(\boldsymbol{v})\bigr\rangle= \langle \boldsymbol{u}, \boldsymbol{v}\rangle=0[/math], то есть [math]\mathcal{A}(\boldsymbol{u})\in L^{\perp}[/math]. Следовательно, подпространство [math]L^{\perp}\in \mathbb{E}[/math] инвариантно относительно преобразования [math]\mathcal{A}[/math], то есть [math]\mathcal{A}(L^{\perp})\subset L^{\perp}[/math] и даже [math]\mathcal{A}(L^{\perp})= L^{\perp}[/math] в силу обратимости [math]\mathcal{A}[/math].
8. Пусть [math]\lambda= \alpha\pm \beta i[/math] — пара комплексных сопряженных корней [math](\beta\ne0)[/math] характеристического многочлена ортогонального преобразования [math]\mathcal{A}\colon \mathbb{E}\to \mathbb{E}[/math]. Тогда существует такая пара равных по длине ортогональных векторов [math]\boldsymbol{x}[/math] и [math]\boldsymbol{y}[/math], что
[math]\begin{cases}\mathcal{A}(\boldsymbol{x})= \alpha \boldsymbol{x}- \beta \boldsymbol{y},\\ \mathcal{A}(\boldsymbol{y})= \beta\boldsymbol{x}+\alpha \boldsymbol{y}. \end{cases}[/math](9.19)
В самом деле, в теореме 9.4 доказано существование линейно независимых векторов [math]\boldsymbol{x}[/math] и [math]\boldsymbol{y}[/math], удовлетворяющих системе (9.19), которая в координатной форме имеет вид (9.7). Матрица [math]A_L[/math] сужения [math]\mathcal{A}_L\colon L\to L[/math] преобразования [math]\mathcal{A}[/math] на двумерное инвариантное подпространство [math]L=\operatorname{Lin}(\boldsymbol{x},\boldsymbol{y})[/math] относительно базиса [math]\boldsymbol{x},\boldsymbol{y}[/math] имеет вид [math]A_L= \begin{pmatrix}\alpha&\beta\\ -\beta&\alpha \end{pmatrix}[/math]. Она составлена из координатных столбцов векторов [math]\mathcal{A}(x),\mathcal{A}(\boldsymbol{y})[/math] в базисе [math]\boldsymbol{x}, \boldsymbol{y}[/math], т.е. из коэффициентов разложений (9.19) этих векторов по базису.
Докажем ортогональность векторов [math]\boldsymbol{x}[/math] и [math]\boldsymbol{y}[/math]. Находим скалярные произведения, учитывая (9.19) и ортогональность преобразования:
[math]\begin{gathered} |\boldsymbol{x}|^2= \bigl\langle \mathcal{A}(\boldsymbol{x}), \mathcal{A}(\boldsymbol{x})\bigr\rangle= \alpha^2\cdot |\boldsymbol{x}|^2- 2\alpha\beta\cdot \langle \boldsymbol{x},\boldsymbol{y}\rangle+ \beta^2\cdot |\boldsymbol{y}|^2,\\[5pt] \langle \boldsymbol{x}, \boldsymbol{y}\rangle= \bigl\langle \mathcal{A}(\boldsymbol{x}), \mathcal{A}(\boldsymbol{y}) \bigr\rangle= \alpha\beta\cdot |\boldsymbol{x}|^2+ (\alpha^2-\beta^2)\cdot \langle \boldsymbol{x}, \boldsymbol{y}\rangle- \alpha\beta\cdot |\boldsymbol{y}|^2. \end{gathered}[/math]
Подставляя [math]\alpha^2=1-\beta^2[/math] (см. свойство 5) и сокращая на [math]\beta\ne0[/math], получаем систему уравнений
[math]\begin{cases}\beta\cdot \bigl(|\boldsymbol{y}|^2-|\boldsymbol{x}|^2\bigr)- 2\alpha\cdot \langle \boldsymbol{x}, \boldsymbol{y}\rangle=0,\\ -\alpha\cdot (|\boldsymbol{y}|^2-|\boldsymbol{x}|^2\bigr)- 2\beta\cdot \langle \boldsymbol{x}, \boldsymbol{y}\rangle=0\end{cases}[/math] относительно двух неизвестных [math]\bigl(|\boldsymbol{y}|^2-|\boldsymbol{x}|^2\bigr)[/math] и [math]\langle \boldsymbol{x}, \boldsymbol{y}\rangle.[/math]
Определитель матрицы системы [math]\begin{vmatrix} \beta& -2\alpha\\ -\alpha&-2\beta\end{vmatrix}= -2(\alpha^2+ \beta^2)= -2\ne0[/math], следовательно, система имеет только тривиальное решение: [math]|\boldsymbol{y}|^2-|\boldsymbol{x}|^2=0,[/math] [math]\langle \boldsymbol{x}, \boldsymbol{y}\rangle=0[/math], то есть векторы [math]\boldsymbol{x}[/math] и [math]\boldsymbol{y}[/math] имеют равные длины и перпендикулярны.
Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.
|