Оглавление — Линейная алгебра
Приведение квадратичной формы к главным осям
Ранее была рассмотрена задача приведения вещественной квадратичной формы
[math]q(x)= \sum_{n=1}^{n} \sum_{j=1}^{n} a_{ij}x_ix_j=x^TAx[/math](9.23)
[math]n[/math] переменных [math]x_1,x_2,\ldots,x_n[/math] к каноническому виду (6.18)
[math]\widetilde{q}(y)=\lambda_1y_1^2+ \lambda_2y_2^2+ \ldots+ \lambda_ny_n^2[/math](9.24)
при помощи невырожденной линейной замены переменных [math]x=Sy[/math]. Для решения этой задачи использовался метод Лагранжа.
Рассмотрим другой подход к решению. Линейную невырожденную замену переменных [math]x=Sy[/math] с ортогональной матрицей [math]S~(S^{-1}=S^T)[/math] будем называть ортогональной заменой переменных (или ортогональным преобразованием переменных).
Сформулируем задачу приведения квадратичной формы к главным осям: требуется найти ортогональную замену переменных [math]x=Sy[/math] [math](S^{-1}=S^T)[/math], приводящую квадратичную форму (9.23) к каноническому виду (9.24).
Для решения используем следующий геометрический смысл задачи. Будем считать переменные [math]x_1,x_2,\ldots,x_n[/math] координатами вектора [math]\boldsymbol{x}[/math] n-мерного евклидова пространства [math]\mathbb{E}[/math] в ортонормированном базисе [math](\boldsymbol{e})= (\boldsymbol{e}_1,\ldots,\boldsymbol{e}_n)[/math], а матрицу [math]A[/math] квадратичной формы (9.23) — матрицей некоторого линейного преобразования [math]\mathcal{A}\colon \mathbb{E}\to \mathbb{E}[/math] в том же базисе. Причем это преобразование самосопряженное, так как его матрица симметрическая: [math]A^T=A[/math]. Квадратичную форму (9.23) можно представить в виде скалярного произведения
[math]q(\boldsymbol{x})= \bigl\langle \mathcal{A}(\boldsymbol{x}), \boldsymbol{x}\bigr\rangle= \bigl\langle \boldsymbol{x}, \mathcal{A}(\boldsymbol{x})\bigr\rangle.[/math]
Ортогональной замене переменных [math]x=Sy[/math] соответствует переход от одного ортонормированного базиса к другому. Действительно, пусть [math]S[/math] — матрица перехода от ортонормированного базиса [math](\boldsymbol{e})[/math] к ортонормированному базису [math](\boldsymbol{s})= (\boldsymbol{s}_1,\ldots,\boldsymbol{s}_n)[/math], т.е. [math](\boldsymbol{s})= (\boldsymbol{e})S[/math] и [math]S^{-1}=S^T[/math]. Тогда координаты [math]x[/math] вектора [math]\boldsymbol{x}[/math] в базисе [math](\boldsymbol{e})[/math] и координаты [math]y[/math] того же вектора в базисе [math](\boldsymbol{s})[/math] связаны формулой (8.11): [math]x=Sy[/math].
Таким образом, задача приведения квадратичной формы к главным осям может быть сформулирована так: требуется найти в пространстве [math]\mathbb{E}[/math] такой базис, в котором матрица самосопряженного преобразования [math]\mathcal{A}[/math] имеет диагональный вид. По теореме 9.10 нужно выбрать ортонормированный базис из собственных векторов самосопряженного преобразования. При этом матрица перехода [math]S[/math] к каноническому базису оказывается ортогональной: [math]S^T=S^{-1}[/math].
Сформулируем этот результат для квадратичной формы.
Теорема (9.12) о приведении квадратичной формы к главным осям
Вещественная квадратичная форма (9.23) при помощи ортогонального преобразования переменных [math]x=Sy[/math] может быть приведена к каноническому виду (9.24), где [math]\lambda_1, \lambda_2,\ldots,\lambda_m[/math] — собственные значения матрицы [math]A[/math].
Следствие. Квадратичная форма (9.23) является положительно определенной (неотрицательно определенной) тогда и только тогда, когда все собственные значения ее матрицы положительны (неотрицательны).
Замечания 9.10
1. При линейной невырожденной замене переменных матрица квадратичной формы изменяется по формуле (6.10): [math]A'=S^TAS[/math]. Для ортогональной матрицы [math]S[/math] эта формула принимает вид [math]A'=S^{-1}AS[/math], который совпадает с формулой (9.4) изменения матрицы линейного преобразования при замене базиса.
2. Для нахождения канонического вида (9.24) достаточно определить все корни [math]\lambda_1, \lambda_2,\ldots,\lambda_m[/math] (среди которых могут быть равные) характеристического многочлена (уравнения) [math]\det(A-\lambda E)=0[/math], где [math]E[/math] — единичная матрица.
3. Следствие теоремы 9.12 можно использовать для анализа знакоопределенности квадратичной формы:
– если все собственные значения положительные (отрицательные), то квадратичная форма положительно (отрицательно) определенная;
– если все собственные значения неотрицательные (неположительные), то квадратичная форма неотрицательно (неположительно) определенная;
– если имеются собственные значения разных знаков, то квадратичная форма неопределенная (знакопеременная).
4. Результаты, сформулированные в пункте 3 замечаний, могут быть использованы для проверки достаточных и необходимых условий второго порядка в задаче поиска безусловного экстремума функций. Для этого следует найти собственные значения [math]\lambda_1, \lambda_2,\ldots,\lambda_m[/math] матрицы Гессе [math]\dfrac{d^2f(x)}{dx^Tdx}[/math] в каждой из стационарных точек [math]x^{\ast}[/math] функции [math]f(x)=f(x_1,\ldots,x_n)[/math].
Если все собственные значения положительные: [math]\lambda_i>0,~ i=1,\ldots,n[/math], то в точке [math]x^{\ast}[/math] локальный минимум;
– если все собственные значения отрицательные: [math]\lambda_i<0,~ i=1,\ldots,n[/math], то в точке [math]x^{\ast}[/math] локальный максимум;
– если все собственные значения неотрицательные: [math]\lambda_i\geqslant0,~ i=1,\ldots,n[/math], то в точке [math]x^{\ast}[/math] может быть локальный минимум;
– если все собственные значения неположительные: [math]\lambda_i\leqslant0,~ i=1,\ldots,n[/math], то в точке [math]x^{\ast}[/math] может быть локальный максимум;
– если собственные значения [math]\lambda_i,~ i=1,\ldots,n[/math], разных знаков, то в точке [math]x^{\ast}[/math] нет экстремума;
– если все собственные значения нулевые: [math]\lambda_i=0,~ i=1,\ldots,n[/math], то требуется дополнительное исследование.
5. Задача приведения квадратичной формы к главным осям решается при помощи алгоритма приведения самосопряженного преобразования к диагональному виду. При этом находится диагональный вид матрицы квадратичной формы и ортогональная матрица [math]S[/math] замены переменных [math]x=Sy[/math], приводящей квадратичную форму к каноническому виду (к главным осям).
Пример 9.7. Выяснить знакоопределенность квадратичной формы трёх переменных
[math]q(x)= x_1^2+2x_1x_2+2x_1x_3+x_2^2+2x_2x_3+x_3^2[/math] и найти ортогональную замену переменных [math]x=Sy[/math], приводящую квадратичную форму к каноническому виду (к главным осям).
Решение. Составляем матрицу квадратичной формы: [math]A=\begin{pmatrix} 1&1&1\\ 1&1&1\\ 1&1&1 \end{pmatrix}[/math]. В примере 9.6 были найдены собственные значения этой матрицы: [math]\lambda_{1,2}=0,[/math] [math]\lambda_3=3[/math]. Все собственные значения неотрицательные, поэтому квадратичная форма является неотрицательно определенной (см. пункт 4 замечаний 9.10).
В примере 9.6 была найдена ортогональная матрица
[math]S=\begin{pmatrix} \dfrac{\sqrt{2}}{2}& \dfrac{\sqrt{6}}{6}& \dfrac{\sqrt{3}}{3}\\[9pt] 0&-\dfrac{\sqrt{6}}{3}& \dfrac{\sqrt{3}}{3}\\[9pt] -\dfrac{\sqrt{2}}{2}& \dfrac{\sqrt{6}}{6}& \dfrac{\sqrt{3}}{3} \end{pmatrix}\!,[/math]
приводящая матрицу [math]A[/math] к диагональному виду [math]\Lambda= \operatorname{diag} (0,0,3)[/math]. Записываем искомую ортогональную замену переменных [math]x=Sy:[/math]
[math]x_1= \frac{\sqrt{2}}{2}\,y_1+ \frac{\sqrt{6}}{6}\,y_2+ \frac{\sqrt{3}}{3}\,y_3;\quad x_2= -\frac{\sqrt{6}}{3}\,y_2+ \frac{\sqrt{3}}{3}\,y_3;\quad x_3= -\frac{\sqrt{2}}{2}\,y_1+ \frac{\sqrt{6}}{6}\,y_2+ \frac{\sqrt{3}}{3}\,y_3.[/math]
и квадратичную форму в каноническом виде: [math]\widetilde{q}(y)= 3y_3^2[/math].
Пример 9.8. Найти точки локального экстремума функции двух переменных с помощью матриц
[math]f(x)=3x_1^5+x_1^4-5x_1^3-2x_1^2x_2+x_2^2.[/math]
Решение. В пункте 1 примера 6.13 найден градиент функции, а из необходимого условия экстремума первого порядка три стационарные точки:
[math]x^0= \begin{pmatrix}0&0 \end{pmatrix}^T,\qquad x^1=\begin{pmatrix} 1&1 \end{pmatrix}^T,\qquad x^2=\begin{pmatrix} -1&1\end{pmatrix}^T.[/math] Матрица Гессе имеет вид
[math]\frac{df(x)}{dx^Tdx}= \begin{pmatrix} 60x_1^3+12x_1^2-30x_1-4x_2&-4x_1\\-4x_1&2 \end{pmatrix}\!.[/math]
Найдем собственные значения матрицы Гессе в каждой стационарной точке:
[math]\frac{df(x^0)}{dx^Tdx}= \begin{pmatrix}0&0\\ 0&2 \end{pmatrix}\!;\quad \frac{df(x^1)}{dx^Tdx }= \begin{pmatrix}38&-4\\ -4&2 \end{pmatrix}\!,\quad \frac{df(x^2)}{dx^Tdx}= \begin{pmatrix} -22&4\\4&2\end{pmatrix}[/math] и воспользуемся пунктом 4 замечаний 9.10.
В точке [math]x^0=\begin{pmatrix}0\\0 \end{pmatrix}[/math] матрица Гессе имеет вид [math]\begin{pmatrix} 0&0\\ 0&2\end{pmatrix}[/math]. Из уравнения [math]\begin{vmatrix} -\lambda&0\\ 0&2-\lambda\end{vmatrix}=0[/math] находим [math]\lambda_1=0,[/math] [math]\lambda_2=2[/math]. Так как все собственные значения неотрицательные, то в точке [math]x^0[/math] может быть локальный минимум и для окончательного вывода требуется дополнительное исследование (см. пример 6.13).
В точке [math]x^1=\begin{pmatrix}1\\1 \end{pmatrix}[/math] матрица Гессе имеет вид [math]\begin{pmatrix} 38&-4\\ -4&2 \end{pmatrix}[/math]. Из уравнения [math]\begin{vmatrix} 38-\lambda&-4\\ -4&2-\lambda\end{vmatrix}=0[/math], или [math]\lambda^2-40 \lambda+60=0[/math] получаем [math]\lambda_{1,2}= 20\pm2\sqrt{85}[/math]. Поскольку все собственные значения положительные, то в точке [math]x^1[/math] локальный минимум функции.
В точке [math]x^2=\begin{pmatrix}-1\\1 \end{pmatrix}[/math] матрица Гессе имеет вид [math]\begin{pmatrix} -22&4\\ 4&2 \end{pmatrix}[/math]. Из уравнения [math]\begin{vmatrix} -22-\lambda&4\\ 4&2-\lambda\end{vmatrix}=0[/math], или [math]\lambda^2+40 \lambda-60=0[/math] получаем [math]\lambda_{1,2}=-10\pm4\sqrt{10}[/math]. Поскольку собственные значения имеют разные знаки, то в точке [math]x^2[/math] нет экстремума.
Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.
|