Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Закон инерции и знакоопределенность квадратичных форм
ОглавлениеЛинейная алгебра

Закон инерции и знакоопределенность квадратичных форм


Закон инерции вещественных квадратичных форм


Рассмотрим вещественные (действительные) квадратичные формы, коэффициенты которых являются действительными числами, а переменные принимают действительные значения. Любую вещественную форму [math]q(x)=x^TAx[/math] можно привести к каноническому виду


[math]\widetilde{q}(y)=\lambda_1y_1^2+\lambda_2y_2^2+\ldots+\lambda_ny_n^2[/math]
(6.18)

при помощи линейной невырожденной замены переменных [math]x=Sy[/math] с действительной матрицей [math]S[/math] (см. теорему 6.1 и п.2 замечаний 6.4). Коэффициенты [math]\lambda_1,\lambda_2,\ldots,\lambda_n[/math] квадратичной формы являются действительными числами.


Количество положительных (отрицательных) коэффициентов в каноническом виде (6.18) называется положительным (отрицательным) индексом квадратичной формы, а разность положительного и отрицательного индексов называется сигнатурой квадратичной формы. В примере 6.10 квадратичная форма была приведена к каноническому виду [math]\widetilde{q}(y)=y_1^2+\frac{3}{4}y_2^2-\frac{1}{3}y_3^2[/math]. Её положительный индекс [math]p=2[/math], отрицательный индекс равен 1, а сигнатура [math]\sigma=2-1=1[/math].


Замечания 6.7


1. Согласно пункту 2 замечаний 6.5 количество ненулевых коэффициентов в (6.18) равно рангу [math]r=\operatorname{rg}A[/math] квадратичной формы. Перенумеруем переменные так, чтобы в сумме (6.18) первыми были [math]p[/math] слагаемых с положительными коэффициентами, затем [math](r-p)[/math] слагаемых с отрицательными коэффициентами, а остальные слагаемые с нулевыми коэффициентами. Всего будет [math]r[/math] отличных от нуля слагаемых [math](\lambda_i\ne0,~i=1,\ldots,r)[/math]. Если сделать невырожденную замену переменных


[math]y_i=\begin{cases}\dfrac{z_i}{\sqrt{|\lambda_i|}},&i\leqslant r,\\ z_i,&i>r.\end{cases}[/math]

то получим нормальный вид квадратичной формы

[math]\widetilde{\widetilde{q}}(z)=z_1^2+z_2^2+\ldots+z_p^2-z_{p+1}^2-z_{p+2}^2-\ldots-z_r^2,[/math]
(6.19)

в котором коэффициенты равны либо единице, либо минус единице (переменные [math]z_{r+1},\ldots,z_n[/math] входят с нулевыми коэффициентами).

2. Из четырех величин: ранта, положительного и отрицательного индексов и сигнатуры, достаточно знать любые две, чтобы вычислить остальные. Например, если известны ранг [math]r[/math] и положительный индекс [math]p[/math] (см. форму (6.19)), то отрицательный индекс равен [math](r-p)[/math], а сигнатура [math]\sigma=p-(r-p)=2p-r[/math].




Теорема 6.3 о законе инерции квадратичных форм. Ранг, положительный и отрицательный индексы, а также сигнатура вещественной квадратичной формы не зависят от действительной невырожденной линейной замены переменных, приводящей квадратичную форму к каноническому виду.


Из теоремы 6.3 следует, что два канонических вида одной и той же квадратичной формы имеют:


а) одинаковое количество ненулевых слагаемых (которое определяется рангом квадратичной формы);

б) одинаковое количество слагаемых одного знака.


В самом деле, пусть квадратичная форма [math]q(x)=x^TAx[/math] ранга [math]r[/math] приведена к нормальному виду (6.19)


[math]\widetilde{q}=y_1^2+y_2^2+\ldots+y_m^2-y_{m+1}^2-y_{m+2}^2-\ldots-y_{r}^2,[/math]

невырожденной заменой переменных [math]x=Ty[/math], а невырожденной заменой переменных [math]x=Sz[/math] — к другому нормальному виду:


[math]\widetilde{\widetilde{q}}(z)=z_1^2+z_2^2+\ldots+z_p^2-z_{p+1}^2-z_{p+2}^2-\ldots-z_r^2,[/math]

причем число [math]r=\operatorname{rg}A[/math] в этих формулах одно и то же (см. пункт 1 замечаний 6.5). Докажем, что положительные индексы [math]m[/math] и [math]p[/math] равны. Предположим противное. Пусть [math]p>m[/math]. Поскольку замены переменных невырожденные, то [math]T^{-1}x=y[/math] и [math]S^{-1}x=z[/math]. Рассматривая последние равенства как неоднородные системы уравнений относительно неизвестных [math]x_1,x_2,\ldots,x_n[/math], подберем такое ее решение [math]x^O[/math], чтобы выполнялись условия [math]y_1=0,\ldots,y_m=0[/math] [math]z_{p+1}=0,\ldots,z_n=0[/math]. Для этого составим однородную систему, выбрав первые [math]m[/math] уравнений из системы [math]T^{-1}x=y[/math] и последние [math](n-p)[/math] уравнений системы [math]S^{-1}x=z:[/math]


[math]\begin{cases}(E_m\mid O)T^{-1}x=o,\\ (O\mid E_{n-p})S^{-1}x=o. \end{cases}[/math]

Получили однородную систему [math](m+n-p)[/math] уравнений с [math]n[/math] неизвестными. Так как [math]p>m[/math], то число уравнений меньше количества неизвестных. Поэтому система имеет нетривиальное решение [math]x^O\ne o[/math] (см. разд.5.5). Вычислим значение квадратичной формы для этого столбца [math]x^O[/math] значений переменных. Для ненулевых столбцов


[math]\begin{gathered}y^O=T^{-1}\cdot x^O= \begin{pmatrix}\underbrace{0~\,\cdots~\,0}_{m}& y_{m+1}&\cdots&y_n \end{pmatrix}^T,\\[5pt] z^O=S^{-1}\cdot x^O= \begin{pmatrix}z_1&\cdots&z_p& \underbrace{0~\,\cdots~\,0}_{n-p}\end{pmatrix}^T,\end{gathered}[/math]
получаем
[math]q(x^O)=\widetilde{q}(y^O)=-y_{m+1}^2-\ldots-y_r^2\leqslant0[/math] и [math]q(x^O)=\widetilde{\widetilde{q}}(z^O)=z_1^2+\ldots+z_p^2>0[/math],

т.е. [math]q(x^0)\leqslant0[/math] и [math]q(x^O)>0[/math] одновременно, чего не может быть. Заметим, что при [math]m=0[/math] и [math]p=n[/math] оба неравенства выполняются для любого ненулевого вектора [math]x^O[/math]. Следовательно, предположение [math]p>m[/math] приводит к противоречию. К аналогичному противоречию приводит предположение [math]p<m[/math]. Значит, [math]p=m[/math]. Другими словами, положительный индекс квадратичной формы не зависит от способа ее приведения к каноническому виду. Ранг формы также не зависит от выбора невырожденной замены переменных. В силу пункта 2 замечаний 6.7 делаем аналогичный вывод для отрицательного индекса и сигнатуры.




Знакоопределенность вещественных квадратичных форм


Вещественная квадратичная форма [math]q(x)=x^TAx[/math] называется положительно (отрицательно) определенной, если [math]q(x)>0[/math] [math](q(x)<0)[/math] для любых [math]x\ne o[/math]. Положительно и отрицательно определенные квадратичные формы называются определенными (знакоопределенными). Если неравенство [math]q(x)\geqslant0[/math] [math](q(x)\leqslant0)[/math] выполняется для любых значений [math]x[/math], то квадратичная форма называется неотрицательно (неположительно) определенной. В этом случае говорят, что квадратичная форма полуопределенная. Если же квадратичная форма принимает как положительные, так и отрицательные значения, то она называется неопределенной (знакопеременной). Определенность, полуопределенность и неопределенность квадратичных форм обозначается неравенствами


[math]q(x)>0,~~q(x)<0,~~ q(x)\geqslant0,~~ q(x)\leqslant0,~~ q(x)\gtrless0[/math] соответственно.

Поскольку каждой вещественной квадратичной форме соответствует ее матрица, то эта терминология переносится на действительные симметрические матрицы. Например, симметрическая матрица [math]A[/math] называется положительно определенной, если такой является квадратичная форма [math]x^TAx[/math]. Определенность, полуопределенность и неопределенность симметрической матрицы обозначаются неравенствами


[math]A>0,~~A<0,~~A\geqslant0,~~A\leqslant0,~~A\gtrless0[/math] соответственно.



Пример 6.11. Исследовать знакоопределенность квадратичных форм


[math]\mathsf{1)}~q(x_1,x_2)=x_1^2-2x_1x_2+2x_2^2;\quad \mathsf{2)}~q(x_1,x_2)=x_2^2;\quad \mathsf{3)}~2x_1x_2.[/math]

Решение. 1) Выделим полный квадрат по переменной [math]x_1:[/math]


[math]q(x_1,x_2)=(x_1-x_2)^2+x_2^2>0[/math] для любого [math]x\ne o[/math].

Следовательно, данная форма положительно определенная.


2) Квадратичная форма [math]q(x_1,x_2)=x_2^2[/math] не является положительно определенной, так как [math]q(1;0)=0[/math] для [math]x=(1~\,0)^T\ne o[/math]. В силу неравенства [math]q(x_1,x_2)=x_2^2\geqslant0[/math] эта форма неотрицательно определенная.


3) Квадратичная форма [math]q(x_1,x_2)=2x_1x_2[/math] неопределенная, так как она может принимать как положительные, так и отрицательные значения. Например, [math]q(1;1)=2>0,~ q(1;-1)=-2<0[/math].




Замечания 6.8


1. Положительно определенная квадратичная форма приводится к нормальному виду (6.19) [math]\widetilde{\widetilde{q}}(z)=z_1^2+z_2^2+\ldots+z_n^2[/math], т.е. [math]p=r=\sigma=n[/math] — положительный индекс [math](p)[/math], ранг [math](r)[/math] и сигнатура [math](\sigma)[/math] равны количеству [math](n)[/math] ее переменных. Отрицательный индекс равен нулю. Согласно теореме 6.3, они не изменяются при невырожденной замене переменных.


2. Дискриминант положительно определенной квадратичной формы больше нуля, т.е. [math]\det{A}>0[/math].


Действительно, матрица нормального вида положительно определенной квадратичной формы — единичная (см. пункт 1). Следовательно, матрица [math]A[/math] положительно определенной квадратичной формы конгруэнтна единичной матрице [math]E=S^TAS[/math]. Следовательно, [math]\det{A}\cdot(\det{S})^2=1[/math], т.е. [math]\det{A}>0[/math].


3. Неотрицательно определенная квадратичная форма приводится к нормальному виду (6.19) [math]\widetilde{\widetilde{q}}(z)=z_1^2+z_2^2+\ldots+z_r^2[/math], то есть [math]p=r=\sigma<n[/math] — положительный индекс [math](p)[/math], ранг [math](r)[/math] и сигнатура [math](\sigma)[/math] равны, но меньше количества переменных. Отрицательный индекс равен нулю.


4. Для отрицательно (неположительно) определенных квадратичных форм справедливы утверждения аналогичные пунктам 1-3, так как знаки форм [math]q(x)[/math] и [math][-q(x)][/math] противоположные.




Критерий Сильвестра


Теорема 6.4 (критерий Сильвестра). Для того чтобы вещественная квадратичная форма [math]q(x)=x^TAx[/math] была положительно определенной, необходимо и достаточно, чтобы все угловые миноры ее матрицы были положительны:


[math]\Delta_1=a_{11}>0,\quad \Delta_2=\begin{vmatrix}a_{11}&a_{12}\\ a_{21}&a_{22} \end{vmatrix}>0,\quad \ldots,\quad \Delta_n=\det{A}>0.[/math]
(6.20)

Для отрицательной определенности квадратичной формы необходимо и достаточно, чтобы знаки угловых миноров ее матрицы чередовались, начиная с отрицательного:

[math]\Delta_1=a_{11}<0,\quad \Delta_2=\begin{vmatrix}a_{11}&a_{12}\\ a_{21}&a_{22} \end{vmatrix}>0,\quad \ldots,\quad (-1)^n\Delta_n=(-1)^n\det{A}>0.[/math]
(6.20)

В самом деле, рассмотрим первое утверждение теоремы (о положительной определенности). Достаточность условий (6.20) следует из теоремы 6.3 (теоремы Якоби), так как при выполнении этих неравенств квадратичная форма приводится к каноническому виду


[math]\widetilde{q}(y)= \frac{\Delta_1}{\Delta_0}\,y_1^2+ \frac{\Delta_2}{\Delta_1}\,y_2^2+\ldots+ \frac{\Delta_n}{\Delta_{n-1}}\,y_n^2[/math]

с положительными коэффициентами при квадратах переменных [math](\Delta_0=1)[/math]. Ясно, что [math]\widetilde{q}(y)>0[/math] для всех [math]y\ne o[/math], т.е. [math]q(x)=\widetilde{q}(S^{-1}x) >0[/math] для всех [math]x\ne o[/math].


Для доказательства необходимости рассмотрим квадратичную форму [math]q_k(x_1,\ldots,x_k)=q(x_1,\ldots,x_k,0,\ldots,0)[/math] переменных [math]x_1,\ldots,x_k[/math] [math](1\leqslant k\leqslant n)[/math]. Матрица [math]A_k[/math] этой формы представляет собой левый верхний блок матрицы [math]A=\begin{pmatrix}A_k\!\!&\vline\!\!&\ast\\\hline \ast\!\!&\vline\!\!&\ast\end{pmatrix}[/math] данной квадратичной формы (звездочкой [math](\ast)[/math], как обычно, обозначены блоки, не существенные для рассуждений). Из положительной определенности [math]q(x)[/math] следует положительная определенность формы [math]q_k(x_1,\ldots,x_k)[/math]. Тогда из пункта 2 замечаний 6.8 следует, что [math]\det{A_k}>0[/math], но [math]\Delta_k=\det{A_k}[/math] — угловой минор k-го порядка матрицы [math]A[/math]. Таким образом, [math]\Delta_k>0[/math] для [math]1\leqslant k\leqslant n[/math], что и требовалось доказать. Второе утверждение сводится к первому, если рассмотреть квадратичную форму [math][-q(x)][/math] (см. пункт 4 замечаний 6.8).




Критерий полуопределенности квадратичной формы


Теорема 6.5 (критерий полуопределенности квадратичной формы). Для того чтобы квадратичная форма [math]q(x)=x^TAx[/math] была неотрицательно определенной, необходимо и достаточно, чтобы все главные миноры ее матрицы были неотрицательны.


Для неположительной определенности квадратичной формы необходимо и достаточно, чтобы все главные миноры ее матрицы удовлетворяли условиям:


[math](-1)^kM_{j_1\,j_2\,\ldots\,j_k}^{i_1\,i_2\,\ldots\,i_k}\geqslant 0[/math]
(6.22)

для [math]1\leqslant i_1<i_2<\leqslant i_k\leqslant n,~ 1\leqslant j_1<j_2<\leqslant j_k\leqslant n,~ 1\leqslant k\leqslant n[/math].


Условия (6.22) означают, что главные миноры четного порядка должны быть неотрицательны, а нечетного порядка — неположительны. Для доказательства теоремы используется критерий Сильвестра.




Пример 6.12. Выяснить знакоопределенность квадратичных форм с матрицами


[math]A=\begin{pmatrix}1&1\\1&2\end{pmatrix}\!,\quad B=\begin{pmatrix}-1&1\\ 1&-1 \end{pmatrix}\!,\quad C=\begin{pmatrix}0&1&0\\1&0&0\\0&0&-1\end{pmatrix}\!.[/math]

Решение. Матрица [math]A[/math] — положительно определенная [math](A>0)[/math], так как ее угловые миноры положительны [math]\Delta_1=\Delta_2=1>0[/math]. Следовательно, квадратичная форма [math]q(x)=x^TAx=x_1^2+2x_1x_2+2x_2^2[/math] положительно определенная (см. теорему 6.4). Этот вывод подтверждается выделением полных квадратов: [math]q(x)=(x_1+x_2)^2+x_2^2[/math], т.е. квадратичная форма знакоопределенная.


Матрица [math]B[/math] не является положительно или отрицательно определенной, так как ее угловые миноры не удовлетворяют критерию Сильвестра: [math]\Delta_1=-1<9,~\Delta_2=0[/math]. Проверим условия (6.22):


[math](-1)^1M_{{}_1}^{{}^1}=(-1)^1\Delta_1=1\geqslant0,\quad (-1)^1M_{{}_2}^{{}^2}= (-1)^1\cdot(-1)=1\geqslant0,\quad (-1)^2M_{{}_{1\,2}}^{{}^{1\,2}}=(-1)^2\Delta_2=0.[/math]

Условия выполняются, значит, матрица В является неположительно определенной [math](B\leqslant0)[/math]. Следовательно, квадратичная форма [math]q(x)=x^TBx[/math] неположительно определенная. Этот вывод подтверждается выделением полного квадрата:


[math]q(x)=x^T\cdot B\cdot x=-x_1^2+2x_1x_2-x_2^2= -(x_1-x_2)^2,[/math]

т.е. для всех [math]x,\,y[/math] которых [math]x_1=x_2[/math], справедливо равенство [math]q(x)=0[/math], а для остальных [math]x[/math] выполняется неравенство [math]q(x)<0[/math].


Матрица [math]C[/math] не является положительно или отрицательно определенной, так как ее угловые миноры не удовлетворяют критерию Сильвестра: [math]\Delta_1=0,[/math] [math]\Delta_2=-1<0,[/math] [math]\Delta_2=1>0[/math]. Кроме того, эти миноры не удовлетворяют критерию полуопределенности (см. теорему 6.5). Следовательно, матрица [math]C[/math] неопределенная [math](C\gtrless0)[/math]. Тогда и квадратичная форма [math]q(x)=x^TCx=2x_1x_2-x_3^2[/math] неопределенная. Действительно, выпишем


главные миноры первого порядка: [math]M_{{}_1}^{{}^1}=0,~ M_{{}_2}^{{}^2}=0,~ M_{{}_3}^{{}^3}=-1[/math];


главные миноры второго порядка: [math]M_{{}_{1\,2}}^{{}^{1\,2}}=-1,~ M_{{}_{1\,3}}^{{}^{1\,3}}=0,~ M_{{}_{2\,3}}^{{}^{2\,3}}=0[/math];


главный минор третьего порядка: [math]M_{{}_{1\,2\,3}}^{{}^{1\,2\,3}}=1[/math].


Так как среди них есть хотя бы один отрицательный, то квадратичная форма не является неотрицательно определенной. Поскольку среди главных миноров четного порядка есть отрицательный (среди главных миноров нечетного порядка есть положительный), то квадратичная форма не является неположительно определенной. Нетрудно заметить, что при [math]x_1=x_2=0,[/math] [math]x_3=1[/math] [math]q(x)=-1<0[/math], а при [math]x_1=x_2=1,[/math] [math]x_3=0[/math] [math]q(x)=2>0[/math], т.е. квадратичная форма принимает как положительные, так и отрицательные значения, следовательно, является знакопеременной (неопределенной).


Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved