Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Линейные и квадратичные формы
ОглавлениеЛинейная алгебра

Линейные и квадратичные формы


Рассмотрим скалярную (числовую) функцию [math]f(x)=f(x_1,x_2,\ldots,x_n)[/math] векторного аргумента [math]x=\begin{pmatrix}x_1&\cdots&x_n\end{pmatrix}^T[/math], которая каждому значению векторного аргумента [math]x[/math], т.е. каждому числовому столбцу размеров [math]n\times1[/math], ставит в соответствие число (значение скалярной функции). Наиболее простыми функциями векторного аргумента являются многочлены.


Многочленом первой степени от [math]n[/math] переменных [math]x_1,\ldots,x_n[/math] называется выражение вида [math]p_1(x)=c_1x_1+c_2x_2+\ldots+c_nx_n+c_0[/math], где числа [math]c_0,c_1,\ldots,c_n[/math]коэффициенты многочлена (предполагается, что среди коэффициентов [math]c_1,\ldots,c_n[/math] есть отличные от нуля); коэффициент [math]c_0[/math] называется свободным членом. Многочлен первой степени называется однородным, если [math]p_1(\lambda x)=\lambda p_1(x)[/math] для любого числа [math]\lambda[/math]. Нетрудно показать, что многочлен [math]p_1(x)[/math] будет однородным тогда и только тогда, когда отсутствует свободный член [math](c_0=0)[/math].


Линейной формой переменных [math]x_1,\ldots,x_n[/math] называется однородный многочлен первой степени


[math]g(x)=\sum_{i=1}^{n}c_ix_i,[/math]
(6.3)

где коэффициенты [math]c_1,\ldots,c_n[/math] многочлена (6.3) называются коэффициентами линейной формы. Составляя из коэффициентов матрицу-строку [math]c=\begin{pmatrix}c_1&\cdots&c_n\end{pmatrix}[/math] (строка коэффициентов линейной формы), а из переменных — матрицу-столбец [math]x=\begin{pmatrix}x_1&\cdots&x_n \end{pmatrix}^T[/math], линейную форму можно записать в виде


[math]g(x)=cx.[/math]
(6.4)

Многочленом второй степени от [math]n[/math] переменных [math]x_1,\ldots,x_n[/math] называется выражение вида [math]p_2(x)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_ix_j+ \sum_{i=1}^{n}b_ix_i+c_0[/math], где числа [math]a_{ij},\,b_i,\,c_0[/math]коэффициенты многочлена: [math]a_{ij}[/math]старшие коэффициенты (или коэффициенты квадратичных членов), [math]b_i[/math]коэффициенты линейных членов, [math]c_0[/math]свободный член. У многочлена второй степени не все старшие коэффициенты [math]a_{ij}[/math] равны нулю одновременно. Многочлен второй степени называется однородным, если [math]p_2(\lambda x)=\lambda^2p_2(x)[/math]. Нетрудно показать, что многочлен [math]p_2(x)[/math] будет однородным тогда и только тогда, когда отсутствуют линейные члены и свободный член [math](b_1=\ldots=b_n=0,~c_0=0)[/math].


Квадратичной формой переменных [math]x_1,\ldots,x_n[/math] называется однородный многочлен второй степени


[math]q(x)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_ix_j\,,[/math]
(6.5)

коэффициенты которого удовлетворяют условиям симметричности [math]a_{ij}=a_{ji},~i,j=1,\ldots,n[/math]. Это условие не ограничивает общности, так как сумму двух подобных членов [math]a_{ij}x_ix_j+a_{ji}x_jx_i[/math] с неравными коэффициентами [math]a_{ij}\ne a_{ji}[/math] (при [math]i\ne j[/math]) всегда можно заменить суммой [math]a'_{ij}x_ix_j+a'_{ji}x_jx_i[/math] с равными коэффициентами, положив [math]a'_{ij}=a'_{ji}=\frac{a_{ij}+a_{ji}}{2}[/math]. Приводя подобные члены, квадратичную форму (6.5) можно представить в виде


[math]q(x)=a_{11}x_1^2+2a_{12}x_1x_2+ \ldots+ 2a_{1n}x_1x_n+ a_{22}x_2^2+2a_{23}x_2x_3+\ldots+a_{nn}x_n^2.[/math]

Это вид квадратичной формы с приведенными подобными членами.

Симметрическая матрица [math]A=\begin{pmatrix}a_{ij}\end{pmatrix}[/math], составленная из коэффициентов квадратичной формы (6.5), называется матрицей квадратичной формы. Определитель этой матрицы называется дискриминантом, а ее ранг — рангом квадратичной формы. Квадратичная форма называется вырожденной, если ее матрица вырожденная [math](\operatorname{rg}A<n)[/math], в противном случае, когда матрица невырожденная [math](\operatorname{rg}A=n)[/math], квадратичная форма называется невырожденной.


Составляя из переменных матрицу-столбец [math]x=\begin{pmatrix}x_1&\cdots&x_n \end{pmatrix}^T[/math], квадратичную форму можно записать в виде


[math]q(x)=x^Tax.[/math]
(6.6)

Чтобы получить матрицу [math]A[/math] квадратичной формы (6.6), нужно:


1) записать квадратичную форму в виде (6.5), разбив удвоенные произведения на сумму двух одинаковых слагаемых;

2) из коэффициентов в (6.5) составить матрицу квадратичной формы. Коэффициенты у отсутствующих членов считаются равными нулю.


Чтобы составить матрицу квадратичной формы с приведенными подобными членами, нужно на главной диагонали матрицы поставить коэффициенты при квадратах переменных, а элементы, симметричные главной диагонали, взять равными половине соответствующих коэффициентов у произведений разных переменных.




Пример 6.4. Составить матрицу квадратичной формы, найти ее дискриминант и ранг:


[math]q(x)=x_1^2+2x_1x_2+3x_2x_3+4x_3^2.[/math]

Решение. Приведем данную квадратичную форму к виду (6.5):


[math]q(x)=x_1^2+x_1x_2+0\cdot x_1x_3+x_2x_1+0\cdot x_2^2+1,\!5x_2x_3+0\cdot x_3x_1+1,\!5x_3x_2+4x_3^2.[/math]

Получили коэффициенты [math]a_{11}=1;\,a_{12}=a_{21}=1;\,a_{13}=a_{31}=0;\, a_{22}=0;\, a_{23}=a_{32}=1,\!5;\,a_{33}=4[/math]. Следовательно, матрица квадратичной формы имеет вид


[math]A=\begin{pmatrix}1&1&0\\1&0&1,\!5\\0&1,\!5&4\end{pmatrix}\!.[/math]

Сравнивая эту матрицу с коэффициентами заданной первоначально формы [math]q(x)=x_1^2+2x_1x_2+3x_2x_3+4x_3^2[/math] отмечаем, что на главной диагонали стоят коэффициенты при квадратах переменных, а элементы, симметричные относительно главной диагонали, равны половине соответствующих коэффициентов у произведений разных переменных. Вычисляем дискриминант и ранг квадратичной формы [math]\det{A}=-6,\!25,[/math] [math]\operatorname{rg}A=3[/math] (так как определитель матрицы не равен нулю).




Пример 6.5. Записать линейную и квадратичную формы


a) [math]g(x_1,x_2,x_3)=x_1-2x_2+3x_3[/math];


б) [math]q(x_1,x_2,x_3)=x_1^2+2x_1x_2+3x_2^2+4x_1x_3+x_3^2[/math]


в матричном виде как функции векторного аргумента [math]x=\begin{pmatrix}x_1&x_2&x_3 \end{pmatrix}^T[/math] и найти их производные первого и второго порядков.


Решение. а) Запишем линейную форму [math]g(x)[/math] в матричном виде:


[math]g(x)=x_1-2x_2+3x_3= \begin{pmatrix}1&-2&3\end{pmatrix}\!\cdot\! \begin{pmatrix} x_1\\x_2\\x_3\end{pmatrix}=c\,x,[/math]

где [math]c=\begin{pmatrix}1&-2&3\end{pmatrix}[/math] — строка коэффициентов линейной формы. Находим градиент [math]\frac{dg}{dx}=c=\begin{pmatrix}1&-2&3\end{pmatrix}[/math] и матрицу Гессе [math]\frac{d^2g}{dx^Tdx}=O[/math], где [math]O[/math] — нулевая матрица 3-го порядка.


б) По заданной квадратичной форме [math]q(x)=x_1^2+2x_1x_2+3x_2^2+4x_1x_3+x_3^2[/math] с приведенными подобными членами составляем ее матрицу, записывая коэффициенты 1,3,1 при квадратах [math]x_1^2,\,x_2^2,\,x_3^2[/math] переменных на главную диагональ: [math]a_{11}=1,[/math] [math]a_{22}=3,[/math] [math]a_{33}=1[/math], а половины соответствующих коэффициентов при произведениях [math]2x_1x_2,\,4x_1x_3[/math] — симметрично главной диагонали: [math]a_{12}=a_{21}=1,[/math] [math]a_{13}=a_{31}=2[/math]. Коэффициенты у отсутствующих членов [math](x_2x_3,\,x_3x_2)[/math] заменяем нулями: [math]a_{23}=a_{32}=0[/math]. Получаем матричную форму записи данной квадратичной формы


[math]q(x)=x_1^2+2x_1x_2+3x_2^2+4x_1x_3+x_3^2= \begin{pmatrix}x_1&x_2&x_3 \end{pmatrix}\!\cdot\! \begin{pmatrix}1&1&2\\1&3&0\\2&0&1\end{pmatrix}\!\cdot\! \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}= x^TAx,[/math]

где [math]A[/math] — матрица квадратичной формы. Находим градиент функции [math]q(x)[/math] и матрицу Гессе

[math]\begin{gathered}\frac{dq}{dx}=\begin{pmatrix}2x_1+2x_2+4x_3&2x_1+6x_2&4x_1+2x_3\end{pmatrix}=2\! \begin{pmatrix}x_1&x_2&x_3 \end{pmatrix}\!\cdot\! \begin{pmatrix}1&1&2\\ 1&3&0\\2&0&1 \end{pmatrix}= 2x^TA,\\ \frac{d^2q}{dx^Tdx}=2\cdot\! \begin{pmatrix} 1&1&2\\1&3&0\\2&0&1\end{pmatrix}= 2\cdot A.\end{gathered}[/math]

Вычислим дискриминант и ранг данной квадратичной формы: [math]\det{A}=-10,~\operatorname{rg}A=3[/math].




Замечания 6.3


1. Важным примером линейной формы служит первый дифференциал скалярной функции [math]f(x)[/math] векторного аргумента [math]x:[/math]


[math]df(x)=\sum_{i=1}^{n}\frac{\partial f(x)}{\partial x_i}\,dx_i= \frac{df(x)}{dx}\,dx,[/math]

где дифференциалы [math]dx_1,\ldots,dx_n[/math] являются переменными линейной формы, градиент [math]\frac{df(x)}{dx}[/math], вычисленный при некотором фиксированном значении аргумента, является строкой коэффициентов линейной формы, а дифференциал векторного аргумента [math]dx=\begin{pmatrix} dx_1&\cdots&dx_n \end{pmatrix}^T[/math] служит столбцом переменных линейной формы.


2. Важным примером квадратичной формы служит второй дифференциал скалярной функции векторного аргумента:


[math]d^2f(x)= \sum_{i=1}^{n}\sum_{j=1}^{n}\frac{\partial^2f(x)}{\partial x_i\partial x_j}\,dx_idx_j= dx^T\frac{d^2f(x)}{dx^Tdx}\,dx,[/math]

где дифференциалы [math]dx_1,\ldots,dx_n[/math] являются переменными квадратичной формы, матрица Гессе [math]\frac{d^2f(x)}{dx^Tdx}[/math], вычисленная при некотором фиксированном значении аргумента, является матрицей квадратичной формы, а дифференциал векторного аргумента [math]dx=\begin{pmatrix}dx_1&\cdots&dx_n \end{pmatrix}^T[/math] служит столбцом переменных квадратичной формы. При этом дискриминант квадратичной формы равен гессиану скалярной функции, вычисленному при некотором значении векторного аргумента [math]x[/math].


3. Как и в случае с многочленами одной переменной многочлены нескольких переменных можно рассматривать либо как функции, применяя к ним понятия математического анализа, либо как алгебраические выражения определенного вида, над которыми можно производить некоторые действия по указанным правилам. Например, линейная форма (6.3) или квадратичная форма (6.5) определены как многочлены, т.е. выражения некоторого вида. При этом можно не указывать область значений переменных, равенство двух многочленов понимать как равенство их степеней и соответствующих коэффициентов и т.п. В то же время, линейную и квадратичную формы можно рассматривать как скалярные функции векторного аргумента. При этом необходимо указывать область определения, равенство двух функций понимать как равенство их значений при каждом значении аргумента и т.п. Каждый из двух подходов полезен для выяснения тех или иных свойств многочленов, и в силу основной теоремы алгебры оба подхода по существу совпадают.




Преобразования форм при линейной замене переменных


Рассмотрим, как меняются коэффициенты линейной и квадратичной форм при линейной замене переменных.


Пусть переменные [math]x_1,\ldots,x_n[/math] (условно называемые старыми) заменяются на переменные [math]y_1,\ldots,y_n[/math] (условно называемые новыми) по формулам:


[math]\begin{cases}x_1= s_{11}y_1+s_{12}y_2+\ldots+ s_{1n}y_n,\\ x_2=s_{21}y_1+s_{22}y_2+\ldots+s_{2n}y_n,\\ \vdots\\ x_n=s_{n1}y_1+s_{n2}y_2+\ldots+s_{nn}y_n,\end{cases}[/math]
(6.7)

где [math]s_{ij}[/math] — некоторые числа [math](i=1,\ldots,n,~j=1,\ldots,n)[/math]. В формуле (6.7) каждая старая переменная является линейной формой новых переменных. Такая замена переменных называется линейной. Составим из коэффициентов [math]s_{ij}[/math] линейных форм (6.7) квадратную матрицу линейной замены переменных [math]S=\begin{pmatrix}(s_{ij}) \end{pmatrix}[/math]. Тогда формулы (6.7) можно записать в виде


[math]x=S\cdot y.[/math]
(6.8)

Линейная замена (6.8) называется невырожденной, если определитель матрицы [math]S[/math] отличен от нуля.




Свойства линейных невырожденных замен переменных


1. Если [math]x=Sy[/math] — линейная невырожденная замена переменных, то обратная замена [math]y=S^{-1}y[/math], выражающая новые переменные [math](y_1,\ldots,y_n)[/math] через старые [math](x_1,\ldots,x_n)[/math], является также линейной и невырожденной.


2. Если [math]x=Sy[/math] и [math]y=Tz[/math] — линейные невырожденные замены переменных, то замена [math]x=STz[/math] является также линейной и невырожденной.


Получим формулу изменения коэффициентов линейной формы при линейной невырожденной замене переменных. Подставляя выражение (6.8) в линейную форму [math]g(x)=cx[/math], получаем снова линейную форму [math]g(Sy)=cSy=c'y[/math], коэффициенты [math]c'=\begin{pmatrix}c'_1&\cdots&c'_n\end{pmatrix}[/math] которой связаны с коэффициентами [math]c=\begin{pmatrix}(c_1&\cdots&c_n)\end{pmatrix}[/math] заданной формы (6.4) равенством


[math]c'=c\cdot S.[/math]
(6.9)



Пример 6.6. Получить формулы преобразования первого дифференциала скалярной функции при линейной невырожденной замене векторного аргумента.


Решение. Пусть [math]f(x)[/math] — скалярная функция векторного аргумента [math]x=\begin{pmatrix}x_1&\cdots&x_n \end{pmatrix}^T[/math]. Первый дифференциал [math]df=\sum_{i=1}^{n}\frac{\partial f}{\partial x_i}\,dx_i=\frac{df}{dx}\,dx[/math] является линейной формой дифференциалов [math]dx_1,\ldots,dx_n[/math] независимых переменных (см. п. 1 замечаний 6.3).


Рассмотрим сложную функцию [math]f(x(y))[/math], где [math]x(y)=Sy[/math] — линейная замена векторного аргумента. Учитывая, что матрица Якоби [math]\frac{dx}{dy}=S[/math] и [math]dy=S^{-1}dx[/math] (так как [math]y=S^{-1}x[/math]), найдем первый дифференциал сложной функции [math]f(x(y))\colon[/math]


[math]df=\frac{df}{dy}\,dy= \frac{df(x(y))}{dy}\,dy= \frac{df(x)}{dx}\frac{dx}{dy}\,dy= \frac{df}{dx}\underbrace{S\cdot S^{-1}}_{E}dx=\frac{df}{dx}\,dx.[/math]

Таким образом, форма первого дифференциала не изменяется при линейной замене аргумента. Это частный случай известного свойства инвариантности формы первого дифференциала.




Получим формулу изменения матрицы квадратичной формы (6.6) при линейной невырожденной замене переменных. Подставляя (6.8) в (6.6), получаем


[math]q(Sy)=(Sy)^TASy=y^TS^TASy=y^TA'y.[/math]

т.е. квадратичную форму [math]q(y)=y^TA'y[/math], матрица которой связана с матрицей заданной квадратичной формы равенством


[math]A'=S^T\cdot A\cdot S.[/math]
(6.10)

Пример 6.7. Найти второй дифференциал сложной функции [math]z(y)=f(x(y))[/math], где [math]x(y)=Sy[/math], в окрестности некоторого фиксированного значения векторного аргумента [math]y_0[/math], если известны матрица Гессе, вычисленная при [math]x=x_0=Sy_0[/math], и матрица [math]S[/math] линейной замены переменных:


[math]\frac{d^2f(x_0)}{dx^Tdx}=\begin{pmatrix}1&1\\1&1\end{pmatrix}\!,\quad S=\begin{pmatrix}1&2\\1&3\end{pmatrix}\!.[/math]

Решение. Второй дифференциал скалярной функции [math]f(x)[/math]


[math]d^2f(x)=\sum_{i=1}^{n}\sum_{j=1}^{n}\frac{\partial^2f(x)}{\partial x_i\,\partial x_j}\,dx_i\,dx_j= dx^T\,\frac{d^2f(x)}{dx^Tdx}\,dx[/math]

является квадратичной формой дифференциалов [math]dx_1,\ldots,dx_n[/math] независимых переменных (см. п.2 замечаний 6.3), причем матрица Гессе является матрицей этой квадратичной формы. При линейной замене переменных матрица Гессе функции [math]z(y)[/math] преобразуется по закону (6.10), т.е.


[math]\frac{d^2z(y_0)}{dy^Tdy}= S^T\frac{d^2f(x_0)}{dx^Tdx}\,S= \begin{pmatrix}1&1\\2&3\end{pmatrix}\!\cdot\! \begin{pmatrix} 1&1\\1&1\end{pmatrix}\!\cdot\! \begin{pmatrix} 1&2\\1&3\end{pmatrix}= \begin{pmatrix} 4&10\\10&25\end{pmatrix}\!.[/math]

Следовательно, искомый дифференциал имеет вид


[math]d^2z=\begin{pmatrix}dy_1&dy_2\end{pmatrix}\!\cdot\! \begin{pmatrix}4&10\\10&25 \end{pmatrix}\!\cdot\! \begin{pmatrix}dy_1\\dy_2\end{pmatrix}= 4dy_1^2+20dy_1dy_2+25dy_2^2.[/math]

Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved