Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Применение форм к исследованию функций на экстремум
ОглавлениеЛинейная алгебра

Применение форм к исследованию функций на экстремум


Рассмотрим скалярную (числовую) функцию [math]f(x)=f(x_1,x_2,\ldots,x_n)[/math] векторного аргумента [math]x=\begin{pmatrix}x_1&\cdots&x_n\end{pmatrix}^T[/math], которая каждому действительному значению векторного аргумента [math]x[/math] (т.е. каждому действительному числовому столбцу размеров [math]n\times1[/math]) из области определения функции [math]f(x)[/math], ставит в соответствие действительное число (значение скалярной функции). В этом разделе значение векторного аргумента [math]x[/math] будем называть также точкой в области определения функции.


Напомним необходимые и достаточные условия локального безусловного экстремума функции. Точка [math]x^{\ast}[/math] называется точкой локального минимума (максимума) функции [math]f(x)[/math], если существует такая окрестность точки [math]x^{\ast}[/math], целиком лежащая в области определения функции, что для любой точки [math]x[/math] из этой окрестности выполняется условие [math]f(x^{\ast}(\leqslant f(x)[/math] (соответственно [math]f(x^{\ast}(\qeqslant f(x)[/math]). Точки минимума или максимума называются точками экстремума.


Необходимые условия первого порядка. Если [math]x^{\ast}[/math] является точкой экстремума дифференцируемой функции [math]f(x)[/math], то ее первый дифференциал, вычисленный в этой точке [math]x^{\ast}[/math], есть равная нулю линейная форма


[math]df(x^{\ast})=0.[/math]
(6.23)

Точки, удовлетворяющие условию (6.23), называются стационарными точками дифференцируемой функции [math]f(x)[/math].


Необходимые условия второго порядка. Если стационарная точка [math]x^{\ast}[/math] является точкой минимума (максимума) дважды дифференцируемой функции [math]f(x)[/math], то ее второй дифференциал есть неотрицательно (неположительно) определенная квадратичная форма:


[math]d^2f(x^{\ast})\geqslant0\quad (d^2f(x^{\ast})\leqslant0).[/math]
(6.24)

Заметим, что порядок условий определяется порядком используемых производных, первый дифференциал [math]df(x)[/math] является линейной формой, а второй дифференциал — квадратичной формой (см. п.1, 2 замечаний 6.3) относительно переменных [math]dx_1,\ldots,dx_n[/math]. Матрицу-строку коэффициентов линейной формы (6.23) определяет градиент [math]\left.{\frac{df(x)}{dx}}\right|_{x=x^{\ast}}=\frac{df(x^{\ast})}{dx}[/math], а матрицу квадратичной формы (6.24) — матрица Гессе [math]\left.{\frac{d^2f(x)}{dx^Tdx}}\right|_{x=x^{\ast}}=\frac{d^2f(x^{\ast})}{dx^Tdx}[/math] вычисленные в стационарной точке [math]x^{\ast}[/math].


Достаточные условия экстремума функции. Для того чтобы стационарная точка [math]x^{\ast}[/math] дважды дифференцируемой функции [math]f(x)[/math] была точкой минимума (максимума), достаточно, чтобы ее второй дифференциал был положительно (отрицательно) определенной квадратичной формой:


[math]d^2f(x^{\ast})>0\quad(d^2f(x^{\ast})<0).[/math]
(6.25)

Используя матричные записи первого и второго дифференциалов скалярной функции, условия (6.23)–(6.25) Можно представить в виде равносильных соотношений:


[math]df(x^{\ast})=0\quad \Leftrightarrow\quad \frac{df(x^{\ast})}{dx}=o^T;[/math]
(6.26)

[math]d^2f(x^{\ast})\geqslant0\quad \Leftrightarrow\quad \frac{d^2f(x^{\ast})}{dx^Tdx}\geqslant0;[/math]
(6.27)

[math]d^2f(x^{\ast})\leqslant0\quad \Leftrightarrow\quad \frac{d^2f(x^{\ast})}{dx^Tdx}\leqslant0;[/math]
(6.28)

[math]d^2f(x^{\ast})>0\quad \Leftrightarrow\quad \frac{d^2f(x^{\ast})}{dx^Tdx}>0;[/math]
(6.29)

[math]d^2f(x^{\ast})<0\quad \Leftrightarrow\quad \frac{d^2f(x^{\ast})}{dx^Tdx}<0;[/math]
(6.30)

где [math]o^T[/math] — нулевая строка размеров [math]1\times n[/math].


Для нахождения точек локального экстремума функции нужно выполнить следующие действия.


1. Записать необходимые условия первого порядка (6.26): [math]\frac{df(x^{\ast})}{dx}=o^T[/math] и найти стационарные точки [math]x^{\ast}[/math] в результате решения получающейся системы п уравнений, в общем случае нелинейной.


2. Для каждой найденной стационарной точки проверить выполнение достаточных условий (6.29) или (6.30) с помощью критерия Сильвестра (теорема 6.4). Если они выполняются, то на основании (6.29) или (6.30) сделать вывод о том, что в исследуемой точке достигается локальный минимум или максимум функции соответственно. Если достаточные условия не выполняются, проверить необходимые условия второго порядка (6.27) или (6.28) с помощью теоремы 6.5. В случае их невыполнения сделать заключение об отсутствии экстремума в рассматриваемой точке, а в случае выполнения (6.27) или (6.28) сделать вывод о том, что в рассматриваемой точке может быть минимум или максимум соответственно, однако, условия второго порядка этого не гарантируют. В этом случае требуется продолжение исследований, например, с учетом дифференциалов более высокого порядка.




Пример 6.13. Найти точки локального экстремума функции


[math]f(x)=3x_1^5+x_1^4-5x_1^3-2x_1^2x_2+x_2^2.[/math]

Решение. 1. Найдем градиент функции и запишем необходимые условия экстремума первого порядка (6.26):


[math]\frac{df(x)}{dx}= \begin{pmatrix}\frac{\partial f(x)}{\partial x_1}&\frac{\partial f(x)}{\partial x_2}\end{pmatrix}= \begin{pmatrix}15x_1^4+4x_1^3-15x_1^2-4x_1x_2& -2x_1^2+2x_2\end{pmatrix}= o^T.[/math]

Отсюда получаем систему уравнений [math]\begin{cases}15x_1^4+4x_1^3-15x_1^2-4x_1x_2=0,\\ -2x_1^2+2x_2=0.\end{cases}[/math] Подставляя [math]x_2=x_1^2[/math] в первое уравнение, получаем [math]15x_1^4-15x_1^2=15x_1^2(x_1^2-1)=0[/math]. Следовательно, [math]x_1=0[/math], либо [math]x_1=\pm1[/math]. Таким образом, найдены три стационарных точки [math]x^0=\begin{pmatrix}0&0\end{pmatrix}^T[/math] [math]x^1=\begin{pmatrix}1&1 \end{pmatrix}^T[/math] [math]x^2=\begin{pmatrix}-1&1\end{pmatrix}^T[/math], которые могут быть точками экстремума функции.


2. Для проверки условий (6.27)-(6.30) находим матрицу Гессе


[math]\frac{d^2f(x)}{dx^Tdx}= \begin{pmatrix}\dfrac{\partial^2f(x)}{\partial x_1^2}&\dfrac{\partial^2f(x)}{\partial x_1\partial x_2}\\[9pt] \dfrac{\partial^2f(x)}{\partial x_1\partial x_2}&\dfrac{\partial^2f(x)}{\partial x_2^2} \end{pmatrix}= \begin{pmatrix}60x_1^3+12x_1^2-30x_1-4x_2&-4x_1\\-4x_1&2\end{pmatrix}[/math]

в каждой стационарной точке:

[math]\frac{d^2f(x^0)}{dx^Tdx}=\begin{pmatrix}0&0\\0&2\end{pmatrix}\!,\quad \frac{d^2f(x^1)}{dx^Tdx}=\begin{pmatrix}38&-4\\-4&2\end{pmatrix}\!,\quad \frac{d^2f(x^2)}{dx^Tdx}=\begin{pmatrix}-22&4\\4&2\end{pmatrix}\!.[/math]

Исследуем точку [math]x^0[/math]. Так как [math]\Delta_1=0,~\Delta_2=0[/math], согласно критерию Сильвестра (6.20), (6.21), достаточные условия не выполняются. Для проверки необходимых условий второго порядка вычислим главные миноры: первого порядка [math]M_{{}_1}^{{}^1}=0,~M_{{}_2}^{{}^2}=2[/math]; второго порядка [math]M_{{}_{1\,2}}^{{}^{1\,2}}=0[/math]. Так как все главные миноры неотрицательные, то квадратичная форма [math]d^2f(x^0)[/math] и матрица [math]\begin{pmatrix}0&0\\0&2\end{pmatrix}[/math] являются неотрицательно определенными (по теореме 6.5). Согласно (6.27) точка [math]x^0[/math] может быть точкой минимума. Поскольку один минор [math]M_{{}_2}^{{}^2}=2[/math] нечетного порядка положителен, то квадратичная форма согласно (6.22) не является неположительно определенной. Следовательно, необходимое условие (6.28) второго порядка не выполняется, поэтому точка [math]x^0[/math] не может быть точкой максимума. Продолжим исследование поведения функции в окрестности точки [math]x^0[/math]. Покажем, что в любой сколь угодно малой окрестности точки [math]x^0[/math] найдется точка [math]x[/math], для которой [math]f(x)<0=f(x^0)[/math], т.е. значение функции меньше, чем в исследуемой точке. Действительно, положив [math]x_2=0[/math], имеем


[math]f(x_1,0)= 3x_1^5+x_1^4-5x_1^3=-x_1^3(5-x_1-3x_1^2).[/math]

При любых малых положительных значениях [math]x_1[/math] выражение в скобках положительно (примерно равно 5), поэтому [math]f(x_1,0)<0[/math]. Следовательно, точка [math]x^0[/math] не является точкой минимума (по определению). Так как в точке [math]x^0[/math] нет ни минимума, ни максимума, то она не является точкой экстремума.


Исследуем точку [math]x^1[/math]. Так как [math]\Delta_1=38>0,~\Delta_2=60>0[/math], т.е. угловые миноры матрицы Гессе положительные, то по критерию Сильвестра (6.20) квадратичная форма [math]d^2f(x^1)[/math] и матрица [math]\begin{pmatrix}38&-4\\-4&2\end{pmatrix}[/math] положительно определенные. Это означает, что достаточное условие минимума (6.29) выполняется. Следовательно, точка [math]x^1[/math] является точкой минимума.


Исследуем точку [math]x^2[/math]. Так как [math]\Delta_1=-22<0,~\Delta_2=-60<0[/math], то критерий Сильвестра и, следовательно, достаточные условия экстремума не выполняются. Проверим необходимые условия второго порядка. Находим главные миноры матрицы Гессе. Главные миноры первого порядка: [math]M_{{}_1}^{{}^1}=-22,[/math] [math]M_{{}_2}^{{}^2}=2,[/math] главный минор второго порядка [math]M_{{}_{1\,2}}^{{}^{1\,2}}=-60[/math]. Поскольку среди них есть отрицательные, то квадратичная форма [math]d^2f(x^2)[/math] и матрица [math]\begin{pmatrix}-22&4\\4&2\end{pmatrix}[/math] не могут быть неотрицательно определенными. Поэтому точка [math]x^2[/math] не является точкой минимума. Так как главный минор [math]M_{{}_{1\,2}}^{{}^{1\,2}}=-60[/math] четного порядка отрицательный, то квадратичная форма d2f\x2) и матрица Гессе не могут быть неположительно определенными. Поэтому точка [math]x^2[/math] не является точкой максимума. Следовательно, в точке [math]x^2[/math] нет экстремума.


Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved