Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Применение поверхностей первого и второго порядков в задачах на экстремум функций

Применение поверхностей первого и второго порядков
в задачах на экстремум функций


Общая постановка задачи поиска экстремума функций приведена здесь. Рассмотрим задачу поиска безусловного экстремума функций двух переменных.


Аналитический метод поиска локального безусловного экстремума


Пусть задана дважды непрерывно дифференцируемая функция [math]f(x)=f(x_1,x_2)[/math] двух переменных.


Точка [math]x^{\ast}[/math] называется точкой локального минимума, если существует такая окрестность этой точки, для всех точек которой выполняется условие


[math]f(x^{\ast})\leqslant f(x).[/math]

Если знак неравенства [math]<[/math] заменить на знак [math]>[/math], то получится определение локального максимума. Точки локального минимума или максимума называются точками локального экстремума функции.


Требуется найти точки локального экстремума функции [math]f(x)[/math].


Порядок решения поставленной задачи содержит два этапа.


На первом этапе при помощи необходимых условий экстремума первого порядка:


[math]\left.\frac{\partial f(x)}{\partial x_1}\right|_{x=x^{\ast}}=0,\quad \left.\frac{\partial f(x)}{\partial x_2}\right|_{x=x^{\ast}}=0,[/math]
(4.74)

находятся стационарные точки [math]x^{\ast}[/math], "подозрительные" на наличие локального экстремума (частные производные первого порядка в точке [math]x^{\ast}[/math] равны нулю).

На втором этапе проверяются достаточные условия экстремума, а если они не выполняются, то и необходимые условия второго порядка. Они следуют из формулы Тейлора для приращения функции в точке [math]x^{\ast}[/math] (учитывая члены до второго порядка включительно):


[math]\Delta f&=f(x_1^{\ast}+\Delta x_1,\,x_2^{\ast}+\Delta x_2)-f(x_1^{\ast},x_2^{\ast})= \frac{1}{2}\Bigl[a_{11}\cdot\Delta x_1^2+2\cdot a_{12}\cdot\Delta x_1\Delta x_2+a_{22}\cdot\Delta x_2^2\Bigr],[/math]

где
[math]a_{11}=\left.\frac{\partial^2f(x)}{\partial x_1^2}\right|_{x=x^{\ast}},\quad a_{12}=\left.\frac{\partial^2f(x)}{\partial x_1\partial x_2}\right|_{x=x^{\ast}},\quad a_{22}=\left.\frac{\partial^2f(x)}{\partial x_2^2}\right|_{x=x^{\ast}},[/math]

а члены с производными первого порядка отсутствуют, так как точка [math]x^{\ast}[/math] удовлетворяет (4.74).

Равенство


[math]\Delta f=\frac{1}{2}\Bigl[a_{11}\cdot\Delta x_1^2+2\cdot a_{12}\cdot\Delta x_1\Delta x_2+a_{22}\cdot\Delta x_2^2\Bigr][/math]
(4.75)

можно рассматривать как уравнение поверхности второго порядка относительно неизвестных [math]\Delta x_1,[/math] [math]\Delta x_2,[/math] [math]\Delta f[/math]. Уравнение (4.75) можно записать в матричной форме

[math]\Delta f=\frac{1}{2}\begin{pmatrix}\Delta x_1&\Delta x_2\end{pmatrix}\cdot H(x^{\ast})\cdot \begin{pmatrix}\Delta x_1\\\Delta x_2\end{pmatrix},[/math]
(4.76)

где [math]H(x^{\ast})[/math] — матрица квадратичной формы, называемая матрицей Гессе.

Она составлена из частных производных второго порядка, вычисленных в стационарной точке [math]x^{\ast}:[/math]


[math]H(x^{\ast})= \begin{pmatrix}a_{11}&a_{12}\\a_{12}&a_{22}\end{pmatrix}= \left.{\begin{pmatrix} \dfrac{\partial^2f(x)}{\partial x_1^2}&\dfrac{\partial^2f(x)}{\partial x_1\partial x_2}\\[10pt] \dfrac{\partial^2f(x)}{\partial x_1\partial x_2&\dfrac{\partial^2f(x)}{\partial x_1^2}}\end{pmatrix}}\right|_{x=x^{\ast}}[/math]

Как показано в разд.4.4.1, при помощи поворота системы координат вокруг оси [math]\Delta f[/math] можно квадратичную форму в правой части (4.76) привести к каноническому виду


[math]\Delta f=\frac{1}{2}\Bigl[\lambda_1\cdot(\Delta x'_1)^2+\lambda_2\cdot(\Delta x'_2)^2\Bigr],[/math]
(4.77)

где [math]\lambda_1,\,\lambda_2[/math] — собственные значения матрицы Гессе [math]H(x^{\ast})[/math].

В зависимости от знаков собственных значений возможны следующие случаи:


1) если собственные значения одного знака, то поверхность (4.77) представляет собой эллиптический параболоид: выпуклый при [math]\lambda_1>0,[/math] [math]\lambda_2>0[/math] (рис.4.58,а), или вогнутый при [math]\lambda_1<0,[/math] [math]\lambda_2<0[/math] (рис.4.58,б);


2) если собственные значения имеют разные знаки, то поверхность (4.77) представляет собой гиперболический параболоид (рис.4.58,в при [math]\lambda_1>0,[/math] [math]\lambda_2<0[/math]);


3) если одно из собственных значений равно нулю (например, при [math]\lambda_2=0[/math]), то поверхность (4.77) представляет собой параболический цилиндр: выпуклый при [math]\lambda_1>0[/math] (рис.4.58,2) или вогнутый при [math]\lambda_1<0[/math] (рис.4.58,д).


Критические (стационарные) точки поверхностей второго порядка

В случае эллиптического параболоида стационарная точка [math]x^{\ast}[/math] является либо точкой локального минимума функции при [math]\lambda_1>0,[/math] [math]\lambda_2>0[/math], либо точкой локального максимума функции при [math]\lambda_1<0,[/math] [math]\lambda_2<0[/math]. В случае гиперболического параболоида ([math]\lambda_1[/math] и [math]\lambda_2[/math] имеют разные знаки) в стационарной точке [math]x^{\ast}[/math] нет экстремума. В случае выпуклого параболического цилиндра можно сказать, что точка [math]x^{\ast}[/math] не может быть точкой максимума, но может быть точкой минимума, в случае вогнутого параболического цилиндра точка [math]x^{\ast}[/math] не может быть точкой минимума, но может быть точкой максимума. Таким образом, если хотя бы одно собственное значение равно нулю, судить о наличии экстремума в точке [math]x^{\ast}[/math] нельзя, так как нужны дополнительные исследования, учитывающие в формуле Тейлора члены выше второго порядка.




Алгоритм исследования функции на локальный экстремум


1. Составить и решить систему (4.74) — найти стационарные точки [math]x^{\ast}[/math]. Если система не имеет решения, то точек локального экстремума нет.


2. Составить матрицу Гессе [math]H(x^{\ast})[/math] и найти ее собственные значения [math]\lambda_1[/math] и [math]\lambda_2[/math], решая характеристическое уравнение


[math]\det\Bigl(H(x^{\ast})-\lambda\cdot E\Bigr)=0.[/math]

3. Проверить выполнение следующих условий.


а) Если [math]\lambda_1>0,[/math] [math]\lambda_2>0[/math], то [math]x^{\ast}[/math] — точка локального минимума.


б) Если [math]\lambda_1<0,[/math] [math]\lambda_2<0[/math], то [math]x^{\ast}[/math] — точка локального максимума.


в) Если [math]\lambda_1\geqslant0,[/math] [math]\lambda_2\geqslant0[/math], то [math]x^{\ast}[/math] может быть точкой локального минимума (требуется дополнительное исследование).


г) Если [math]\lambda_1\leqslant0,[/math] [math]\lambda_2\leqslant0[/math], то [math]x^{\ast}[/math] может быть точкой локального максимума (требуется дополнительное исследование).


д) Если [math]\lambda_1[/math] и [math]\lambda_2[/math] разных знаков [math](\lambda_1\cdot\lambda_2<0)[/math], то [math]x^{\ast}[/math] не является точкой локального экстремума.




Пример 4.25. Найти экстремумы функции [math]f(x)=x_1^3+x_2^3-3x_1x_2[/math].


Решение.. Решая систему уравнений


[math]\frac{\partial f(x)}{\partial x_1}=3\cdot x_1^2-3\cdot x_2=0,\quad \frac{\partial f(x)}{\partial x_2}=3\cdot x_2^2-3\cdot x_1=0,[/math]

находим стационарные точки [math]O(0,0)[/math] и [math]M(1,1)[/math].

Составляем матрицу Гессе [math]H(x)=\begin{pmatrix}6x_1&-3\\-3&6x_2\end{pmatrix}[/math].


В стационарной точке [math]O(0,0)[/math] матрица Гессе [math]H(x)|_{O}=\begin{pmatrix}0&-3\\-3&0\end{pmatrix}[/math]. Найдем собственные значения матрицы Гессе. Характеристическое уравнение


[math]\begin{vmatrix}\,-\lambda&-3\\-3&-\lambda\,\end{vmatrix}=0 \quad\Leftrightarrow\quad \lambda^2-9=0[/math]

имеет корни [math]\lambda_1=3,~\lambda_2=-3[/math] разных знаков. Следовательно, точка [math]O(0,0)[/math] не является точкой экстремума (см. п.3,"д" алгоритма).

В стационарной точке [math]M(1,1)[/math] матрица Гессе [math]H(x)|_{M}=\begin{pmatrix}6&-3\\-3&6\end{pmatrix}[/math]. Характеристическое уравнение


[math]\begin{vmatrix}\,6&-3\\-3&6\,\end{vmatrix} \quad\Leftrightarrow\quad (6-\lambda)^2-9=0[/math]

имеет два положительных корня [math]\lambda_1=3,~\lambda_2=9[/math]. Следовательно, точка [math]M(1,1)[/math] является точкой минимума (см. п.3,"а" алгоритма).



Применение графических методов поиска экстремума функции


Рассмотрим постановку задачи поиска условного экстремума функции трех переменных. Пусть заданы:


а) функция [math]f(x)=f(x_1,x_2,x_3)[/math] трех переменных [math](x\in\mathbb{R}^3)[/math];

б) множество допустимых решений [math]M~(M\subset\mathbb{R}^3)[/math].


Требуется найти такую точку [math]x^{\ast}[/math] из множества допустимых решений, которой соответствует минимальное значение функции [math]f(x)[/math] на этом множестве:


[math]f(x^{\ast})=\min_{x\in M}f(x).[/math]

Алгоритм графического метода поиска условного (или безусловного экстремума) функции аналогичен алгоритму, рассмотренному ранее для функции двух переменных. Однако его применение на практике ограничивается возможностями изображения пространственных фигур. Как правило, используется плоское изображение пространственных фигур, т.е. проекции этих фигур на плоскость, что не дает полного представления о взаимном их расположении.


Ниже рассматриваются задачи, в которых минимизируемая функция и функции, задающие ограничения, являются многочленами трех переменных первой или второй степени. Построение множества допустимых решений и поверхностей уровня функции [math]f(x)[/math] сводится к построению алгебраических поверхностей первого или второго порядков. В этих задачах применение графического метода упрощается.


Напомним, что поверхностью уровня функции [math]f(x)=f(x_1,x_2,x_3)[/math] называется геометрическое место точек пространства, в которых функция принимает постоянное значение, т.е. [math]f(x)=\text{const}[/math].


Если функция [math]f(x)=f(x_1,x_2,x_3)[/math] является многочленом первой степени, то ее поверхности уровня [math]f(x)=\text{const}[/math] при разных значениях постоянной [math](\text{const})[/math] представляют собой семейство параллельных плоскостей (несобственный пучок плоскостей).


Если функция [math]f(x)=f(x_1,x_2,x_3)[/math] является многочленом второй степени, то ее поверхности уровня [math]f(x)=\text{const}[/math] при разных значениях постоянной [math](\text{const})[/math] представляют собой поверхности второго порядка. Поскольку уравнения разных поверхностей уровня отличаются только свободными членами, то собственные векторы, собственные значения [math]\lambda_1,\,\lambda_2,\,\lambda_3[/math], а также инварианты [math]\tau_1,\,\tau_2,\,\delta[/math] остаются постоянными для всех поверхностей уровня [math]f(x)=\text{const}[/math]. Следовательно, тип поверхности и канонический базис остаются постоянными для всех поверхностей уровня квадратичной функции.




Пример 4.26. Графическим методом найти экстремумы:


[math]\mathsf{1)}~f(x)=x_1^2+\frac{x_2^2}{4}+x_3^2\to\text{extr}\,;\quad \mathsf{2)}\,\begin{cases}f(x)=x_3\to\text{extr},\\\dfrac{x_1}{2}+\dfrac{x_2}{3}+x_3=1,\\ x_1,x_2,x_3\geqslant0;\end{cases}\mathsf{3)}\,\begin{cases}f(x)=x_1^2+x_2^2-x_3^2\to\text{extr},\\x_1^2+x_2^2+x_3^2=1.\end{cases}[/math]

Решение.


1) 1. Множество [math]M[/math] допустимых решений строить не нужно, так как оно совпадает со всем пространством: [math]M=\mathbb{R}^3[/math].


2. Поверхность уровня [math]x_1^2+\frac{x_2^2}{4}+x_3^2=\text{const}[/math] при [math]\text{const}>0[/math] представляет собой эллипсоид (рис.4.59,а), при [math]\text{const}=0[/math] — мнимый конус с единственной вещественной точкой [math]O(0,0,0)[/math], при [math]\text{const}<0[/math] — мнимый эллипсоид. При увеличении постоянной [math](\text{const})[/math] полуоси эллипсоида пропорционально увеличиваются. На рис.4.59,а изображены эллипсоиды


[math]x_1^2+\frac{x_2^2}{4}+x_3^2=1~(a=1,~b=2,~c=1)[/math] и [math]\frac{x_1^2}{4}+\frac{x_2^2}{16}+\frac{x_3^2}{4}=1~(a=2,~b=4,~c=2).[/math]

Стрелками указаны направления наискорейшего возрастания функции.

3. Из пункта 2 следует, что допустимые значения функции определяются не равенством [math]0\leqslant f(x)<+\infty[/math].


4. В точке [math]O(0,0,0)[/math] достигается безусловный минимум функции, так как в этой точке функция принимает наименьшее значение по сравнению со значениями в других точках пространства, а наибольшего значения функция не достигает.


Поверхности уровня эллипсоида и плоскости

2) Решается задача поиска условного экстремума с ограничениями типа равенств и неравенств.


1. Строим множество [math]M[/math] допустимых решений — часть плоскости [math]\frac{x_1}{2}+\frac{x_2}{3}+x_3=1[/math] в первом октанте, т.е. плоский треугольник с вершинами [math]A(2,0,0),[/math] [math]B(0,3,0),[/math] [math]C(0,0,1)[/math] (рис.4.59,б).


2. Поверхности уровня [math]x_3=\text{const}[/math] функции [math]f(x_1,x_2,x_3)=x^3[/math] представляют собой семейство параллельных плоскостей, каждая из которых перпендикулярна оси аппликат. На рис.4.59,б изображены три плоскости уровня [math]x_3=0,[/math] [math]x_3=1,[/math] [math]x_3=2[/math]. При [math]\text{const}<0[/math] или [math]\text{const}>1[/math] плоскость [math]x_3=\text{const}[/math] не имеет общих точек с треугольником [math]ABC[/math]; при [math]0\leqslant\text{const}\leqslant1[/math] плоскость [math]x_3=\text{const}[/math] имеет общие точки с треугольником [math]ABC[/math], в частности, при [math]\text{const}=0[/math] плоскости [math]x_3=0[/math] принадлежит сторона [math]AB[/math] треугольника, при [math]\text{const}=1[/math] плоскости [math]x_3=1[/math] принадлежит вершина [math]C[/math] треугольника.


3. Из пункта 2 следует, что допустимые значения функции определяются неравенством [math]0\leqslant f(x)\leqslant1[/math].


4. Наименьшее значение на множестве [math]M[/math], равное нулю, функция достигает в любой точке отрезка [math]AB[/math]; наибольшее значение на множестве [math]M[/math], равное единице, функция достигает в точке [math]C(0,0,1)[/math].


3) Решается задача поиска условного экстремума с ограничением типа равенств.


1. Строим множество [math]M[/math] допустимых решений — сфера [math]x_1^2+x_2^2+x_3^2=1[/math] единичного радиуса с центром в начале координат (рис.4.60).


2. Поверхности уровня [math]x_1^2+x_2^2-x_3^2=\text{const}[/math] представляют собой либо однополостный гиперболоид вращения при [math]\text{const}>0[/math] (например, однополостный гиперболоид [math]x_1^2+x_2^2-x_3^2=1[/math] (рис.4.60,о)), либо круговой конус [math]x_1^2+x_2^2-x_3^2=0[/math] при [math]\text{const}=0[/math] (рис.4.60,б), либо двуполостный гиперболоид вращения при [math]\text{const}<0[/math] (например, двуполостный гиперболоид [math]x_1^2+x_2^2-x_3^2=-1[/math] (рис.4.60,в)). При [math]\text{const}>1[/math] поперечные полуоси однополостного гиперболоида [math]x_1^2+x_2^2-x_3^2=\text{const}[/math] больше единицы, и он не имеет общих точек со сферой единичного радиуса. При [math]\text{const}<-1[/math] продольная полуось двуполостного гиперболоида [math]x_1^2+x_2^2-x_3^2=\text{const}[/math] больше единицы, и он не имеет общих точек со сферой [math]x_1^2+x_2^2+x_3^2=1[/math]. При [math]-1\leqslant\text{const}\leqslant1[/math] поверхность уровня [math]x_1^2+x_2^2-x_3^2=\text{const}[/math] имеет общие точки с заданной сферой.


3. Из п.2 следует, что допустимые значения функции определяются неравенством [math]-1\leqslant f(x)\leqslant1[/math].


4. Наименьшее значение на множестве [math]M[/math], равное –1, функция достигает в точках [math](0,0,\pm1)[/math] — вершинах двуполостного гиперболоида [math]x_1^2+x_2^2-x_3^2=-1[/math] (рис.4.60,в); наибольшее значение на множестве [math]M[/math], равное единице, функция достигает в точках окружности [math]\begin{cases}x_1^2+x_2^2=1,\\x_3=0,\end{cases}[/math] т.е. в точках горлового эллипса (в данном случае окружности) однополостного гиперболоида вращения [math]x_1^2+x_2^2-x_3^2=1[/math] (рис.4.60,а).


Поверхности уровня гиперболоидов и конуса

Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved