Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 3 часа [ Летнее время ]


Численные методы решения нелинейных уравнений

Численные методы решения нелинейных уравнений


Корни нелинейных уравнений


Пусть дано нелинейное уравнение

f(x)=0,\qquad \mathsf{(3.1)}

где f(x) — функция, определенная и непрерывная на некотором промежутке. В некоторых случаях на функцию f(x) могут быть наложены дополнительные ограничения, например, непрерывность первой и второй производных, что специально оговаривается. Функция f(x) может быть задана в виде алгебраического многочлена или трансцендентной функции (тогда ей соответствует алгебраическое или трансцендентное уравнение).


Требуется найти корни нелинейного уравнения (3.1), т.е. числа x_{\ast1},x_{\ast2},\ldots которые путем подстановки их в (3.1) превращают уравнение в верное числовое равенство. Числа x_{\ast1},x_{\ast2},\ldots называются также нулями функции f(x).


На практике часто бывает выгодно уравнение (3.1) заменить равносильным ему уравнением (уравнения равносильны, если имеют одинаковые корни):


f_1(x)-f_2(x)=0,
(3.2)

где функции f_1(x),\,f_2(x) — более простые, чем функция f(x). Тогда при задании уравнения в виде (3.1) нулями функции f(x) являются точки пересечения f(x) с осью Ox (рис. 3.1,д), а при задании в виде (3.2) — абсциссы точек пересечения функций f_1(x) и f_2(x) (рис. 3.1,б).


Точки пересечения функции с осью абсцисс

Замечания


1. Если f(x)=a_nx^n+a_{n-1}x^{n-1}+\ldots+a_0=P_n(x) — алгебраический многочлен, то уравнение (3.1) называется также алгебраическим n-й степени:


P_n(x)\equiv a_nx^n+a_{n-1}x^{n-1}+\ldots+a_0=0,
(3.3)

где a_n,\ldots,a_0 — действительные числа, коэффициенты уравнения.


График сеточной функции

2. На практике встречаются задачи нахождения корней уравнения f(x_i)=0, левая часть которого задана сеточной функцией y_i=f(x_i),~i=1,2,\ldots,N (рис. 3.2).


Число x_{\ast} есть корень уравнения (3.1) кратности k, если при x=x_{\ast} вместе с функцией f(x) обращаются в нуль ее производные до (k-1)-го порядка включительно, т.е. f(x_{\ast})= f'(x_{\ast})= \ldots= f^{(k-1)}(x_{\ast})=0, а f^{(k)}(x_{\ast})\ne0. Корень кратности к = 1 называется простым. На рис 3.1,с простыми корнями являются x_{\ast1},x_{\ast2},x_{\ast3}, a корни x_{\ast4},x_{\ast5} — кратные.


В соответствии с классическим результатом Галуа алгебраическое уравнение (3.1) при n\geqslant5 не имеет решения в замкнутом (формульном) виде. Сеточные уравнения вообще не имеют формульных решений. Поэтому корни алгебраических (n>2), трансцендентных и сеточных уравнений, как правило, определяются приближенно с заданной точностью.


Решение осуществляется в два этапа:


Первый этап. Находятся отрезки [a_i,b_i], внутри каждого из которых содержится один простой или кратный корень (x_{\ast i}\in[a_i,b_i]) (см. рис. 3.1). Этот этап называется процедурой отделения корней. По сути на нем осуществляется грубое нахождение корней x_{\ast i}.


Второй этап. Грубое значение каждого корня x_{\ast i} уточняется до заданной точности одним из численных методов, в которых реализуются последовательные приближения. Порядок (скорость) сходимости метода определяется так же, как в методе простых итераций.




Отделение корней уравнения


Для отделения действительных корней полезно определять заранее число корней, а также верхнюю и нижнюю границы их расположения. Для этого используется ряд теорем.


Теорема 3.1 (о числе корней алгебраического уравнения (3.3)). Алгебраическое уравнение (3.3) n-й степени имеет ровно n корней, действительных или комплексных, при условии, что каждый корень считается столько раз, какова его кратность.


Теорема 3.2 (о свойстве парной сопряженности комплексных корней уравнения (3.3)). Если x_{\ast i}=\alpha+\beta i — корень алгебраического уравнения (3.3) кратности k, то число \overline{x_{\ast i}}=\alpha-\beta i также является корнем той же кратности.


Следствие. Алгебраическое уравнение нечетной степени имеет по крайней мере один действительный корень.


Теорема 3.3 (об оценке модулей корней уравнения (3.3)). Пусть


A=\max \bigl\{|a_{n-1}|,\ldots,|a_0|\bigr\},\qquad B=\max \bigl\{|a_n|,|a_{n-1}|,\ldots, |a_1|\bigr\},

где a_k,~k=\overline{0,n} — коэффициенты уравнения a_nx^n+a_{n-1}x^{n-1}+ \ldots+ a_{1}x+a_0=0. Тогда модули всех корней x_{\ast i}~(i=1,2,\ldots,n) уравнения удовлетворяют неравенству


\frac{1}{1+\dfrac{B}{|a_0|}}<|x_{\ast i}| \leqslant 1+\frac{A}{|a_n|},\quad i=1,2,\ldots,n,
(3.4)

т.е. корни уравнения расположены в кольце.


Следствие. Числа r=\frac{1}{1+\dfrac{B}{|a_0|}} и R=1+ \frac{A}{|a_n|} являются соответственно нижней и верхней границами положительных корней алгебраического уравнения: r<x_{\ast i}^{+}<R. Аналогично числа -R и -r служат нижней и верхней границами отрицательных корней уравнения: -R<x_{\ast i}^{-}<-r.


Приведем полезные теоремы, используемые для более точного установления границ действительных корней алгебраических уравнений.


Теорема 3.4 (теорема Лагранжа о верхней границе положительных корней уравнения (3.3)). Пусть a_n>0 и a_i — первый отрицательный коэффициент в последовательности a_n,a_{n-1},a_{n-2},\ldots,a_1,a_0;~C — наибольшая из абсолютных величин отрицательных коэффициентов. Тогда за верхнюю границу положительных корней уравнения (3.3) может быть принято число


R=1+\sqrt[\LARGE{n-i}]{\frac{C}{a_n}}\,.
(3.5)

Теорема 3.5 (о нижних и верхних границах положительных и отрицательных корней алгебраического уравнения). Пусть R — верхняя граница положительных корней уравнения P_n(x)=0,

R_1 — верхняя граница положительных корней уравнения P^1(x)= x^nP_n\! \left(\frac{1}{x}\right)=0,
R_2 — верхняя граница положительных корней уравнения P^2(x)= P_n(-x)=0,
R_3 — верхняя граница положительных корней уравнения P^3(x)= x^nP_n\! \left(-\frac{1}{x}\right)=0.

Тогда положительные корни x_{\ast i}^{+} и отрицательные корни x_{\ast i}^{-} уравнения (3.3) удовлетворяют неравенствам


\frac{1}{R_1}\leqslant x_{\ast i}^{+}\leqslant R,\qquad-R_2 \leqslant x_{\ast i}^{-}\leqslant-\frac{1}{R_3}\,.
(3.6)

Теорема 3.6 (теорема Декарта о количестве действительных корней алгебраических уравнений). Число S_1 положительных корней (с учетом их кратностей) алгебраического уравнения P_n(x)=0 равно числу перемен знаков в последовательности коэффициентов a_n,a_{n-1},\ldots,a_0 (коэффициенты, равные нулю, не учитываются) многочлена P_n(x) или меньше этого числа на четное число. Число S_2 отрицательных корней (с учетом их кратностей) алгебраического уравнения P_n(x)=0 равно числу перемен знаков в последовательности a_n,a_{n-1},\ldots,a_0 многочлена P_n(-x) или меньше этого числа на четное число.


Теорема 3.7 (теорема Гюа о необходимом условии действительности всех корней алгебраического уравнения). Если алгебраическое уравнение (3.3) имеет все действительные корни, то квадрат каждого некрайнего коэффициента больше произведения двух его соседних коэффициентов.


Следствие. Если при каком-нибудь k выполнено неравенство a_k^2 \leqslant a_{k-1}a_{k+1}, то уравнение (3.3) имеет по крайней мере одну пару комплексных корней.


Для отделения корней применяется следующая теорема.


Теорема 3.8. Если функция f(x), определяющая уравнение f(x)=0, на концах отрезка [a_i,b_i] принимает значения разных знаков, т.е. f(a_i)\cdot f(b_i)<0, то на этом отрезке содержится по крайней мере один корень уравнения. Если же f(x) непрерывна и дифференцируема и ее первая производная сохраняет знак внутри отрезка [a_i,b_i] \Bigl(\mathop{\operatorname{sign}}\limits_{x\in[a_i,b_i]} f'(x)=\text{const}\Bigr), то на [a_i,b_i] находится только один корень уравнения.




Способы отделения корней


В вычислительной практике обычно используются следующие способы отделения корней:


1) средствами машинной графики: функция f(x) представляется на дисплее и приближенно определяются отрезки, которым принадлежат точки x_{\ast i};

2) средствами математического анализа с помощью исследования функций и построения графиков (см. рис. 3.1,д);

3) формированием простых функций f_1(x) и f_2(x) таких, что получается равносильное уравнение в виде (3.2), и дальнейшим построением графиков этих функций (см. рис. 3.1,б).


▼ Примеры 3.1-3.3

Пример 3.1. Определить число положительных и отрицательных корней, а также их границы для уравнения

P_5(x)= x^5+2x^4-5x^3+8x^2-7x-3=0.

▼ Решение

В данной задаче n=5,~ a_5=1,~ a_4=2,~ a_3=-5,~ a_2=8,~ a_1=-7,~ a_0=-3. Согласно теореме 3.1 уравнение имеет пять корней. Поскольку n=5, то по следствию из теоремы 3.2 уравнение имеет по крайней мере один действительный корень.


Оценим модули корней по теореме 3.3. Так как


A=\max \bigl\{|2|,|-5|,|8|,|-7|,|-3|\bigr\}=8,\qquad B=\max \bigl\{|1|,|2|,|-5|, |8|,|-7|\bigr\}=8,

то \frac{1}{1+\frac{8}{|-3|}}<|x_{\ast i}|<1+\frac{8}{|1|} или \frac{3}{11}<|x_{\ast i}|<9, т.е. все корни лежат внутри данного кольца. По следствию из теоремы 3.3 это означает, что положительные корни удовлетворяют неравенству \frac{3}{11}<x_{\ast i}^{+}<9, а отрицательные — неравенству -9<x_{\ast i}^{-}<-\frac{3}{11}.


Применим теоремы 3.4 и 3.5 для уточнения приведенных результатов. Найдем верхнюю границу положительных корней. Так как a_3=-5 — первый отрицательный коэффициент в последовательности 1,2,-5,8,-7,-3, то i=3, а C=\max \bigl\{|-5|,|-7|,|-3|\bigr\}=7 — наибольшая из абсолютных величин отрицательных коэффициентов. Следовательно, R=1+\sqrt[\LARGE{(5-3)}]{\frac{7}{1}}= 1+\sqrt{7}\cong3,\!646.


Найдем нижнюю границу положительных корней. Составим уравнение:


\begin{aligned}P^{1}(x)&= x^nP_n\! \left(\frac{1}{x}\right)= x^5P_5\!\left(\frac{1}{x} \right)= x^5\! \left(\frac{1}{x^5}+ \frac{2}{x^4}-\frac{5}{x^3}+\frac{8}{x^2}-\frac{7}{x}-3\right)=\\ &=-3x^5-7x^4+8x^3-5x^2+2x+1=0.\end{aligned}

или 3x^5+7x^4-8x^3+5x^2-2x-1=0 (старший коэффициент должен быть положительным). Для этого уравнения i=3,~ C=\max \bigl\{|-8|,|-2|,|-1|\bigr\}=8, поэтому R_1=1+\sqrt[\LARGE{(5-3)}]{\frac{8}{3}}=1+\sqrt{\frac{8}{3}}\cong2,\!632. Отсюда \frac{1}{R_1}=0,\!38 \leqslant x_{\ast i}^{+}\leqslant R=3,\!646.


Уточним границы отрицательных корней. Составим уравнение:


P^2(x)=P_5(-x)= или x^5-2x^4-5x^3-8x^2-7x+3=0.

Для этого уравнения i=4,~ C=\max\bigl\{|-2|,|-5|,|-8|,|-7|\bigr\}=8, поэтому R_2=1+ \sqrt[\LARGE{5-4}]{\frac{8}{1}}=9. Составим уравнение


\begin{aligned}P^3(x)&= x^nP_n\! \left(-\frac{1}{x}\right)= x^5P_5\! \left(-\frac{1}{x}\right)= x^5\! \left(-\frac{1}{x^5}+\frac{2}{x^4}+\frac{5}{x^3}+\frac{8}{x^2}+\frac{7}{x}-3\right)=\\ &=-3x^5+7x^4+8x^3+2x-1=0.\end{aligned}

или 3x^5-7x^4-8x^3-5x^2-2x+1=0. Для этого уравнения i=4,~ C=\max \bigl\{|-7|,|-8|,|-5|,|-2|\bigr\}=8, поэтому R_3=1+\sqrt[\LARGE{5-4}]{\frac{8}{3}}=1+ \frac{8}{3}\cong3,\!666. Отсюда находим: -R_2=-9 \leqslant x_{\ast i}^{-}\leqslant-\frac{1}{R_3}=-0,\!272. Заметим, что данный результат совпадает с полученным ранее.


Исследуем структуру корней уравнения. Так как квадрат каждого некрайнего коэффициента больше произведения двух его соседних коэффициентов, то по теореме 3.7 необходимое условие действительности всех корней уравнения выполняется.


На основе теоремы 3.6 определим число положительных и отрицательных корней. Выписываем коэффициенты многочлена P_n(x)=P_5(x)\colon\, 1,\,2,-5,\,8,-7,-3. Так как число перемен знака S_1=3, то число положительных корней равно трем или меньше на четное число, т.е. равно 1. Далее выписываем коэффициенты многочлена P_5(-x)\colon\, -1,\,2,\,5,\,8,\,7,-3. Так как число перемен знаков S_2=2, то число отрицательных корней равно двум или меньше на четное число, т.е. их вообще нет.


Пример 3.2. Отделить корни кубического уравнения x^3-x+1=0.


▼ Решение
Точка пересечения кубической параболы и прямой

Согласно теореме 3.1 уравнение имеет три корня, среди которых по крайней мере один действительный (следствие из теоремы 3.2, поскольку это уравнение нечетной степени).


Оценим модули корней уравнения по теореме 3.3. Так как


A=\max \bigl\{|0|,|-1|,|1|\bigr\}=1,\quad B=\max \bigl\{|1|,|0|,|-1|\bigr\}=1, то \frac{1}{1+\dfrac{1}{|1|}}<|x_{\ast i}|<1+\frac{1}{|1|} или \frac{1}{2}<|x_{\ast i}|<2.

Отсюда \frac{1}{2}<x_{\ast i}^{+}<2 и -2<x_{\ast i}^{+}<-\frac{1}{2}.


Определим число положительных и отрицательных корней. Выписываем коэффициенты многочлена P_3(x)\colon\, 1,\,0,-1,\,1. Так как число перемен знака S_1=2 (нулевой коэффициент не учитывается), то число положительных корней равно двум или меньше на четное число, т.е. они отсутствуют. Далее выписываем коэффициенты многочлена P_3(-x)=-x^3+x+1\colon\, -1,\,0,\,1,\,1. Так как число перемен знака S_2=1 (нулевой коэффициент не учитывается), то число отрицательных корней равно единице.


Отделим корни третьим способом. Для этого преобразуем уравнение к равносильному виду (3.2): x^3=x-1 и найдем точки пересечения фафиков y=x^3 и y=x-1 (рис. 3.3).


Очевидно, корень уравнения x_{\ast}\in[-2;-1].


Пример 3.3. Отделить корни уравнения третьего порядка x^3-x^2-9x+9=0.


▼ Решение
Точки пересечения кубической и квадратичной парабол

Согласно теореме 3.1 уравнение имеет три корня, среди которых по крайней мере один действительный (по следствию из теоремы 3.2). Оценим модули корней уравнения по теореме 3.3.


Так как A=\max \bigl\{|-1|,|-9|,|9|\bigr\}=9,~ B=\max \bigl\{|1|,|-1|,|-9|\bigr\}=9, то


\frac{1}{1+\frac{9}{|9|}}<|x_{\ast i}|<1+\frac{9}{|1|} или \frac{1}{2}<|x_{\ast i}|<10. Отсюда \frac{1}{2}<x_{\ast i}^{+}<10 и -10<x_{\ast i}^{-}<-\frac{1}{2}\,.

Определим число положительных и отрицательных корней. Выписываем коэффициенты многочлена P_3(x)\colon\,1,-1,-9,\,9. Так как число перемен знака S_1=2, то уравнение имеет два положительных корня или ни одного. Далее выписываем коэффициенты многочлена P_3(-x)=-x^3-x^2+9x+9\colon\,-1,-1,\,9,\,9. Так как число перемен знака S_2=1, то имеется один отрицательный корень.


Отделим корни третьим способом. С этой целью преобразуем уравнение к равносильному виду: x^3=x^2+9x-9. Найдем абсциссы точек пересечения фафиков y=x^3 и y=x^2+9x-9 (см. рис. 3.4 указаны два из трех полученных промежутков).


Результат отделения корней — три промежутка [0,5; 2],\,[2; 4],\,[-4;-2]. Заметим, что отрезки могуг быть сужены, например, вместо отрезка [2,4] можно принять [2,\!5; 4].




Процедура уточнения положения корня функции

Метод половинного деления


Пусть дано уравнение f(x)=0 и отделен простой корень x_{\ast}, т.е. найден такой отрезок [a_0,b_0], что x_{\ast}\in[a_0,b_0] и на концах отрезка функция имеет значения, противоположные по знаку (f(a_0)\cdot f(b_0)<0). Отрезок [a_0,b_0] называется начальным интервалом неопределенности, потому что известно, что корень ему принадлежит, но его местоположение с требуемой точностью не определено.


Процедура уточнения положения корня заключается в построении последовательности вложенных друг в друга отрезков, каждый из которых содержит корень уравнения. Для этого находится середина текущего интервала неопределенности c_k=\frac{a_k+b_k}{2},~ k=0,1,2,\ldots, и в качестве следующего интервала неопределенности из двух возможных выбирается тот, на концах которого функция f(x) имеет разные знаки (рис. 3.5).


Процесс завершается, когда длина текущего интервала неопределенности становится меньше заданной величины \varepsilon, задающей точность нахождения корня. В качестве приближенного значения корня берется середина последнего интервала неопределенности.




Алгоритм метода половинного деления


1. Найти начальный интервал неопределенности L_0=[a_0,b_0] одним из методов отделения корней, задать малое положительное число \varepsilon. Положить k=0.


2. Найти середину текущего интервала неопределенности: c_k=\frac{a_k+b_k}{2}.


3. Если f(a_k)\cdot f(c_k)<0, то положить a_{k+1}=a_k,~ b_{k+1}= c_k, а если f(c_k)\cdot f(b_k)<0, то принять a_{k+1}=c_k,~ b_{k+1}= b_k. В результате находится текущий интервал неопределенности L_{k+1}= [a_{k+1},b_{k+1}].


4. Если b_{k+1}-a_{k+1}\leqslant \varepsilon, то процесс завершить: x_{\ast}\in L_{k+1}= [a_{k+1},b_{k+1}]. Приближенное значение корня можно найти по формуле x_{\ast}\cong \frac{a_{k+1}+b_{k+1}}{2}.


Если b_{k+1}-a_{k+1}>\varepsilon, положить k=k+1 и перейти к п.2.


Замечания


1. Метод имеет линейную, но безусловную сходимость, и его погрешность за каждую итерацию уменьшается в два раза:


|b_1-a_1|=\frac{|b_0-a_0|}{2};\quad |b_2-a_2|= \frac{|b_1-a_1|}{2}= \frac{|b_0-a_0|}{2^2},\quad \ldots,\quad |b_k-a_k|= |b_0-a_0|\cdot2^{-k}.

Из последнего соотношения можно оценить число итераций k для достижения заданной точности \varepsilon\colon


|b_0-a_0|\cdot2^{-k} \leqslant \varepsilon;\qquad k \geqslant \log_{2}\frac{|b_0-a_0|}{\varepsilon}\,.

Отсюда видно, что, например, для достижения точности \varepsilon\approx10^{-3} при (b_0-a_0)\cong1 необходимо выполнить примерно десять итераций.


2. К достоинствам метода следует отнести то, что он позволяет найти простой корень уравнения x_{\ast}\in[a_0,b_0] любых непрерывных функций f(x) при любых значениях a_0,\,b_0 таких, что f(a_0)\cdot f(b_0)<0. Недостатки метода — он не обобщается на системы нелинейных уравнений и не может использоваться для нахождения корней четной кратности.


▼ Примеры 3.4-3.6

Пример 3.4. Найти корень уравнения x^3-x+1=0 методом половинного деления с точностью \varepsilon_1=0,\!01 и \varepsilon_2=0,\!0005.


▼ Решение

В примере 3.2 корень уравнения был отделен: x_{\ast}\in[-2;-1], поэтому a_0=-2,~ b_0=-1.


Очевидно, функция непрерывна на отрезке [-2;-1], имеет единственный простой корень (см. рис. 3.3). На концах отрезка функция имеет значения f(-2)=-5,~ f(-1)=1, противоположные по знаку. Результаты расчетов приведены в табл. 3.1.


\begin{aligned} \mathit{Table~3.1}~&\\ \begin{array}{|c|c|c|c|c|c|c|c|} \hline \begin{matrix}{}\\[-2pt]{}\end{matrix} k& f(a_k)& a_k& b_k& f(b_k)& c_k=\dfrac{a_k+b_k}{2}& f(c_k)& b_k-a_k\\\hline 0& -5& -2& -1& 1& -1,\!5& -0,\!875& 1\\\hline 1& -0,\!875& -1,\!5& -1& 1& -1,\!25& 0,\!2965& 0,\!5\\\hline 2& -0,\!875& -1,\!5& -1,\!25& 0,\!2965& -1,\!375& -0,\!224& 0,\!25\\\hline 3& -0,\!224& -1,\!375& -1,\!25& 0,\!2965& -1,\!3125& 0,\!05& 0,\!125\\\hline 4& -0,\!224& -1,\!375& -1,\!3125& 0,\!05& -1,\!34375& -0,\!08& 0,\!0625\\\hline 5& -0,\!08& -1,\!34375& -1,\!3125& 0,\!05& -1,\!3282& -0,\!015& 0,\!03125\\\hline 6& -0,\!015& -1,\!3282& -1,\!3125& 0,\!05& -1,\!3204& 0,\!018& 0,\!0156\\\hline 7& -0,\!015& -1,\!3282& -1,\!3204& 0,\!018& -1,\!3243& 0,\!0018& 0,\!00781\\\hline 8& -0,\!015& -1,\!3282& -1,\!3243& 0,\!0018& -1,\!3263& -0,\!007& 0,\!0039\\\hline 9& -0,\!007& -1,\!3263& -1,\!3243& 0,\!0018& -1,\!3253& -0,\!0025& 0,\!002\\\hline 10& -0,\!0025& -1,\!3253& -1,\!3243& 0,\!0018& -1,\!3248& -0,\!0003& 0,\!001\\\hline 11& -0,\!0003& -1,\!3248& -1,\!3243& 0,\!0018& -& -& 0,\!0005\\\hline \end{array}& \end{aligned}

Если \varepsilon_1=0,\!01, корень x_{\ast}\in[-1,\!3282;-1,\!3204], а если \varepsilon_=0,\!0005 — корень x_{\ast}\in[-1,\!3248;-1,\!3243] или x_{\ast}\cong \frac{-1,\!3282-1,\!3204}{2}= при \varepsilon_1=0,\!01 и x_{\ast}\cong \frac{-1,\!3248-1,\!3243}{2}=-1,\!3245 при \varepsilon_2=0,\!0005.


Пример 3.5. Найти корень уравнения x^3-x^2-9x+9=0 методом половинного деления с точностью \varepsilon=0,\!001.


▼ Решение

В примере 3.3 были отделены корни уравнения. Уточним корень, лежащий на отрезке [2,\!5;4]. Результаты расчетов поместим в табл. 3.2.


\begin{aligned} \mathit{Table~3.2}~&\\ \begin{array}{|c|c|c|c|c|c|c|c|} \hline \begin{matrix}{}\\[-2pt]{}\end{matrix} k& f(a_k)& a_k& b_k& f(b_k)& c_k=\dfrac{a_k+b_k}{2}& f(c_k)& b_k-a_k\\\hline 0& -4,\!125& 2,\!5& 4& 21& 3,\!25& 3,\!5156& 1,\!5\\\hline 1& -4,\!125& 2,\!5& 3,\!25& 3,\!5156& 2,\!875& -1,\!3769& 0,\!75\\\hline 2& -1,\!3769& 2,\!875& 3,\!25& 3,\!5156& 3,\!0625& 0,\!78149& 0,\!375\\\hline 3& -1,\!3769& 2,\!875& 3,\!0625& 0,\!7815& 2,\!96875& -0,\!3672& 0,\!1875\\\hline 4& -0,\!3672& 2,\!9687& 3,\!0625& 0,\!7815& 3,\!01562& 0,\!18945& 0,\!09375\\\hline 5& -0,\!3672& 2,\!9687& 3,\!0156& 0,\!1894& 2,\!99218& -0,\!0933& 0,\!04687\\\hline 6& -0,\!0933& 2,\!9921& 3,\!0156& 0,\!1894& 3,\!0039& 0,\!0469& 0,\!02344\\\hline 7& -0,\!0933& 2,\!9921& 3,\!0039& 0,\!0469& 2,\!99804& -0,\!02349& 0,\!01172\\\hline 8& -0,\!02349& 2,\!99804& 3,\!0039& 0,\!0469& 3,\!00097& 0,\!011647& 0,\!00586\\\hline \end{array}& \end{aligned}

В результате найден интервал [2,\!99804;3,\!0039] и приближенное значение корня x_{\ast}\cong3,\!00097.


Пример 3.6. Отделить корни трансцендентного уравнения x^2-e^{-x}=0 и найти один из корней с точностью \varepsilon=0,\!01.


▼ Решение

1. Можно отделить корни уравнения, преобразовав его к равносильному виду x^2=e^{-x} и определив абсциссу точек пересечения графиков функций y=f_1(x)=x^2 и y=f_2(x)=e^{-x}\colon\, x_{\ast}\in[0,\!5;1]. При этом f(0,\!5)\cdot f(1)<0.


2. Уточним корень. Результаты расчетов приведем в табл. 3.3.


\begin{aligned} \mathit{Table~3.3}~&\\ \begin{array}{|c|c|c|c|c|c|c|c|} \hline \begin{matrix}{}\\[-2pt]{}\end{matrix} k& f(a_k)& a_k& b_k& f(b_k)& c_k=\dfrac{a_k+b_k}{2}& f(c_k)& b_k-a_k\\\hline 0& -0,\!3565& 0,\!5& 1& 0,\!6321& 0,\!75& 0,\!09013& 0,\!5\\\hline 1& -0,\!3565& 0,\!5& 0,\!75& 0,\!09013& 0,\!625& -0,\!1446& 0,\!251\\\hline 2& -0,\!1446& 0,\!625& 0,\!75& 0,\!09013& 0,\!6875& -0,\!0301& 0,\!125\\\hline 3& -0,\!0301& 0,\!6875& 0,\!75& 0,\!09013& 0,\!7187& 0,\!0292& 0,\!0625\\\hline 4& -0,\!0301& 0,\!6875& 0,\!7187& 0,\!0292& 0,\!7031& -0,\!00069& 0,\!0312\\\hline 5& -0,\!00069& 0,\!7031& 0,\!7187& 0,\!0292& 0,\!7109& 0,\!0142& 0,\!0156\\\hline 6& -0,\!00069& 0,\!7031& 0,\!7109& 0,\!0142& 0,\!707& 0,\!0067& 0,\!0078\\\hline \end{array}& \end{aligned}

Вычисления показывают, что b_6-a_6=0,\!7109-0,\!7031=0,\!0078< \varepsilon= 0,\!01.

Поэтому x_{\ast}\cong \frac{0,\!7109+0,\!7031}{2}= c_6=0,\!707.




Геометрическая интерпретация метода хорд

Метод хорд


Этот метод при тех же предположениях обеспечивает более быстрое нахождение корня, чем метод половинного деления. Для этого отрезок [a,b] делится не пополам, а в отношении |f(a)|\,\colon|f(b)|.


Геометрически метод хорд эквивалентен замене кривой y=f(x) хордой, проходящей через точки (a,f(a)) и (b,f(b)) (рис. 3.6).


Уравнение хорды AB имеет вид \frac{x-a}{b-a}= \frac{y-f(a)}{f(b)-f(a)}. Полагая x=x^{(1)} и y=0, получаем


x^{(1)}= a-\frac{f(a)}{f(b)-f(a)}\cdot(b-a).

Предположим, что вторая производная f''(x) сохраняет постоянный знак, и рассмотрим два случая: f(a)>0,~ f''(a)>0 (рис. 3.7,д) и f(a)<0,~ f''(x)>0 (рис. 3.7,б). Случай f''(x)<0 сводится к рассматриваемому, если уравнение записать в форме: -f(x)=0. Первому случаю (см. рис. 3.7,д) соответствует формула (3.7), а второму случаю (3.8) (см. рис. 3.7,б):


\begin{aligned}&x^{(0)}=b,\\ &x^{(k+1)}=x^{(k)}-\frac{f(x^{(k)})}{f(x^{(k)})-f(a)} \bigl(x^{(k)}-a\bigr),\quad k=0,1,2,\ldots\end{aligned}
(3.7)

\begin{aligned}&x^{(0)}=a,\\ &x^{(k+1)}=x^{(k)}-\frac{f(x^{(k)})}{f(b)-f(x^{(k)})}\bigl(b-x^{(k)}\bigr),\quad k=0,1,2,\ldots \end{aligned}
(3.8)

В первом случае остается неподвижным конец a, а во втором случае конец b.


Метод хорд

Замечание. Для выявления неподвижного конца используется условие f''(x)\cdot f(t)>0, где t=a или t=b. Если неподвижен конец a, применяется формула (3.7), а если конец b, — формула (3.8).


Пример 3.7. Найти корень уравнения x^3-x+1=0 методом хорд с точностью \varepsilon=0,\!001.


▼ Решение

Рассмотрим задачу нахождения корня на отрезке [-2;-1] (см. пример 3.2). Так как f(a)=f(-2)=-5, f(b)=f(-1)=-1, a f''(x)=3x^2-1>0 на отрезке [-2;-1], то f''(x)\cdot f(b)>0 и, следовательно, имеем второй случай (см. рис. 3.7,б).


Положим x^{(0)}=a=-2,~k=0. Тогда по формуле (3.8) получаем


x^{(1)}= x^{(0)}-\frac{f(x^{(0)})}{f(b)-f(x^{(0)})}\bigl(b-x^{(0)}\bigr)=-2-\frac{-5}{1-(-5)}\cdot(-1-(-2))=-1,\!1666.

Так как \Delta_1=|x^{(1)}-x^{(0)}|=0,\!8334>\varepsilon, то положим k=1 и продолжим процесс:


x^{(2)}= x^{(1)}-\frac{f(x^{(1)})}{f(b)-f(x^{(1)})}\bigl(b-x^{(1)}\bigr)=-1,\!1666-\frac{-0,\!5786}{1-0,\!5786}\cdot \bigl(-1-(-1,\!1666)\bigr)=-1,\!3953.

Так как \Delta_2=|x^{(2)}-x^{(1)}|=0,\!2287>\varepsilon, то положим k=2 и продолжим процесс:


x^{(3)}= x^{(2)}-\frac{f(x^{(2)})}{f(b)-f(x^{(2)})}\bigl(b-x^{(2)}\bigr)=-1,\!3953-\frac{-0,\!3214}{1+0,\!3214}\cdot \bigl(-1-(-1,\!3953)\bigr)=-1,\!2991.

Поскольку \Delta_3=|x^{(3)}-x^{(2)}|=0,\!0962>\varepsilon, положим k=3\colon


x^{(4)}= x^{(3)}-\frac{f(x^{(3)})}{f(b)-f(x^{(3)})}\bigl(b-x^{(3)}\bigr)=-1,\!2991-\frac{-0,\!1064}{1+0,\!1064}\cdot \bigl(-1-(-1,\!2991)\bigr)=-1,\!3347.

Так как \Delta_4=|x^{(4)}-x^{(3)}|=0,\!0356>\varepsilon, положим k=4\colon


x^{(5)}= x^{(4)}-\frac{f(x^{(4)})}{f(b)-f(x^{(4)})}\bigl(b-x^{(4)}\bigr)=-1,\!3347-\frac{-0,\!043}{1+0,\!043}\cdot \bigl(-1-(-1,\!3347)\bigr)=-1,\!3209.

Поскольку \Delta_5=|x^{(5)}-x^{(4)}|=0,\!0138>\varepsilon, положим k=5\colon


x^{(6)}= x^{(5)}-\frac{f(x^{(5)})}{f(b)-f(x^{(5)})}\bigl(b-x^{(5)}\bigr)=-1,\!3209-\frac{-0,\!0162}{1+0,\!0162}\cdot \bigl(-1-(-1,\!3209)\bigr)=-1,\!3261.

Так как \Delta_6=|x^{(6)}-x^{(5)}|=0,\!0052>\varepsilon, положим k=6\colon


x^{(7)}= x^{(6)}-\frac{f(x^{(6)})}{f(b)-f(x^{(6)})}\bigl(b-x^{(6)}\bigr)=-1,\!3261-\frac{-0,\!0059}{1+0,\!0059}\cdot \bigl(-1-(-1,\!3261)\bigr)=-1,\!3241.

Поскольку \Delta_7=|x^{(7)}-x^{(6)}|=0,\!0020>\varepsilon, положим k=7\colon


x^{(8)}= x^{(7)}-\frac{f(x^{(7)})}{f(b)-f(x^{(7)})}\bigl(b-x^{(7)}\bigr)=-1,\!3241-\frac{-0,\!00217}{1+0,\!00217}\cdot \bigl(-1-(-1,\!3241)\bigr)=-1,\!3248.

Так как \Delta_8=|x^{(8)}-x^{(7)}|=0,\!0007<\varepsilon=0,\!001, то корень уравнения x_{\ast}\cong-1,\!3248. Из анализа поведения \Delta_k следует, что сходимость метода хорд линейная, однако более быстрая, чем сходимость метода половинного деления.




Абсцисса точки пересечения прямой и кривой

Метод простых итераций


Пусть известно, что корень x_{\ast} уравнения f(x)=0 лежит на отрезке G=\{a\leqslant x\leqslant b\}.


Методика решения задачи


1. Уравнение f(x)=0 равносильным преобразованием привести к виду x=\varphi(x). Это преобразование может быть осуществлено различными путями, но для сходимости нужно обеспечить выполнение условия |\varphi'(x)|\leqslant\chi<1 (\chi — некоторая константа). При этом задача сводится к нахождению абсциссы точки пересечения прямой y=x и кривой y=\varphi(x) (рис. 3.8).


2. Задать начальное приближение x^{(0)}\in[a,b] и малое положительное число \varepsilon. Положить k=0.


3. Вычислить следующее приближение:


x^{(k+1)}= \varphi(x^{(k)}).
(3.9)

4. Если |x^{(k+1)}-x^{(k)}|\leqslant\varepsilon, итерации завершаются и x_{\ast}\cong x^{(k+1)}. Если |x^{(k+1)}-x^{(k)}|>\varepsilon, положить k=k+1 и перейти к п.3.


Замечание. В качестве условия завершения итераций при известном значении \chi может быть использовано неравенство


\bigl|x^{(k+1)}-x^{(k)}\bigr|\leqslant \frac{1-\chi}{\chi}\cdot \varepsilon.

Проблемы сходимости и единственности численного решения, являющиеся главными при использовании этого метода, решаются и исследуются с помощью понятия о сжимающем отображении и теоремы о достаточном условии сходимости метода.


Отображение (функция) \varphi(x) называется сжимающим в области G с коэффициентом \chi~(0\leqslant\chi<1), если для любых двух x',\,x'' из G выполнено неравенство


\bigl|\varphi(x'')-\varphi(x')\bigr|\leqslant\chi\cdot\bigl|x''-x'\bigr|.
(3.10)

Теорема 3.9 (о сходимости метода простых итераций и единственности получаемого численного решения)


Пусть выполнены условия:

1. Нелинейное уравнение x=\varphi(x) имеет решение x_{\ast}\in G.

2. Отображение \varphi(x) является сжимающим в области G с некоторым коэффициентом \chi~(0\leqslant\chi<1).

Тогда:


а) решение x_{\ast} является единственным решением в области G;


б) последовательность x^{(0)},x^{(1)},\ldots,x^{(k+1)},\ldots, определяемая по отображению на основе итерационного процесса, сходится к решению x_{\ast} со скоростью геометрической прогрессии, т.е. при выборе x^{(0)} из условия |x_{\ast}-x^{(0)}|<R, где R>0 — некоторое малое число, справедливо неравенство


\bigl|x_{\ast}-x^{(k)}\bigr| \leqslant \chi^k\cdot \bigl|x_{\ast}-x^{(0)}\bigr|,\quad k=0,1,2,\ldots

Теорема 3.9 утверждает, что при выполнении условий 1,2 существует окрестность G(x_{\ast},R) такая, что если взять x^{(0)} в этой окрестности и вычислять x^{(1)},x^{(2)},\ldots по формуле (3.9), то в результате с любой наперед заданной точностью можно вычислить x^{(k+1)}\approx x_{\ast}, соответствующее искомому (единственному) корню. Но так как эта окрестность неизвестна, то можно взять произвольное x^{(0)}\in G. Если при этом вычисляется последовательность x^{(0)},x^{(1)},x^{(2)},\ldots,x{(k)},\ldots, сходящаяся к некоторому значению \widehat{x}, то в силу теоремы \widehat{x}=x_{\ast}. Если сходимость отсутствует, то надо взять другое x^{(0)}\in G и повторить расчет.


Теорема 3.10 (о достаточном условии сходимости метода простых итераций). Пусть выполнены условия:

1. Функция \varphi(x) имеет производные для всех x\in G.

2. Существует число \chi\,(0 \leqslant\chi<1,~\chi=\text{const}), такое, что |\varphi'(x)|\leqslant\chi для всех x\in G.


Тогда отображение \varphi(x) является сжимающим в G с коэффициентом сжатия х и последовательность x^{(0)},x^{(1)},\ldots,x^{(k+1)},\ldots, определяемая на основе итерационного процесса, сходится к решению x_{\ast}, то есть x^{(k)}\to x_{\ast} при k\to\infty.


▼ Доказательство

В силу условия 1 справедлива теорема Лагранжа о конечных приращениях:


\varphi(x'')-\varphi(x')\leqslant (x''-x')\varphi'(\delta) для \forall x',x''\in G,

где \delta — точка, лежащая между x' и x''. Но тогда с учетом условия 2 и замены \varphi'(\delta) ее мажорантой \chi получим


\bigl|\varphi(x'')-\varphi(x')\bigr|\leqslant \chi\cdot \bigl|x''-x'\bigr|,

т.е. отображение \varphi(x) — сжимающее, и, таким образом, последовательность x^{(0)},x^{(1)},\ldots,x^{(k+1)},\ldots сходится к некоторому \widehat{x}. Но тогда в силу непрерывности \varphi(x) в G имеет место равенство \widehat{x}=x_{\ast}.


Геометрическая интерпретация процесса сходимости и расходимости в зависимости от выполнения или невыполнения достаточного условия сходимости представлена на рис. 3.9.


Сходимость итерационных последовательностей

Из рис. 3.9 видно, что при 0<\varphi'(x)<1 и при -1<\varphi'(x)<0 (см.рис. 3.9,д,б) итерационные последовательности x^{(0)},x^{(1)},x^{(2)},\ldots сходятся к x_{\ast}. Причем в первом случае реализуется односторонняя (монотонная) сходимость, а во втором — двусторонняя (немонотонная). При |\varphi'(x)|>1 (см.рис. 3.9,в,г) процесс расходится несмотря на то, что точка x^{(0)} очень близка к x_{\ast}. Процессы на рис. 3.9,а,б соответствуют сжимающему отображению.


Преобразование уравнения f(x)=0 к равносильному виду x=\varphi(x) может быть выполнено неоднозначно. Рассмотрим универсальные практические приемы равносильного преобразования f(x)=0, дающие сжимающие отображения.


1. Можно заменить уравнение f(x)=0 на равносильное x=x+cf(x), где c=\text{const}\ne0. Тогда, принимая правую часть этого уравнения за \varphi(x) и раскрывая |\varphi'(x)|= |1+cf'(x)|<1, получаем условие


-2<c\cdot f'(x)<0.
(3.11)

Таким образом, можно найти константу c на отрезке G=[a,b] так, чтобы удовлетворялись неравенства (3.11). При этом надо стремиться получить такую постоянную c, которая бы больше отличалась от нуля, и тогда будет реализовы-ваться более быстрая сходимость.

Можно показать, что абсолютная погрешность метода оценивается по формуле (эта оценка выражается через два последовательных приближения)


\bigl|x^{(k+1)}-x_{\ast}\bigr|\leqslant \frac{\chi}{1-\chi}\cdot \bigl|x^{(k+1)}-x^{(k)}\bigr|
(3.12)

или по формуле (эта оценка выражается через два приближения x^{(0)} и x^{(1)})


\bigl|x^{(k+1)}-x_{\ast}\bigr|\leqslant \frac{\chi^{k+1}}{1-\chi}\cdot \bigl|x^{(1)}-x^{(0)}\bigr|.
(3.13)

Из оценки следует условие выхода из итерационного процесса. Если значение \chi неизвестно, то выход осуществляется по условию


\bigl|x^{(k+1)}-x^{(k)}\bigr|\leqslant \varepsilon.

2. Уравнение f(x)=0 заменяется равносильным (где знак в правой части выбирается из условия |\varphi'(x)|<1):


x=x\mp \frac{f(x)}{\max|f'(x)|}\equiv \varphi(x) при x\in G,

3. Можно выразить x из уравнения f(x)=0 так, чтобы для полученного уравнения x=\varphi(x) выполнялось условие сходимости |\varphi'(x)|<1 в окрестности искомого корня.


Замечание к доказательству. Выполнение условия \Delta_{k+1}= \bigl|x^{(k+1)}-x^{(k)}\bigr|\leqslant \varepsilon не гарантирует близости к точному решению (на рис. 3.10 достигается область, где условие окончания выполняется, но корень x_{\ast} расположен достаточно далеко от этой области).


Итерационный процесс и корень

▼ Примеры 3.8-3.10

Пример 3.8. Методом простых итераций с точностью \varepsilon=0,\!001 уточнить корень трансцендентного уравнения x^2-e^{-x}=0, причем искомый корень x_{\ast}\in[0,\!5;1,\!0]\equiv G.


▼ Решение

1. Преобразуем исходное уравнение к виду x=\varphi(x)\colon\, x=e^{-x\!\!\not{\phantom{|}}\,2}= \varphi(x). Проверкой можно убедиться, что \varphi'(x)<1 при x\in G.


2. В качестве начального приближения выберем x^{(0)}=\frac{0,\!5+1}{2}=0,\!75.


3,4. Выполняем последовательные действия по формуле (3.9): x^{(k+1)}=\exp \frac{-x^{(k)}}{2}. Результаты расчетов приведены в табл. 3.4.


\begin{aligned} \mathit{Table~3.4}~&\\ \begin{array}{|c|c|c|c|c|c|c|} \hline k& 0& 1& 2& 3& 4& 5\\\hline x^{(k)}& 0,7500& 0,6873& 0,7091& 0,7015& 0,7042& 0,7032 \\\hline \bigl|x^{(k)}-x^{(k-1)}\bigr|&-& 0,0627& 0,0218& 0,0076& 0,0027&0,0010 \\\hline \end{array}& \end{aligned}

На пятой итерации выполнилось условие \bigl|x^{(5)}-x^{(4)}\bigr|\leqslant \varepsilon= 0,\!001, поэтому процесс завершен. В качестве приближенного решения берется x_{\ast}\cong x^{(5)}= 0,\!703. Подстановка x^{(5)} в исходное уравнение дает (x^{(5)})^2-e^{-x^{(5)}}= 0,00088, т.е. равенство в уравнении также выполняется с заданной точностью. Видно, что сходимость двусторонняя (это следует также из неравенства -1<\varphi'(x)<0) и линейная, так как отношения \frac{|x^{(k+1)}-x^{(k)}|}{|x^{(k)}-x^{(k-1)}|} при k=1,2,3,4,5 примерно одинаковые и равны \approx0,\!35 (знаменатель геометрической профессии).


Пример 3.9. Найти решение уравнения x^3-x+1=0 методом простых итераций с точностью \varepsilon_1=0,\!01 и \varepsilon_2=0,\!001.


▼ Решение

1. В примере 3.2 был отделен корень уравнения x_{\ast}\in[-2;-1]. Преобразуем уравнение к виду x=\varphi(x). Для этого запишем его сначала в форме x=x^3+1. Легко показать, что функция \varphi(x)=x^3+1 не удовлетворяет условию сходимости, поскольку \varphi'(x)=3x^2, \varphi'(-2)=12>1, \varphi'(-1)=3>1. Поэтому воспользуемся другим преобразованием.


В результате получим x=\sqrt[\LARGE{3}]{x-1}. Можно проверить, что |\varphi'(x)|<1 на отрезке [-2;-1], т.е. достаточные условия сходимости выполняются.


2. Зададим начальное приближение x^{(0)}=-1. Решим задачу с различной точностью \varepsilon_1 и \varepsilon_2.


3,4. Выполним расчеты по формуле (3.9): x^{(k+1)}= \sqrt[\LARGE{3}]{x^{(k)}-1},~k=0,1,2,\ldots. Результаты расчетов приведены в табл. 3.5.


\begin{aligned} \mathit{Table~3.5}~&\\ \begin{array}{|c|c|c|c|c|c|c|} \hline k& 0& 1& 2& 3& 4& 5\\\hline \begin{matrix}{}\\[-8pt]{}\end{matrix} x^{(k)}&-1,\!000&-1,\!2599&-1,\!3123&-1,\!3223&-1,\!3243&-1,3246\\\hline \begin{matrix}{}\\[-8pt]{}\end{matrix} \bigl|x^{(k)}-x^{(k-1)}\bigr|&-&0,\!2599& 0,\!0524& 0,\!0100& 0,\!0020& 0,\!0003\\\hline \end{array}& \end{aligned}

Если \varepsilon_1=0,\!01, то x_{\ast}\cong-1,\!3223, а если \varepsilon_2=0,\!001, то x_{\ast}\cong-1,\!3246.


Пример 3.10. Найти корни уравнения x^3-x^2-9x+9=0 методом простых итераций с точностью \varepsilon=0,\!001.


▼ Решение

1. Преобразуем уравнение к виду x=\varphi(x)\colon\, x=\sqrt[\LARGE{3}]{x^2+9x-9}.


В примере 3.3 была выполнена операция отделения корней и получены отрезки [-4;-2],\,[0,5;2],\,[2;4].


Можно показать, что на отрезках [2;4],\,[-4;-2] функция \varphi(x)= \sqrt[\LARGE{3}]{x^2+9x-9} удовлетворяет условию |\varphi'(x)|<1.


На отрезке [0,\!5;2] используем другой вид уравнения: x=\frac{x^3}{9}-\frac{x^2}{9}+1. Также легко проверить, что функция \varphi(x)=\frac{x^3}{9}-\frac{x^2}{9}+1 удовлетворяет достаточному условию сходимости на отрезке [0,\!5;2].


2. В качестве начальных приближений выберем:
– точку x^{(0)}=-2 на отрезке [-4;-2];
– точку x^{(0)}=0,\!5 на отрезке [0,\!5;-2];
– точку x^{(0)}=2 на отрезке [2;4];.
В поставленной задаче \varepsilon=0,\!001.

3,4. Выполним расчеты по формуле


x^{(k+1)}= \sqrt[\LARGE{3}]{(x^{(k)})^2+9x^{(k)}-9},\quad k=0,1,2,\ldots

с начальными значениями x^{(0)}=-2 и x^{(0)}=2 и по формуле


x^{(k+1)}=\frac{(x^{(k)})^3}{9}-\frac{(x^{(k)})^2}{9}+1,\quad k=0,1,2,\ldots

с начальным значением x^{(0)}=0,\!5.


Результаты расчетов занесены в табл. 3.6–3.8.


\begin{aligned}& \begin{aligned} \mathit{Table~3.6}~&\\ \begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline k&\! \scriptstyle{0}\!&\! \scriptstyle{1}\!&\! \scriptstyle{2}\!&\! \scriptstyle{3}\!&\! \scriptstyle{4}\!&\! \scriptstyle{5}\!&\! \scriptstyle{6}\!&\! \scriptstyle{7}\!&\! \scriptstyle{8}\!&\! \scriptstyle{9}\!&\! \scriptstyle{10}\!&\! \scriptstyle{11}\!&\! \scriptstyle{12}\!\\\hline x^{(k)}&\! \scriptstyle{2,0000}\!&\! \scriptstyle{2,3513}\!&\! \scriptstyle{2,6056}\!&\! \scriptstyle{2,7694}\!&\! \scriptstyle{2,8682}\!&\! \scriptstyle{2,9255}\!&\! \scriptstyle{2,9582}\!&\! \scriptstyle{2,9767}\!&\! \scriptstyle{2,9870}\!&\! \scriptstyle{2,9927}\!&\! \scriptstyle{2,9959}\!&\! \scriptstyle{2,9977}\!&\! \scriptstyle{2,9987}\!\\\hline  \bigl|x^{(k)}-x^{(k-1)}\bigr|&\! -\!&\! \scriptstyle{0,3513}\!&\! \scriptstyle{0,2543}\!&\! \scriptstyle{0,1638}\!&\! \scriptstyle{0,0988}\!&\! \scriptstyle{0,0573}\!&\! \scriptstyle{0,0327}\!&\! \scriptstyle{0,0185}\!&\! \scriptstyle{0,0102}\!&\! \scriptstyle{0,0057}\!&\! \scriptstyle{0,0032}\!&\! \scriptstyle{0,0018}\!&\! \scriptstyle{0,0010}\!\\\hline \end{array}& \end{aligned}<br />\\[6pt] & \begin{aligned} \mathit{Table~3.7}~&\\ \begin{array}{|c|c|c|}\hline k&  x^{(k)}&  \bigl|x^{(k)}-x^{(k-1)}\bigr|\\\hline 0&-2,\!0000&-\\\hline 1&-2,\!8438& 0,\!8438\\\hline 2&-2,\!9816& 0,\!1378\\\hline 3&-2,\!9979& 0,\!0163\\\hline 4&-2,\!9997& 0,\!0018\\\hline 5&-2,\!99997& 0,\!00027\\\hline \end{array}&\end{aligned} \qquad\qquad\qquad \begin{aligned} \mathit{Table~3.8}~&\\ \begin{array}{|c|c|c|} \hline k&  x^{(k)}&  \bigl|x^{(k)}-x^{(k-1)}\bigr|\\\hline 0& 0,\!50000&-\\\hline 1& 0,\!98611& 0,\!4861\\\hline 2& 0,\!99849& 0,\!01238\\\hline 3& 0,\!99983& 0,\!00134\\\hline 4& 0,\!99998& 0,\!00015\\\hline \end{array}& \end{aligned}\end{aligned}

В результате получены приближенные значения корней:


x_{1\ast}\cong-2,\!99997,\qquad x_{2\ast}\cong0,\!99998,\qquad x_{3\ast}\cong2,\!9987.

Обратим внимание на сильное различие в числе итераций, потребовавшихся для нахождения корней x_{\ast}=3 (табл. 3.6) и x_{\ast}=-3 (табл. 3.7), с помощью одной и той же формулы. Заметим, что в окрестности корня x_{\ast}=3 значения модуля производной функции \varphi(x)=\sqrt[\LARGE{3}]{x^2+9x-9} равны:


|\varphi'(2)|=0,\!784;\qquad |\varphi'(2,\!3513)|=0,\!673;\qquad |\varphi'(2,\!6056)|=0,\!618;\qquad |\varphi'(2,\!9977)|=0,\!556.

С другой стороны, в окрестности корня x_{\ast}=-3 имеем:


|\varphi'(-2)|=0,\!206;\qquad |\varphi'(-2,\!8438)|= 0,\!124;\qquad |\varphi'(-2,\!9977)|=0,\!111.

Анализ результатов показывает, что чем меньше значения модуля производной |\varphi'(x)|, тем быстрее сходимость.




Метод Ньютона для решения нелинейных уравнений


Метод Ньютона (метод касательных, или метод линеаризации) является одним из наиболее популярных численных методов. Он быстро сходится (имеет квадратичную сходимость) и допускает различные модификации, приспособленные для решения векторных задач и сеточных уравнений. Однако этот метод эффективен при весьма жестких ограничениях на характер функции f(x)\colon


Геометрическая интерпретация метода Ньютона
1) существование второй производной функции f(x) на множестве G=\{a\leqslant x\leqslant b\};
2) удовлетворение первой производной условию f(x)\ne0 для всех x\in G;
3) знакопостоянство f'(x),\,f''(x) для всех x\in G.

Поэтому его желательно использовать совместно с другими методами, например методом половинного деления, чтобы достигнуть диапазона \widetilde{a}\leqslant x \leqslant \widetilde{b}, где указанные условия начинают выполняться.


Геометрическая интерпретация метода Ньютона состоит в следующем. Задается начальное приближение x^{(0)}. Далее проводится касательная к кривой y=f(x) в точке x^{(0)} (рис. 3.11), т.е. кривая заменяется прямой линией. В качестве следующего приближения выбирается точка пересечения этой касательной с осью абсцисс. Процесс построения касательных и нахождения точек пересечения с осью абсцисс повторяется до тех пор, пока приращение не станет меньше заданной величины \varepsilon.


Получим расчетную формулу метода Ньютона. Вместо участка кривой BC (точка C соответствует x_{\ast}) возьмем участок AB — касательную, проведенную в точке (x^{(0)},f(x^{(0)}))). Для этого отрезка справедливо конечное соотношение:


\frac{f(x^{(0)})-0}{x^{(0)}-x^{(1)}}= f'(x^{(0)})\equiv \operatorname{tg}\alpha,

где \alpha — угол наклона касательной в точке (x^{(0)},f(x^{(0)})) к оси абсцисс. Разрешая это соотношение относительно x^{(1)}, получаем x^{(1)}= x^{(0)}-\frac{f(x^{(0)})}{f'(x^{(0)})}. Повторяя процесс, находим общую формулу:


x^{(k+1)}= x^{(0)}-\frac{f(x^{(k)})}{f'(x^{(k)})},\quad k=0,1,2,\ldots
(3.14)

Подчеркнем, что если отбросить итерационный индекс, то (3.14) записывается в виде нелинейного уравнения


x=x-\frac{f(x)}{f'(x)}\equiv \varphi(x),
(3.15)

которое, однако, на [a,b] не равносильно исходному, а является таковым только в одной точке при x=x_{\ast}. Поэтому данный метод не служит разновидностью метода простых итераций.


Применим теперь для вывода формулы (3.14) метод линеаризации. Положим, что итерационный процесс имеет вид


x^{(k+1)}=x^{(k)}+\delta^{(k)},\quad k=0,1,2,\ldots
(3.16)

где \delta^{(0)} — поправка к k-му приближению, которую необходимо найти. Предполагая, что f(x) имеет непрерывную вторую производную, разложим f(x^{(k)}+\delta^{(k)}) по формуле Тейлора относительно точки x^{(k)}\colon


f(x^{(k)}+\delta^{(k)})= f(x^{(k)})+ \delta^{(k)}f'(x^{(k)})+ \frac{1}{2}(\delta^{(k)})^2 f''(\xi),

где \xi\in \bigl(x^{(k)},x^{(k+1)}\bigr). Учитывая, что f\bigl(x^{(k)}+ \delta^{(k)}\bigr)=0 (это соответствует нахождению точки пересечения с осью абсцисс), и оставляя только линейную (относительно \delta^{(k)}) часть разложения (отсюда и название — метод линеаризации), записываем линейное относительно \delta^{(k)} уравнение


f(x^{(k)})+ \delta^{(k)} f'(x^{(k)})=0.

Отсюда выражается поправка \delta^{(k)}=-\frac{f(x^{(k)})}{f'(x^{(k)})}. Подставляя \delta^{(k)} в (3.16), получаем (3.14).


Теорема 3.11 (о достаточных условиях сходимости метода Ньютона). Пусть выполняются следующие условия:


1. Функция f(x) определена и дважды дифференцируема на [a,b].

2. Отрезку [a,b] принадлежит только один простой корень x_{\ast}, так что f(a)\cdot f(b)&lt;0.

3. Производные f'(x),\,f''(x) на [a,b] сохраняют знак, и f'(x)\ne0.

4. Начальное приближение x^{(0)} удовлетворяет неравенству f(x^{(0)})\cdot f''(x^{(0)})&gt;0 (знаки функций f(x) и f''(x) в точке x^{(0)} совпадают).


Тогда с помощью метода Ньютона (3.14) можно вычислить корень уравнения f(x)=0 с любой точностью.


Замечания


1. Метод Ньютона характеризуется вторым порядком сходимости вблизи корня и первым порядком — вдали от него. Данную оценку проверяем для двух случаев, когда x^{(k)} находится далеко от корня x_{\ast} (это возможно на первых итерациях) и когда x^{(k)} располагается вблизи x_{\ast}.


Первый случай. Пусть отрезок \omega=[x^{(k)},x_{\ast}] не мал. Тогда на основе теоремы Лагранжа получим (где m_1=\min\limits_{\omega}|f'(x)|)


\bigl|f(x^{(k)})\bigr|= \bigl|f(x_{\ast})-f(x^{(k)})\bigr|= \bigl|f'(\xi)\bigr|\cdot \bigl|x_{\ast}-x^{(k)}\bigr| \geqslant m_1 \bigl|x_{\ast}-x^{(k)}\bigr|.
(3.17)

Преобразуем с использованием (3.17) итерационную формулу (3.14) (где M_1= \max\limits_{x\in[a,b]}|f'(x)|):


x^{(k+1)}=x^{(k)}-\frac{f(x^{(k)})}{f'(x^{(k)})};\qquad \bigl|x^{(k+1)}-x^{(k)}\bigr|= \frac{|f(x^{(k)})|}{f'(x^{(k)})} \geqslant \frac{m_1}{M_1} \bigl|x_{\ast}-x^{(k)}\bigr|.

В силу монотонности последовательности x^{(0)},x^{(1)},\ldots имеем


\begin{gathered}x_{\ast}-x^{(k+1)}= x_{\ast}-x^{(k)}-\bigl(x^{(k+1)}-x^{(k)}\bigr),\\ \bigl|x_{\ast}-x^{(k+1)}\bigr|= \bigl|x_{\ast}-x^{(k)}\bigr|-\bigl|x^{(k+1)}-x^{(k)}\bigr| \geqslant \bigl|x_{\ast}-x^{(k)}\bigr|- \frac{m_1}{M_1} \bigl|x_{\ast}-x^{(k)}\bigr|= \left(1-\frac{m_1}{M_1}\right)\! \bigl|x_{\ast}-x^{(k)}\bigr|. \end{gathered}

Таким образом, вдали от корня получаем линейную сходимость


\bigl|x_{\ast}-x^{(k+1)}\bigr| \leqslant c\cdot \bigl|x_{\ast}-x^{(k)}\bigr|, где 0 \leqslant c=1-\frac{m_1}{M_1}&lt;1.

Второй случай. Пусть теперь отрезок \omega=[x^{(k)},x] мал, т.е. итерации выполняются вблизи корня. Тогда, полагая, что указанные выше предположения 1–4 теоремы 3.10 выполнены, разложим функцию f(x) в окрестности корня x_{\ast} относительно точки x^{(k)}, учитывая члены до второго порядка. Получим


\Bigl.{f(x)}\Bigr|_{x=x^{(k)}}= f(x^{(k)})+ \bigl(x_{\ast}-x^{(k)}\bigr) f'(x^{(k)})+ \bigl(x_{\ast}-x^{(k)}\bigr)^2 \frac{1}{2}f''(\xi)=0,

где \xi\in \bigl(x^{(k)}-\delta,\,x^{(k)}+\delta\bigr) (\delta&gt;0 — малая величина). Из данного соотношения выражаем x_{\ast}\colon


x_{\ast}=x^{(k)}-\frac{f(x^{(k)})}{f'(x^{(k)})}-\frac{(x_{\ast}-x^{(k)})^2}{2f'(x^{(k)})}\,f''(\xi).

Но первые два слагаемых в правой части в соответствии с (3.14) равны x^{(k+1)}. Тогда будем иметь


x_{\ast}-x^{(k)}=-\frac{(x_{\ast}-x^{(k)})^2}{2f'(x^{(k)})}\,f''(\xi).

Из последнего соотношения следует оценка погрешности (k+1)-го приближения через погрешность k-го приближения:


\bigl|x_{\ast}-x^{(k+1)}\bigr|\leqslant \frac{M_2}{2m_1} \bigl|x_{\ast}-x^{(k)}\bigr|^2,
(3.18)

где принято M_2=\max\limits_{\omega}|f''(x)|,~ m_1=\min\limits_{\omega}|f'(x)|. Оценка (3.18) свидетельствует о квадратичной сходимости метода касательных вблизи корня. С вычислительной точки зрения это означает, что на каждом приближении количество верных цифр результата удваивается.


2. Для нахождения комплексных корней уравнения f(z)=0 можно также использовать (3.14) в форме (где z=x+iy — комплексная переменная)


z^{(k+1)}=z^{(k)}-\frac{f(z^{(k)})}{f'(z^{(k)})},\quad k=0,1,2,\ldots

Метод Ньютона может применяться не только для нахождения простых корней, но для определения кратных корней, т.е. когда на отрезке [a,b] содержащем корень, не выполняется условие f(a)\cdot f(b)&lt;0 (условие 2 теоремы 3.11). Наряду с теоремой 3.11 удобно также пользоваться следующей теоремой.




Достаточные условия сходимости метода Ньютона


Теорема 3.12 (достаточные условия сходимости метода Ньютона). Пусть:

а) дана функция f(x)\colon D\to \mathbb{R}, где D — открытый интервал, и f'(x)\in \operatorname{Lip}_{\gamma}(D);

б) для некоторого \rho&gt;0 выполняется условие |f'(x)|\leqslant\rho при всех x из D.


Если уравнение f(x)=0 имеет решение x_{\ast}\in D, то существует некоторое \eta&gt;0, такое, что если |x^{(0)}-x_{\ast}|&lt;\eta, то последовательность \bigl\{x^{(0)},x^{(1)},x^{(2)},\ldots\bigr\}, задаваемая формулой (3.14), существует и сходится к x_{\ast}. Более того, справедлива оценка


\bigl|x^{(k+1)}-x_{\ast}\bigr| \leqslant \frac{\gamma}{2\rho} \bigl|x^{(k)}-x_{\ast}\bigr|^2,\quad k=0,1,2,\ldots

Здесь обозначение f'(x)\in \operatorname{Lip}_{\gamma}(D) означает, что функция f'(x) непрерывна по Липшицу с константой \gamma на множестве D, то есть |f'(x)-f'(y)| \leqslant \gamma \cdot|x-y| для любых x,\,y из D.


Замечания


1. Требование теоремы 3.12, чтобы производная f'(x) имела ненулевую нижнюю границу в D, определяет, что значение f'(x_{\ast}) должно быть ненулевым для квадратичной сходимости метода Ньютона. Если же f'(x_{\ast})=0, то