Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Повторные независимые испытания. Схема и формула Бернулли

Повторные независимые испытания.
Схема и формула Бернулли


Определение повторных независимых испытаний. Формулы Бернулли для вычисления вероятности и наивероятнейшего числа. Асимптотические формулы для формулы Бернулли (локальная и интегральная, теоремы Лапласа). Использование интегральной теоремы. Формула Пуассона, для маловероятных случайных событий.

Повторные независимые испытания


На практике приходится сталкиваться с такими задачами, которые можно представить в виде многократно повторяющихся испытаний, в результате каждого из которых может появиться или не появиться событие [math]A[/math]. При этом интерес представляет исход не каждого "отдельного испытания, а общее количество появлений события [math]A[/math] в результате определенного количества испытаний. В подобных задачах нужно уметь определять вероятность любого числа [math]m[/math] появлений события [math]A[/math] в результате [math]n[/math] испытаний. Рассмотрим случай, когда испытания являются независимыми и вероятность появления события [math]A[/math] в каждом испытании постоянна. Такие испытания называются повторными независимыми.


Примером независимых испытаний может служить проверка на годность изделий, взятых по одному из ряда партий. Если в этих партиях процент брака одинаков, то вероятность того, что отобранное изделие будет бракованным, в каждом случае является постоянным числом.




Формула Бернулли


Воспользуемся понятием сложного события, под которым подразумевается совмещение нескольких элементарных событий, состоящих в появлении или непоявлении события [math]A[/math] в [math]i[/math]–м испытании. Пусть проводится [math]n[/math] независимых испытаний, в каждом из которых событие [math]A[/math] может либо появиться с вероятностью [math]p[/math], либо не появиться с вероятностью [math]q=1-p[/math]. Рассмотрим событие [math]B_m[/math], состоящее в том, что событие [math]A[/math] в этих [math]n[/math] испытаниях наступит ровно [math]m[/math] раз и, следовательно, не наступит ровно [math](n-m)[/math] раз. Обозначим [math]A_i~(i=1,2,\ldots,{n})[/math] появление события [math]A[/math], a [math]\overline{A}_i[/math] — непоявление события [math]A[/math] в [math]i[/math]–м испытании. В силу постоянства условий испытания имеем


[math]\begin{gathered}P\{A_1\}=P\{A_2\}=\cdots=P\{A_n\}=p,\\P\{\overline{A}_1\}=P\{\overline{A}_2\}=\cdots=P\{\overline{A}_n\}=1-p=q\end{gathered}[/math]

Событие [math]A[/math] может появиться [math]m[/math] раз в разных последовательностях или комбинациях, чередуясь с противоположным событием [math]\overline{A}[/math]. Число возможных комбинаций такого рода равно числу сочетаний из [math]n[/math] элементов по [math]m[/math], т. е. [math]C_n^m[/math]. Следовательно, событие [math]B_m[/math] можно представить в виде суммы сложных несовместных между собой событий, причем число слагаемых равно [math]C_n^m[/math]:


[math]B_m=A_1A_2\cdots{A_m}\overline{A}_{m+1}\cdots\overline{A}_n+\cdots+\overline{A}_1\overline{A}_2\cdots\overline{A}_{n-m}A_{n-m+1}\cdots{A_n},[/math]
(3.1)

где в каждое произведение событие [math]A[/math] входит [math]m[/math] раз, а [math]\overline{A}[/math][math](n-m)[/math] раз.

Вероятность каждого сложного события, входящего в формулу (3.1), по теореме умножения вероятностей для независимых событий равна [math]p^{m}q^{n-m}[/math]. Так как общее количество таких событий равно [math]C_n^m[/math], то, используя теорему сложения вероятностей для несовместных событий, получаем вероятность события [math]B_m[/math] (обозначим ее [math]P_{m,n}[/math])


[math]P_{m,n}=C_n^mp^{m}q^{n-m}\quad \text{or}\quad P_{m,n}=\frac{n!}{m!(n-m)!}p^{m}q^{n-m}.[/math]
(3.2)

Формулу (3.2) называют формулой Бернулли, а повторяющиеся испытания, удовлетворяющие условию независимости и постоянства вероятностей появления в каждом из них события [math]A[/math], называют испытаниями Бернулли, или схемой Бернулли.




Пример 1. Вероятность выхода за границы поля допуска при обработке деталей на токарном станке равна 0,07. Определить вероятность того, что из пяти наудачу отобранных в течение смены деталей у одной размеры диаметра не соответствуют заданному допуску.


Решение. Условие задачи удовлетворяет требования схемы Бернулли. Поэтому, полагая [math]n=5,\,m=1,\,p=0,\!07[/math], по формуле (3.2) получаем


[math]P_{1,5}=C_5^1(0,\!07)^{1}(0,\!93)^{5-1}\approx0,\!262.[/math]



Пример 2. Наблюдениями установлено, что в некоторой местности в сентябре бывает 12 дождливых дней. Какова вероятность того, что из случайно взятых в этом месяце 8 дней 3 дня окажутся дождливыми?


Решение.


[math]P_{3;8}=C_8^3{\left(\frac{12}{30}\right)\!}^3{\left(1-\frac{12}{30}\right)\!}^{8-3}=\frac{8!}{3!(8-3)!}{\left(\frac{2}{5}\right)\!}^3{\left(\frac{3}{5}\right)\!}^5=56\cdot\frac{8}{125}\cdot\frac{243}{3125}=\frac{108\,864}{390\,625}\approx0,\!2787.[/math]



Наивероятнейшее число появлений события


Наивероятнейшим числом появления события [math]A[/math] в [math]n[/math] независимых испытаниях называется такое число [math]m_0[/math], для которого вероятность, соответствующая этому числу, превышает или, по крайней мере, не меньше вероятности каждого из остальных возможных чисел появления события [math]A[/math]. Для определения наивероятнейшего числа не обязательно вычислять вероятности возможных чисел появлений события, достаточно знать число испытаний [math]n[/math] и вероятность появления события [math]A[/math] в отдельном испытании. Обозначим [math]P_{m_0,n}[/math] вероятность, соответствующую наивероятнейшему числу [math]m_0[/math]. Используя формулу (3.2), записываем


[math]P_{m_0,n}=C_n^{m_0}p^{m_0}q^{n-m_0}=\frac{n!}{m_0!(n-m_0)!}p^{m_0}q^{n-m_0}.[/math]
(3.3)

Согласно определению наивероятнейшего числа, вероятности наступления события [math]A[/math] соответственно [math]m_0+1[/math] и [math]m_0-1[/math] раз должны, по крайней мере, не превышать вероятность [math]P_{m_0,n}[/math], т. е.


[math]P_{m_0,n}\geqslant{P_{m_0+1,n}};\quad P_{m_0,n}\geqslant{P_{m_0-1,n}}[/math]

Подставляя в неравенства значение [math]P_{m_0,n}[/math] и выражения вероятностей [math]P_{m_0+1,n}[/math] и [math]P_{m_0-1,n}[/math], получаем


[math]\begin{gathered}\frac{n!}{m_0!(n-m_0)!}p^{m_0}q^{n-m_0}\geqslant\frac{n!}{(m_0+1)!(n-m_0-1)!}p^{m_0+1}q^{n-m_0-1}\\\\\frac{n!}{m_0!(n-m_0)!}p^{m_0}q^{n-m_0}\geqslant\frac{n!}{(m_0-1)!(n-m_0+1)!}p^{m_0-1}q^{n-m_0+1}\end{gathered}[/math]

Решая эти неравенства относительно [math]m_0[/math], получаем


[math]m_0\geqslant{np-q},\quad m_0\leqslant{np+p}[/math]

Объединяя последние неравенства, получаем двойное неравенство, которое используют для определения наивероятнейшего числа:


[math]np-q\leqslant{m_0}\leqslant{np+p}.[/math]
(3.4)

Так как длина интервала, определяемого неравенством (3.4), равна единице, т. е.


[math](np+p)-(np-q)=p+q=1,[/math]

и событие может произойти в [math]n[/math] испытаниях только целое число раз, то следует иметь в виду, что:

1) если [math]np-q[/math] — целое число, то существуют два значения наивероятнейшего числа, а именно: [math]m_0=np-q[/math] и [math]m'_0=np-q+1=np+p[/math];


2) если [math]np-q[/math] — дробное число, то существует одно наивероятнейшее число, а именно: единственное целое, заключенное между дробными числами, полученными из неравенства (3.4);


3) если [math]np[/math] — целое число, то существует одно наивероятнейшее число, а именно: [math]m_0=np[/math].


При больших значениях [math]n[/math] пользоваться формулой (3.3) для расчета вероятности, соответствующей наивероятнейшему числу, неудобно. Если в равенство (3.3) подставить формулу Стирлинга


[math]n!\approx{n^ne^{-n}\sqrt{2\pi{n}}},[/math]

справедливую для достаточно больших [math]n[/math], и принять наивероятнейшее число [math]m_0=np[/math], то получим формулу для приближенного вычисления вероятности, соответствующей наивероятнейшему числу:

[math]P_{m_0,n}\approx\frac{n^ne^{-n}\sqrt{2\pi{n}}\,p^{np}q^{nq}}{(np)^{np}e^{-np}\sqrt{2\pi{np}}\,(nq)^{nq}e^{-nq}\sqrt{2\pi{nq}}}=\frac{1}{\sqrt{2\pi{npq}}}=\frac{1}{\sqrt{2\pi}\sqrt{npq}}.[/math]
(3.5)

Пример 2. Известно, что [math]\frac{1}{15}[/math] часть продукции, поставляемой заводом на торговую базу, не удовлетворяет всем требованиям стандарта. На базу была завезена партия изделий в количестве 250 шт. Найти наивероятнейшее число изделий, удовлетворяющих требованиям стандарта, и вычислить вероятность того, что в этой партии окажется наивероятнейшее число изделий.


Решение. По условию [math]n=250,\,q=\frac{1}{15},\,p=1-\frac{1}{15}=\frac{14}{15}[/math]. Согласно неравенству (3.4) имеем


[math]250\cdot\frac{14}{15}-\frac{1}{15}\leqslant{m_0}\leqslant250\cdot\frac{14}{15}+\frac{1}{15}[/math]

откуда [math]233,\!26\leqslant{m_0}\leqslant234,\!26[/math]. Следовательно, наивероятнейшее число изделий, удовлетворяющих требованиям стандарта, в партии из 250 шт. равно 234. Подставляя данные в формулу (3.5), вычисляем вероятность наличия в партии наивероятнейшего числа изделий:

[math]P_{234,250}\approx\frac{1}{\sqrt{2\pi\cdot250\cdot\frac{14}{15}\cdot\frac{1}{15}}}\approx0,\!101[/math]



Локальная теорема Лапласа


Пользоваться формулой Бернулли при больших значениях [math]n[/math] очень трудно. Например, если [math]n=50,\,m=30,\,p=0,\!1[/math], то для отыскания вероятности [math]P_{30,50}[/math] надо вычислить значение выражения


[math]P_{30,50}=\frac{50!}{30!\cdot20!}\cdot(0,\!1)^{30}\cdot(0,\!9)^{20}[/math]

Естественно, возникает вопрос: нельзя ли вычислить интересующую вероятность, не используя формулу Бернулли? Оказывается, можно. Локальная теорема Лапласа дает асимптотическую формулу, которая позволяет приближенно найти вероятность появления событий ровно [math]m[/math] раз в [math]n[/math] испытаниях, если число испытаний достаточно велико.


Теорема 3.1. Если вероятность [math]p[/math] появления события [math]A[/math] в каждом испытании постоянна и отлична от нуля и единицы, то вероятность [math]P_{m,n}[/math] того, что событие [math]A[/math] появится в [math]n[/math] испытаниях ровно [math]m[/math] раз, приближенно равна (тем точнее, чем больше [math]n[/math]) значению функции


[math]y=\frac{1}{\sqrt{npq}}\frac{e^{-x^2/2}}{\sqrt{2\pi}}=\frac{\varphi(x)}{\sqrt{npq}}[/math] при [math]x=\frac{m-np}{\sqrt{npq}}[/math].

Существуют таблицы, которые содержат значения функции [math]\varphi(x)=\frac{1}{\sqrt{2\pi}}\,e^{-x^2/2}}[/math], соответствующие положительным значениям аргумента [math]x[/math]. Для отрицательных значений аргумента используют те же таблицы, так как функция [math]\varphi(x)[/math] четна, т. е. [math]\varphi(-x)=\varphi(x)[/math].


Итак, приближенно вероятность того, что событие [math]A[/math] появится в [math]n[/math] испытаниях ровно [math]m[/math] раз,

[math]P_{m,n}\approx\frac{1}{\sqrt{npq}}\,\varphi(x),[/math] где [math]x=\frac{m-np}{\sqrt{npq}}[/math].

Пример 3. Найти вероятность того, что событие [math]A[/math] наступит ровно 80 раз в 400 испытаниях, если вероятность появления события [math]A[/math] в каждом испытании равна 0,2.


Решение. По условию [math]n=400,\,m=80,\,p=0,\!2,\,q=0,\!8[/math]. Воспользуемся асимптотической, формулой Лапласа:


[math]P_{80,400}\approx\frac{1}{\sqrt{400\cdot0,\!2\cdot0,\!8}}\,\varphi(x)=\frac{1}{8}\,\varphi(x).[/math]

Вычислим определяемое данными задачи значение [math]x[/math]:


[math]x=\frac{m-np}{\sqrt{npq}}=\frac{80-400\cdot0,\!2}{8}=0.[/math]

По таблице прил, 1 находим [math]\varphi(0)=0,\!3989[/math]. Искомая вероятность


[math]P_{80,100}=\frac{1}{8}\cdot0,\!3989=0,\!04986.[/math]

Формула Бернулли приводит примерно к такому же результату (выкладки ввиду их громоздкости опущены):


[math]P_{80,100}=0,\!0498.[/math]



Интегральная теорема Лапласа


Предположим, что проводится [math]n[/math] независимых испытаний, в каждом из которых вероятность появления события [math]A[/math] постоянна и равна [math]p[/math]. Необходимо вычислить вероятность [math]P_{(m_1,m_2),n}[/math] того, что событие [math]A[/math] появится в [math]n[/math] испытаниях не менее [math]m_1[/math] и не более [math]m_2[/math] раз (для краткости будем говорить "от [math]m_1[/math] до [math]m_2[/math] раз"). Это можно сделать с помощью интегральной теоремы Лапласа.


Теорема 3.2. Если вероятность [math]p[/math] наступления события [math]A[/math] в каждом испытании постоянна и отлична от нуля и единицы, то приближенно вероятность [math]P_{(m_1,m_2),n}[/math] того, что событие [math]A[/math] появится в испытаниях от [math]m_1[/math] до [math]m_2[/math] раз,


[math]P_{(m_1,m_2),n}\approx\frac{1}{\sqrt{2\pi}}\int\limits_{x'}^{x''}e^{-x^2/2}\,dx,[/math] где [math]x'=\frac{m_1-np}{\sqrt{npq}};~x''=\frac{m_2-np}{\sqrt{npq}}[/math].

При решении задач, требующих применения интегральной теоремы Лапласа, пользуются специальными таблицами, так как неопределенный интеграл [math]\int{e^{-x^2/2}\,dx}[/math] не выражается через элементарные функции. Таблица для интеграла [math]\Phi(x)=\frac{1}{\sqrt{2\pi}}\int\limits_{0}^{x}e^{-z^2/2}\,dz[/math] приведена в прил. 2, где даны значения функции [math]\Phi(x)[/math] для положительных значений [math]x[/math], для [math]x<0[/math] используют ту же таблицу (функция [math]\Phi(x)[/math] нечетна, т. е. [math]\Phi(-x)=-\Phi(x)[/math]). Таблица содержит значения функции [math]\Phi(x)[/math] лишь для [math]x\in[0;5][/math]; для [math]x>5[/math] можно принять [math]\Phi(x)=0,\!5[/math].


Итак, приближенно вероятность того, что событие [math]A[/math] появится в [math]n[/math] независимых испытаниях от [math]m_1[/math] до [math]m_2[/math] раз,


[math]P_{(m_1,m_2),n}\approx\Phi(x'')-\Phi(x'),[/math] где [math]x'=\frac{m_1-np}{\sqrt{npq}};~x''=\frac{m_2-np}{\sqrt{npq}}[/math].



Пример 4. Вероятность того, что деталь изготовлена с нарушениями стандартов, [math]p=0,\!2[/math]. Найти вероятность того, что среди 400 случайно отобранных деталей нестандартных окажется от 70 до 100 деталей.


Решение. По условию [math]p=0,\!2,\,q=0,\!8,\,n=400,\,m_1=70,\,m_2=100[/math]. Воспользуемся интегральной теоремой Лапласа:


[math]P_{(70,100),400}\approx\Phi(x'')-\Phi(x').[/math]

Вычислим пределы интегрирования:


нижний
[math]x'=\frac{m_1-np}{\sqrt{npq}}=\frac{70-400\cdot0,\!2}{\sqrt{400\cdot0,\!2\cdot0,\!8}}=-1,\!25,[/math]

верхний
[math]x''=\frac{m_2-np}{\sqrt{npq}}=\frac{100-400\cdot0,\!2}{\sqrt{400\cdot0,\!2\cdot0,\!8}}=2,\!5,[/math]

Таким образом


[math]P_{(70,100),400}\approx\Phi(2,\!5)-\Phi(-1,\!25)=\Phi(2,\!5)+\Phi(1,\!25).[/math]

По таблице прил. 2 находим


[math]\Phi(2,\!5)=0,\!4938;~~~~~\Phi(1,\!25)=0,\!3944.[/math]

Искомая вероятность


[math]P_{(70,100),400}=0,\!4938+0,\!3944=0,\!8882.[/math]



Применение интегральной теоремы Лапласа


Если число [math]m[/math] (число появлений события [math]A[/math] при [math]n[/math] независимых испытаниях) будет изменяться от [math]m_1[/math] до [math]m_2[/math], то дробь [math]\frac{m-np}{\sqrt{npq}}[/math] будет изменяться от [math]\frac{m_1-np}{\sqrt{npq}}=x'[/math] до [math]\frac{m_2-np}{\sqrt{npq}}=x''[/math]. Следовательно, интегральную теорему Лапласа можно записать и так:


[math]P\left\{x'\leqslant\frac{m-np}{\sqrt{npq}}\leqslant{x''}\right\}=\frac{1}{\sqrt{2\pi}}\int\limits_{x'}^{x''}e^{-x^2/2}\,dx.[/math]
(3.6)

Поставим задачу найти вероятность того, что отклонение относительной частоты [math]\frac{m}{n}[/math] от постоянной вероятности [math]p[/math] по абсолютной величине не превышает заданного числа [math]\varepsilon>0[/math]. Другими словами, найдем вероятность осуществления неравенства [math]\left|\frac{m}{n}-p\right|\leqslant\varepsilon[/math], что то же самое, [math]-\varepsilon\leqslant\frac{m}{n}-p\leqslant\varepsilon[/math]. Эту вероятность будем обозначать так: [math]P\left\{\left|\frac{m}{n}-p\right|\leqslant\varepsilon\right\}[/math]. С учетом формулы (3.6) для данной вероятности получаем


[math]P\left\{\left|\frac{m}{n}-p\right|\leqslant\varepsilon\right\}\approx2\Phi\left(\varepsilon\,\sqrt{\frac{n}{pq}}\right).[/math]
(3.7)



Пример 5. Вероятность того, что деталь нестандартна, [math]p=0,\!1[/math]. Найти вероятность того, что среди случайно отобранных 400 деталей относительная частота появления нестандартных деталей отклонится от вероятности [math]p=0,\!1[/math] по абсолютной величине не более чем на 0,03.


Решение. По условию [math]n=400,\,p=0,\!1,\,q=0,\!9,\,\varepsilon=0,\!03[/math]. Требуется найти вероятность [math]P\left\{\left|\frac{m}{400}-0,\!1\right|\leqslant0,\!03\right\}[/math]. Используя формулу (3.7), получаем


[math]P\left\{\left|\frac{m}{400}-0,\!1\right|\leqslant0,\!03\right\}\approx2\Phi\left(0,\!03\sqrt{\frac{400}{0,\!1\cdot0,\!9}}\right)=2\Phi(2)[/math]

По таблице прил. 2 находим [math]\Phi(2)=0,\!4772[/math], следовательно, [math]2\Phi(2)=0,\!9544[/math]. Итак, искомая вероятность приближенно равна 0,9544. Смысл полученного результата таков: если взять достаточно большое число проб по 400 деталей в каждой, то примерно в 95,44% этих проб отклонение относительной частоты от постоянной вероятности [math]p=0,\!1[/math] по абсолютной величине не превысит 0,03.




Формула Пуассона для маловероятных событий


Если вероятность [math]p[/math] наступления события в отдельном испытании близка к нулю, то даже при большом числе испытаний [math]n[/math], но при небольшом значении произведения [math]np[/math] получаемые по формуле Лапласа значения вероятностей [math]P_{m,n}[/math] оказываются недостаточно точными и возникает потребность в другой приближенной формуле.


Теорема 3.3. Если вероятность [math]p[/math] наступления события [math]A[/math] в каждом испытании постоянна, но мала, число независимых испытаний [math]n[/math] достаточно велико, но значение произведения [math]np=\lambda[/math] остается небольшим (не больше десяти), то вероятность того, что в этих испытаниях событие [math]A[/math] наступит [math]m[/math] раз,


[math]P_{m,n}\approx\frac{\lambda^m}{m!}\,e^{-\lambda}.[/math]

Для упрощения расчетов с применением формулы Пуассона составлена таблица значений функции Пуассона [math]\frac{\lambda^m}{m!}\,e^{-\lambda}[/math] (см. прил. 3).




Пример 6. Пусть вероятность изготовления нестандартной детали равна 0,004. Найти вероятность того, что среди 1000 деталей окажется 5 нестандартных.


Решение. Здесь [math]n=1000,p=0,004,~\lambda=np=1000\cdot0,\!004=4[/math]. Все три числа удовлетворяют требованиям теоремы 3.3, поэтому для нахождения вероятности искомого события [math]P_{5,1000}[/math] применяем формулу Пуассона. По таблице значений функции Пуассона (прил. 3) при [math]\lambda=4;m=5[/math] получаем [math]P_{5,1000}\approx0,\!1563[/math].


Найдем вероятность того же события по формуле Лапласа. Для этого сначала вычисляем значение [math]x[/math], соответствующее [math]m=5[/math]:


[math]x=\frac{5-1000\cdot0,\!004}{\sqrt{1000\cdot0,\!004\cdot0,\!996}}\approx\frac{1}{1,\!996}\approx0,\!501.[/math]

Поэтому согласно формуле Лапласа искомая вероятность


[math]P_{5,1000}\approx\frac{\varphi(0,\!501)}{1,\!996}\approx\frac{0,\!3519}{1,\!996}\approx0,\!1763[/math]

а согласно формуле Бернулли точное ее значение

[math]P_{5,1000}=C_{1000}^{5}\cdot0,\!004^5\cdot0,\!996^{995}\approx0,\!1552.[/math]

Таким образом, относительная ошибка вычисления вероятностей [math]P_{5,1000}[/math] по приближенной формуле Лапласа составляет


[math]\frac{0,\!1763-0,\!1552}{0,\!1552}\approx0,\!196[/math], или [math]13,\!6\%[/math]

а по формуле Пуассона —
[math]\frac{0,\!1563-0,\!1552}{0,\!1552}\approx0,\!007[/math], или [math]0,\!7\%[/math]
т. е. во много раз меньше.


Перейти к следующему разделу
Одномерные случайные величины

Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved