Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]


Элементы математической статистики. Выборочный метод

Элементы математической статистики. Выборочный метод


Генеральная и выборочная совокупности. Статистические распределения выборок. Кумулята и ее свойства. Гистограмма и полигон статистических распределений. Числовые характеристики: выборочная средняя; дисперсия выборки; среднеквадратическое отклонение; мода и медиана для дискретных и интервальных статистических распределений выборки; эмпирические начальные и центральные моменты, асимметрия и эксцесс.

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных — результатах наблюдений. Первая задача математической статистики — указать способы сбора и группировки (если данных очень много) статистических сведений. Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от цели исследования. Изучение тех или иных явлений методами математической статистики служит средством решения многих вопросов, выдвигаемых наукой и практикой (правильная организация технологического процесса, наиболее целесообразное планирование и др.).


Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.




Генеральная и выборочная совокупности


Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, для партии деталей качественным признаком может служить стандартность детали, а количественным — контролируемый размер детали. Иногда проводят сплошное обследование, т. е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяется сравнительно редко. Например, если совокупность содержит большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то случайным образом отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.


Выборочной совокупностью, или просто выборкой, называют совокупность случайно отобранных объектов.


Генеральной совокупностью называют совокупность объектов, из которых проводится выборка.


Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.


Часто генеральная совокупность содержит конечное число объектов. Однако если это число достаточно велико, то иногда для упрощения вычислений или для облегчения теоретических выводов, допускают, что генеральная совокупность состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема генеральной совокупности (достаточно большого объема) практически не сказывается на результатах обработки данных выборки.




Статистические распределения выборок


В результате статистической обработки материалов можно подсчитать число единиц, обладающих конкретным значением того или иного признака. Каждое отдельное значение признака будем обозначать [math]x_1,x_2,\ldots,x_n[/math] и называть вариантой, а абсолютное число, показывающее, сколько раз встречается та или иная варианта, — частотой и обозначать [math]m_1,m_2,\ldots,m_n[/math].


Если отдельные значения признака (варианты) расположим в возрастающем или убывающем порядке и относительно каждой варианты укажем, как часто она встречается в данной совокупности, то получим статистическое распределение признака, или вариационный ряд. Он характеризует изменение (варьирование) какого-нибудь количественного признака. Следовательно, вариационный ряд представляет собой две строки (или колонки). В одной из них приводятся варианты, в другой — частоты.


Вариация признака может быть дискретной и непрерывной. Дискретной называется вариация, при которой отдельные значения признака (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число); Например: количество детей в семье; оценки, полученные студентами на экзамене; размеры обуви, проданной за день фирмой.


Непрерывной называется вариация, при которой значения признака могут отличаться одно от другого на сколь угодно малую величину. Например: стоимость реализованной продукции; уровень рентабельности предприятия; процент занятости трудоспособного населения; депозитная ставка коммерческих банков.


При непрерывной вариации распределение признака называется интервальным. Частоты относятся не к отдельному значению признака, а ко всему интервалу. Часто значением интервала принимают его середину, т. е. центральное значение.




Пример 1. Уровень рентабельности предприятий легкой промышленности характеризуется следующими данными.


Изображение

Нередко вместо абсолютных значений частот используют относительные. Для этого можно использовать долю частоты того или иного варианта (а также интервала) в сумме всех частот. Такая величина называется относительной частотой и обозначается [math]w[/math]. Для получения относительных частот необходимо соответствующую частоту разделить на сумму всех частот:


[math]w_1=\dfrac{m_1}{\sum\limits_{i=1}^{n}m_i};~~~w_2=\dfrac{m_2}{\sum\limits_{i=1}^{n}m_i};~~~\ldots,[/math]

где [math]w_1,~w_2[/math] — относительная частота варианты или интервала соответственно первой, второй и т. д.

Сумма всех относительных частот равна единице:


[math]\sum\limits_{i=1}^{n}w_1=1.[/math]

Относительные частоты можно выражать и в процентах (тогда их сумма равна 100%).


В интервальном вариационном ряду в каждом интервале различают нижнюю и верхнюю границы интервала: нижняя граница интервала [math]x_{\min}[/math]; верхняя граница интервала [math]x_{\max}[/math] величина интервала [math]k=x_{\max}-x_{\min}[/math]. Как правило, при построении интерваль-ных вариационных рядов в каждый интервал включаются варианты, числовые значения которых больше нижней границы и меньше или равны верхней границе. Интервальные вариационные ряды бывают с одинаковыми и неодинаковыми интервалами. В последнем случае чаще всего встречаются последовательно увеличивающиеся интервалы. Для выбора оптимальной величины интервала, т. е. такой, при которой вариационный ряд не будет громоздким и будут сохранены особенности явления, можно рекомендовать формулу


[math]k\approx\frac{x_{\max}-x_{\min}}{1+3,\!2\lg{n}},[/math] где [math]n[/math] — число единиц в совокупности.

Так, если в совокупности 200 единиц, наибольший вариант равен 49,961, а наименьший — 49,918, то


[math]k\approx\frac{49,\!961-49,\!918}{1+3,\!2\lg200}\approx\frac{0,\!043}{8,\!36}\approx0,\!005.[/math]

Следовательно, в данном случае оптимальной величиной интервала может служить 0,005.




Гистограмма и полигон статистических распределений. Кумулята


Для наглядного представления вариационного ряда большое значение имеют его графические изображения. Графически вариационный ряд может быть изображен в виде полигона, гистограммы и кумуляты.


Полигон распределения (дословно — многоугольник распределения) строится в прямоугольной системе координат. Величина признака откладывается на оси абсцисс, частоты или относительные частоты — по оси ординат. Чаще всего полигоны применяются для изображения дискретных вариационных рядов, но их можно применять также для интервальных рядов. В этом случае на оси абсцисс откладываются точки, соответствующие серединам данных интервалов.


Гистограмма распределения строится аналогично полигону в прямоугольной системе координат. В отличие от полигона при построении гистограммы на оси абсцисс выбирают не точки, а отрезки, изображающие интервал, а вместо ординат, соответствующих частотам или относительным частотам отдельных вариант, строят прямоугольники с высотой, пропорциональной частотам или относительным частотам интервала. В случае интервалов различной длины гистограмма распределения строится, не по частотам или относительным частотам, а по плотности интервалов (абсолютной или относительной). При этом общая площадь гистограммы равна численности совокупности, если построение проводится по абсолютной плотности, или единице, если гистограмма построена по относительной плотности.


Если соединить прямыми линиями середины верхних сторон прямоугольников, то получим полигоны распределения.


Разбивая интервалы на несколько частей и исходя из того, что вся — площадь гистограммы должна остаться при этом неизменной, можно получить мелкоступенчатую гистограмму, которая при уменьшении величины интервала будет приближаться к плавной кривой, называемой кривой распределения.




Пример 2. По данным примера и построить полигон распределения и гистограмму.


Решение см. на рисунке 28.


Изображение

Кумулятивная кривая (кривая сумм — кумулята) получается при изображении вариационного ряда с накопленными частотами или относительными частотами в прямоугольной системе координат, Накопленная частота определенной варианты получается суммированием всех частот вариант, предшествующих данной, с частотой этой варианты. При построении кумуляты дискретного признака по оси абсцисс откладывают значения признака (варианты), Ординатами служат вертикальные отрезки, длина которых пропорциональна накопленной частоте или относительной частоте той или иной варианты. Соединением вершин ординат прямыми линиями получаем ломаную (кривую) кумуляту.


При построении кумуляты интервального вариационного ряда нижней границе первого интервала соответствует частота, равная нулю, а верхней — вся частота интервала. Верхней границе второго интервала соответствует накопленная частота первых двух интервалов (т. е. сумма частот этих интервалов) и т. д. Верхней границе последнего (максимального) интервала соответствует накопленная частота, равная сумме всех частот.




Пример 3. По данным примера 1 построить кумуляту распределения.


Решение cм. на рисунке 29.


Изображение



Числовые характеристики выборки


В качестве одной из важнейших характеристик вариационного ряда применяют среднюю величину. Математическая статистика различает несколько типов средних величин: арифметическую, геометрическую, гармоническую, квадратическую, кубическую и др. Все перечисленные типы средних могут быть рассчитаны для случаев, когда каждая из вариант вариационного ряда встречается только один раз (тогда средняя называется простой, или невзвешенной) и когда варианты или интервалы повторяются. При этом число повторений вариант или интервалов называют частотой, или статистическим весом, а среднюю, вычисленную с учетом статистического веса, — взвешенной средней.


Для характеристики вариационного ряда один из перечисленных типов средних выбирается не произвольно, а в зависимости от особенностей изучаемого явления и цели, для которой среднее исчисляется.


Практически при выборе того или иного типа средней следует исходить из принципа осмысленности результата при суммировании или при взвешивании. Только тогда средняя применена правильно, когда в результате взвешивания или суммирования получаются величины, имеющие реальный смысл.


Обычно затруднения при выборе типа средней возникают лишь в использовании средней арифметической, или гармонической. Что же касается геометрической и квадратической средних, то их применение обусловлено особыми случаями (см. далее).


Следует иметь в виду, что средняя только в том случае является обобщающей характеристикой, если она применяется к однородной совокупности. В' случае использования средней для неоднородных совокупностей можно прийти к неверным выводам. Научной основой статистического анализа является метод статистических группировок, т. е. расчленения совокупности на качественно однородные группы.


Все указанные типы средних величин можно получить из формул степенной средней. Если имеются варианты [math]x_1,x_2,\ldots,x_n[/math], то среднюю из вариант можно рассчитать по формуле простой невзвешенной степенной средней порядка [math]z[/math]:


[math]\overline{x}=\sqrt[z]{\frac{1}{n}\sum\limits_{i=1}^{n}x_{i}^{z}}.[/math]

При наличии соответствующих частот [math]m_1,m_2,\ldots,m_n[/math] средняя рассчитывается по формуле взвешенной степенной средней:


[math]\overline{x}=\sqrt[z]{\dfrac{\sum\limits_{i=1}^{n}x_{i}^{z}m_i}{\sum\limits_{i=1}^{n}m_i}}.[/math]

Здесь [math]\overline{x}[/math] — степенная средняя; [math]z[/math] — показатель степени, определяющий тип средней; [math]x_i[/math] — варианты, [math]m_i[/math] — частоты или статистические веса вариантов.

Средняя арифметическая получается из формулы степенной средней при подстановке [math]z=1[/math]:


незвешенная [math]\overline{x}_{\text{ar}}=\frac{1}{n}\sum\limits_{i=1}^{n}x_i[/math]; взвешенная [math]\overline{x}_{\text{ar}}=\dfrac{\sum\limits_{i=1}^{n}x_{i}m_i}{\sum\limits_{i=1}^{n}m_i}[/math]

Средняя гармоническая получается при подстановке в формулу степенной средней значения [math]z=-1[/math]:


незвешенная [math]\overline{x}_{\text{gr}}=\dfrac{n}{\sum\limits_{i=1}^{n}\frac{1}{x_i}}[/math]; взвешенная [math]\overline{x}_{\text{gr}}=\dfrac{\sum\limits_{i=1}^{n}m_i}{\sum\limits_{i=1}^{n}\frac{1}{x_i}}[/math]

Средняя гармоническая вычисляется тогда, когда средняя предназначается для расчета сумм слагаемых, обратно пропорциональных величине данного признака, т. е. когда суммированию подлежат не сами варианты, а обратные им величины [math]\frac{1}{x_1},\frac{1}{x_2},\ldots,\frac{1}{x_n}.[/math].


Средняя квадратическая получается из формулы степенной средней при подстановке [math]z=2[/math]:


незвешенная [math]\overline{x}_{\text{kv}}=\sqrt{\frac{1}{n}\sum\limits_{i=1}^{n}x_i^2}[/math]; взвешенная [math]\overline{x}_{\text{kv}}=\sqrt{\dfrac{\sum\limits_{i=1}^{n}x_i^2}{\sum\limits_{i=1}^{n}m_i}}[/math]

Средняя квадратическая используется только тогда, когда варианты представляют собой отклонения фактических величин от их средней арифметической или от заданной нормы.


Средняя геометрическая получается из формулы степенной средней при предельном переходе [math]z\to0[/math]:


незвешенная [math]\overline{x}_{\text{gm}}=\sqrt[n]{\prod\limits_{i=1}^{n}x_i}[/math]; взвешенная [math]\overline{x}_{\text{gm}}=\sqrt[\sum\limits_{i=1}^{n}m_i]{\prod\limits_{i=1}^{n}x_i^{m_i}}[/math]

Вычисления средней геометрической в значительной мере упрощаются применением логарифмирования:


незвешенная [math]\lg\overline{x}_{\text{gm}}=\frac{1}{n}\sum\limits_{i=1}^{n}\lg{x_i}[/math]; взвешенная [math]\lg\overline{x}_{\text{gm}}=\dfrac{\sum\limits_{i=1}^{n}m_i\lg{x_i}}{\sum\limits_{i=1}^{n}m_i}.[/math]

Таким образом, логарифм средней геометрической есть средняя арифметическая из логарифмов вариантов. Средняя геометрическая используется главным образом при изучении динамики. Средние коэффициенты и темпы роста рассчитывают по формулам средней геометрической.


Если вычислить различные типы средних для одного и того же вариационного ряда, то числовые их значения будут различаться. При этом средние по своей величине расположатся в определенном порядке. Наименьшей из перечисленных средних окажется средняя гармоническая, затем геометрическая и т. д., наибольшей будет средняя квадратическая. При этом порядок возрастания средних определяется показателем степени z в формуле степенной средней. Так, при [math]z=-1[/math] получаем среднюю гармоническую, при [math]z=0[/math] — геометрическую, при [math]z=1[/math] — арифметическую, при [math]z=2[/math] — квадратическую:


[math]\overline{x}_{\text{gr}}<\overline{x}_{\text{gm}}<\overline{x}_{\text{ar}}<\overline{x}_{\text{kv}}[/math]

В качестве характеристики вариационного ряда используют медиану [math](M_e)[/math], т. е. такое значение варьирующего признака, которое приходится на середину упорядоченного вариационного ряда. Если в вариационном ряду [math]2m+1[/math] случаев, то значение признака у случая [math]m+1[/math] будет медианным. Если в ряду четное число [math]2m[/math] случаев, то медиана равна средней арифметической из двух срединных значений. При нечетном количестве вариантов медиана рассчитывается по формуле


[math]M_e=x_{m+1}[/math]; при чётном [math]M_e=\frac{x_m+x_{m+1}}{2}.[/math]

При расчете медианы интервального вариационного ряда сначала находят интервал, содержащий медиану, путем использования накопленных или относительных частот. Медианному интервалу соответствует первая из накопленных или относительных частот, превышающая половину всего объема совокупности. Для нахождения медианы при постоянстве плотности внутри интервала, содержащего медиану, используют формулу


[math]M_e=x_{M_e(\min)}+\frac{k}{m_{M_e}}\left(\frac{1}{2}\sum\limits_{i=1}^{n}m_i-V_{M_e-1}\right)[/math]

где [math]x_{M_e(\min)}[/math] — нижняя граница медианного интервала; [math]k[/math] — величина медианного интервала; [math]V_{M_e-1}[/math] — накопленная частота интервала, предшествующего медианному; [math]m_{M_e}[/math] –частота медианного интервала.

Медиану можно определить также графически по кумуляте. Для этого последнюю ординату, пропорциональную сумме всех частот или относительных частот, делят пополам. Из полученной точки восстанавливают перпендикуляр до пересечения с кумулятой. Абсцисса точки пересечения — значение медианы (см. рис. 29).
Медиана обладает таким свойством: сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины (в том числе и от средней арифметической):


[math]\sum\limits_{i=1}^{n}|x_i-M_e|=\min.[/math]

Это свойство медианы можно использовать при проектировании расположения трамвайных и троллейбусных остановок, бензоколонок и т. д.




Пример 4. На шоссе длиной 100 км имеется 10 гаражей. Для проектирования строительства бензоколонки были собраны данные о числе предполагаемых поездок на заправку с каждого гаража. Результаты обследования приведены в таблице.


Изображение

Бензоколонку нужно поставить так, чтобы общий пробег машин на заправку был наименьшим.


Решение.


Вариант 1. Если бензоколонку поставить на середине шоссе, т. е. на 50-м километре (средняя арифметическая), то пробеги с учетом числа поездок составят:


в одном направлении
[math]43\cdot10+24\cdot15+22\cdot5+13\cdot20+10\cdot5+4\cdot25=1310[/math] км;

в противоположном
[math]10\cdot15+28\cdot30+36\cdot10+42\cdot65=4080[/math] км;

Общий пробег в оба направления окажется равным 5390 км.

Вариант 2. Уменьшения пробега можно достичь, если бензоколонку поставить на 63,85-м километре, т. е. на среднем участке шоссе с учетом числа поездок (средняя арифметическая взвешенная). В этом случае пробеги составят по 2475,75 км в оба направления, т. е. общий пробег составит 4951,5 км и окажется меньше, чем при первом варианте, на 438,5 км.


Вариант 3. Наилучший результат, т. е. минимальный общий пробег, получим, если поставим бензоколонку на 78-м километре, что будет соответствовать медиане. Тогда пробеги составят 3820 км и 990 км. Общий пробег равен 4810 км, т. е. он оказался меньше, общих пробегов, рассчитанных по предыдущим вариантам.




Модой [math]M_0[/math] называется варианта, наиболее часто встречающаяся в данном вариационном ряду. Для дискретного ряда мода, являющаяся характеристикой вариационного ряда, определяется по частотам вариант и соответствует варианте с наибольшей частотой. В случае интервального распределения с равными интервалами модальный интервал (т. е. содержащий моду) определяется по наибольшей частоте, а при неравных интервалах — по наибольшей плотности. Мода рассчитывается по формуле


[math]M_0=x_{M_0(\min)}+k\cdot\frac{m_{M_0}-m_{M_0-1}}{(m_{M_0}-m_{M_0-1})+(m_{M_0}-m_{M_0+1})},[/math]

где [math]x_{M_0(\min)}[/math] — нижняя граница модального интервала; [math]k[/math] — величина модального интервала; [math]m_{M_0}[/math] — частота модального интервала; [math]m_{M_0-1}[/math] частота интервала, предшествующего модальному; [math]m_{M_0+1}[/math] — частота интервала, следующего за модальным.

Вариационные ряды, в которых частоты вариант, равноотстоящих от средней, равны между собой, называются симметричными. Особенность симметричных вариационных рядов состоит в равенстве трех характеристик — средней арифметической, моды и медианы:


[math]\overline{x}=M_0=M_e.[/math]

(это необходимое условие симметричности вариационного ряда, но не достаточное).

Вариационные ряды, в которых расположение вариант вокруг средней не одинаково, т. е. частоты по обе стороны от средней изменяются по-разному, называются асимметричными, или скошенными. Различают асимметрию — левостороннюю и правостороннюю.


Средние величины, характеризуя вариационный ряд одним числом, не учитывают вариацию признака, между тем эта вариация существует. Для измерения вариации признака в математической статистике применяют ряд способов.


Вариационный размах [math]R[/math], или широта распределения, есть разность между наибольшим и наименьшим значениями вариационного ряда:


[math]R=x_{\max}-x_{\min}.[/math]

Вариационный размах представляет собой величину неустойчивую, чрезвычайно зависящую от случайных обстоятельств; применяется для приблизительной оценки вариации.


Среднее линейное отклонение, или простое среднее отклонение (обозначается [math]d[/math]) представляет собой среднюю арифметическую из абсолютных значений отклонений вариант от средней. В зависимости от отсутствия или наличия частот вычисляют среднее линейное отклонение невзвешенное или взвешенное:


[math]d=\frac{1}{n}\sum\limits_{i=1}^{n}|x_i-\overline{x}|;~~~~~d=\dfrac{\sum\limits_{i=1}^{n}|x_i-\overline{x}|m_i}{\sum\limits_{i=1}^{n}m_i}.[/math]

Средний квадрат отклонения, или дисперсия (обозначается [math]D[/math]) наиболее часто применяется как мера колеблемости признака. Дисперсии невзвешенную и взвешенную вычисляют по формулам


[math]D=\frac{1}{n}\sum\limits_{i=1}^{n}(x_i-\overline{x})^2;~~~~~D=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^2m_i}{\sum\limits_{i=1}^{n}m_i}.[/math]

Таким образом, дисперсия есть средняя арифметическая из квадратов отклонений вариант от их средней арифметической.
Квадратный корень из дисперсии [math]\sqrt{D}[/math] называется среднеквадратическим отклонением.


Обобщающими характеристиками вариационных рядов являются моменты распределения. Характер распределения можно определить с помощью небольшого количества моментов.


Средняя из k-х степеней отклонений вариант [math]x[/math] от некоторой постоянной величины [math]A[/math] называется моментом k-го порядка:


[math]M_k=\overline{(x-A)^k}[/math]

При расчете средних в качестве весов можно использовать частоты, относительные частоты или вероятности. При использовании в качестве весов частот или относительных частот моменты называются эмпирическими, а при использовании вероятностей — теоретическими. Порядок момента определяется величиной [math]k[/math]. Эмпирический момент k-го порядка находится как отношение суммы произведений k-х степеней отклонений вариант от постоянной величины [math]A[/math] на частоты к сумме частот:


[math]M_k=\dfrac{\sum\limits_{i=1}^{n}(x_i-A)^km_i}{\sum\limits_{i=1}^{n}m_i}.[/math]

В зависимости от выбора постоянной величины [math]A[/math] различают следующие моменты.


1. Если [math]A=0[/math], то моменты называются начальными, обозначаются [math]\nu_k[/math] и вычисляются по формуле


[math]\nu_k=\dfrac{\sum\limits_{i=1}^{n}x_i^km_i}{\sum\limits_{i=1}^{n}m_i}.[/math]

Тогда при [math]k=0[/math] получаем начальный момент нулевого порядка:


[math]\nu_0=\dfrac{\sum\limits_{i=1}^{n}x_i^0m_i}{\sum\limits_{i=1}^{n}m_i}=1.[/math]

при [math]k=1[/math] получаем начальный момент первого порядка:

[math]\nu_1=\dfrac{\sum\limits_{i=1}^{n}x_im_i}{\sum\limits_{i=1}^{n}m_i}=\overline{x}.[/math]

при [math]k=2[/math] получаем начальный момент второго порядка:

[math]\nu_2=\dfrac{\sum\limits_{i=1}^{n}x_i^2m_i}{\sum\limits_{i=1}^{n}m_i}=\overline{x^2}.[/math]

при [math]k=3[/math] получаем начальный момент третьего порядка:

[math]\nu_3=\dfrac{\sum\limits_{i=1}^{n}x_i^3m_i}{\sum\limits_{i=1}^{n}m_i}=\overline{x^3}.[/math]

при [math]k=4[/math] получаем начальный момент четвёртого порядка:

[math]\nu_4=\dfrac{\sum\limits_{i=1}^{n}x_i^4m_i}{\sum\limits_{i=1}^{n}m_i}=\overline{x^4}.[/math]

и т. д. Практически используют моменты первых четырёх порядков.

2. Если [math]A[/math] не равно нулю, а некоторой произвольной величине [math]x_0[/math] (начало отчёта), то моменты называются начальными относительно [math]x_0[/math], обозначаются [math]\nu'_k[/math] и рассчитываются по формуле


[math]\nu'_k=\dfrac{\sum\limits_{i=1}^{n}(x_i-x_0)^km_i}{\sum\limits_{i=1}^{n}m_i}.[/math]

3. Если за постоянную величину [math]A[/math] взять среднюю [math]A=\overline{x}[/math], то моменты называются центральными, обозначаются [math]\mu_k[/math] и вычисляются так


[math]\mu_k=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^km_i}{\sum\limits_{i=1}^{n}m_i}.[/math]

Тогда при [math]k=0[/math]


[math]\mu_0=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^0m_i}{\sum\limits_{i=1}^{n}m_i}=1,[/math]

то есть центральный момент нулевого порядка, равный единице;

при k=1
[math]\mu_1=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})m_i}{\sum\limits_{i=1}^{n}m_i}=0,[/math]

то есть центральный момент первого порядка равен нулю;

при k=2
[math]\mu_2=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^2m_i}{\sum\limits_{i=1}^{n}m_i}=D,[/math]

то есть центральный момент первого порядка равен дисперсии и служит мерой колеблемости признака;

при k=3
[math]\mu_3=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^3m_i}{\sum\limits_{i=1}^{n}m_i},[/math]

в этом случае центральный момент третьего порядка служит мерой асимметрии распределения признака. Если распределение симметрично, то [math]\mu_3=0[/math];

при k=4
[math]\mu_4=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^4m_i}{\sum\limits_{i=1}^{n}m_i},[/math]

получаем центральный момент четвёртого порядка.

Коэффициентом асимметрии [math]A_s[/math] называется отношение центрального момента третьего порядка к кубу среднеквадратического отклонения:


[math]A_s=\frac{\mu_3}{\sigma^3}=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^3m_i}{\sigma^3\sum\limits_{i=1}^{n}m_i}.[/math]

Если полигон вариационного ряда скошен, то есть одна из его ветвей начиная от вершины зримо короче другой, то такой ряд называется асимметричным.


Эксцессом [math](E)[/math] называется уменьшенное на три единицы отношение центрального момента четвёртого порядка к четвёртой степени среднеквадратического отклонения:


[math]E=\frac{\mu_4}{\sigma^4}-3=\dfrac{\sum\limits_{i=1}^{n}(x_i-\overline{x})^4m_i}{\sigma^4\sum\limits_{i=1}^{n}m_i}-3.[/math]

Кривые распределения, у которых [math]E<0[/math], менее крутые, имеют более плоскую вершину и называются плосковершинными. Кривые распределения, у которых [math]E>0[/math], более крутые, имеют острую вершину и называются островершинными.




Перейти к следующему разделу
Статистические оценки параметров генеральной совокупности. Статистические гипотезы

Часовой пояс: UTC + 4 часа [ Летнее время ]


Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved