Математический форум Math Help Planet
http://mathhelpplanet.com/

Проверка гипотезы о соотношении пары выборочных средних
http://mathhelpplanet.com/viewtopic.php?f=37&t=62970
Страница 1 из 2

Автор:  Ushwood [ 04 дек 2018, 13:10 ]
Заголовок сообщения:  Проверка гипотезы о соотношении пары выборочных средних

Возникла малость нестандартная задачка, и я завис :(.
Итак. У нас есть ЧЕТЫРЕ выборки: две контрольных и две основных. Есть соотношение средних по двум контрольным выборкам <x1>/<x2> и соотношение средних по двум основным выборкам <y1>/<y2>. Необходимо проверить гипотезу о равенстве этих соотношений (не о равенстве средних - они-то заведомо разные). И вот я ума не приложу, как и каким критерием нужно пользоваться...
Дополнительная информация: все распределения заведомо ненормальные, выборки неотрицательные, т.е. содержат в том числе нулевые точки. Объемы контрольных выборок 100 и 200, объемы основных выборок больше 10000.

Автор:  passant [ 05 дек 2018, 11:42 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

А можно немного уточнить вашу задачу, для лучшего понимания.
1. Какова семантика пары выборок? Есть два варианта. 1. Пара выборок, это - как пример - выборочные значения роста и веса, причем не связанных с одним человеком. (Оценили средний вес ста людей, средний рост двухсот людей, потом поделили одно на другое). 2. Пара выборок - это традиционно, две выборки одних и тех-же данных - например, только вес человека - просто проведенные в ходе двух разных экспериментов. Но тогда непонятно, зачем их делить друг на друга.
2. Разброс количества данных в контрольных и основных выборках - это очень плохо. В задачах проверки гипотез все-же лучше, если эти величины хотя-бы примерно были бы близки между собой - тогда оценки будут более статистически надежны. Описанный вами разброс мощности выборок характерен для задач машинного обучения. Если вы поведаете семантику вашей задачи, возможно удастся что-то придумать.
3. Ну и наконец, если "все распределения заведомо ненормальные" - то что вам даст сравнение средних? Для таких выборок вообще-то надо применять непараметрические методы сравнения. Средняя, а уж тем более отношение средних для таких выборок вряд-ли дадут что-то осмысленное. Т.о. опять - нужна семантика эксперимента.

Автор:  Ushwood [ 05 дек 2018, 14:32 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

Если вкратце, то ситуация такая. Имеется матрица, заполненная случайными числами - теми самыми выборочными значениями. Она разделена на блоки, причем блоки чередуются: "темные" - там, где, условно говоря, большие числа, и "светлые" - где, условно говоря, маленькие. Темные блоки (все ячейки всех темных блоков) - одна выборка, светлые - другая. (Вопрос, действительно ли все темные блоки или все светлые блоки принадлежат к одной и той же генеральной совокупности, сейчас не стоит - считаем, что принадлежат.)
Вот один из сегментов одной из таких матриц (чем больше число, тем ячейка темнее).
Изображение
Из этих девяти ячеек "светлые" - 4 угловых и центральная, "темные" остальные. В общем, такая вот иррегулярная шахматная доска.
Задача - определить, скажем так, усредненную "контрастность" этой матрицы, т.е. во сколько раз темные ячейки темнее светлых. Это и есть соотношение средних по двум выборкам. И сравнить с контрастностью контрольной матрицы. От размера матрицы, т.е. от объема выборок, этот показатель зависеть не должен.

Автор:  Talanov [ 05 дек 2018, 14:53 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

А контрольная матрица как выглядит?

Автор:  Ushwood [ 05 дек 2018, 15:46 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

В данный момент нет под рукой конкретного примера.
Но качественно - так же, только она вся размером ~20х20. Размеры "светлых" и "темных" блоков тоже, понятно, другие.

По правде скзаать, одно решение мне пришло в голову. Надо все числа основной матрицы, т.е. обе основные выборки, умножить на <x1>/<y1>. Тогда среднее по "темной" основной выборке будет такое же, как по "темной" контрольной. И теперь, если верна нулевая гипотеза о равенстве соотношений средних, это эквивалентно тому, что средние по основной и контрольной "светлым" выборкам тоже равны. А это уже банальный Стьюдент (при таких объемах выборок он работает, даже когда распределения ненормальные).
Смущает меня в этом решении то, что домножать приходится на величину, которая сама является производной от этих выборок. Совершенно не факт, что это допустимо. Как минимум это надо доказывать...

Автор:  Talanov [ 06 дек 2018, 20:27 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

Пусть для контрольной матрицы найдено значение [math]k=\frac{ < y_1 > }{ < y_2 > }[/math]. Тогда для опытной матрицы имеем две выборки [math]< x_1 >[/math] и [math]k< x_2 >[/math]. Тогда проверяем гипотезу о равенстве средних этих двух выборок. Вы это предлагаете?

Автор:  Ushwood [ 06 дек 2018, 20:57 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

Не совсем.

Изначально у меня контрольные выборки со средними <x1> и <x2> и опытные выборки со средними <y1> и <y2>.
Я нахожу k=<x1>/<y1> и домножаю на k обе опытные выборки.
Тогда средние по модифицированным опытным выборкам будут k<y1>=<x1> и k<y2>.
Те соотношения средних, которые я изначально должен проверить на равенство, теперь будут выглядеть так: контрольные по-прежнему <x1>/<x2>, а опытные <x1>/(k<y2>). И теперь мне нужно проверить на равенство <x2> и k<y2>, то есть среднее по второй контрольной выборке и среднее по второй модифицированной опытной выборке.

Весь вопрос, прокатит ли это? Когда я рассматриваю k как константу, все выглядит легко и приятно, однако если вспомнить, что на самом деле k=<x1>/<y1>, то фактически я проверяю на равенство <x2> и <x1>/<y1>*<y2>, то есть хрен редьки не слаще...

Автор:  Talanov [ 06 дек 2018, 21:14 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

Ushwood писал(а):
Не совсем.

А я бы так делал.

Автор:  Ushwood [ 07 дек 2018, 12:50 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

Talanov
Я проанализировал ваше решение, оно идеологически такое же, как мое.
Но в этом случае к нему у меня тот же вопрос, что и к своему: насколько корректно домножать выборку на константу, если эта константа - сама производная от выборок, т.е. ее мы тоже знаем неточно?

Автор:  Talanov [ 07 дек 2018, 14:00 ]
Заголовок сообщения:  Re: Проверка гипотезы о соотношении пары выборочных средних

Ushwood писал(а):
если эта константа - сама производная от выборок, т.е. ее мы тоже знаем неточно?

Но мы же получили её из контрольной матрицы, с которой сравниваем экспериментальную.

Страница 1 из 2 Часовой пояс: UTC + 3 часа [ Летнее время ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/