Математический форум Math Help Planet http://mathhelpplanet.com/ |
|
Проверка гипотезы о соотношении пары выборочных средних http://mathhelpplanet.com/viewtopic.php?f=37&t=62970 |
Страница 1 из 2 |
Автор: | Ushwood [ 04 дек 2018, 13:10 ] |
Заголовок сообщения: | Проверка гипотезы о соотношении пары выборочных средних |
Возникла малость нестандартная задачка, и я завис . Итак. У нас есть ЧЕТЫРЕ выборки: две контрольных и две основных. Есть соотношение средних по двум контрольным выборкам <x1>/<x2> и соотношение средних по двум основным выборкам <y1>/<y2>. Необходимо проверить гипотезу о равенстве этих соотношений (не о равенстве средних - они-то заведомо разные). И вот я ума не приложу, как и каким критерием нужно пользоваться... Дополнительная информация: все распределения заведомо ненормальные, выборки неотрицательные, т.е. содержат в том числе нулевые точки. Объемы контрольных выборок 100 и 200, объемы основных выборок больше 10000. |
Автор: | passant [ 05 дек 2018, 11:42 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
А можно немного уточнить вашу задачу, для лучшего понимания. 1. Какова семантика пары выборок? Есть два варианта. 1. Пара выборок, это - как пример - выборочные значения роста и веса, причем не связанных с одним человеком. (Оценили средний вес ста людей, средний рост двухсот людей, потом поделили одно на другое). 2. Пара выборок - это традиционно, две выборки одних и тех-же данных - например, только вес человека - просто проведенные в ходе двух разных экспериментов. Но тогда непонятно, зачем их делить друг на друга. 2. Разброс количества данных в контрольных и основных выборках - это очень плохо. В задачах проверки гипотез все-же лучше, если эти величины хотя-бы примерно были бы близки между собой - тогда оценки будут более статистически надежны. Описанный вами разброс мощности выборок характерен для задач машинного обучения. Если вы поведаете семантику вашей задачи, возможно удастся что-то придумать. 3. Ну и наконец, если "все распределения заведомо ненормальные" - то что вам даст сравнение средних? Для таких выборок вообще-то надо применять непараметрические методы сравнения. Средняя, а уж тем более отношение средних для таких выборок вряд-ли дадут что-то осмысленное. Т.о. опять - нужна семантика эксперимента. |
Автор: | Talanov [ 05 дек 2018, 14:53 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
А контрольная матрица как выглядит? |
Автор: | Ushwood [ 05 дек 2018, 15:46 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
В данный момент нет под рукой конкретного примера. Но качественно - так же, только она вся размером ~20х20. Размеры "светлых" и "темных" блоков тоже, понятно, другие. По правде скзаать, одно решение мне пришло в голову. Надо все числа основной матрицы, т.е. обе основные выборки, умножить на <x1>/<y1>. Тогда среднее по "темной" основной выборке будет такое же, как по "темной" контрольной. И теперь, если верна нулевая гипотеза о равенстве соотношений средних, это эквивалентно тому, что средние по основной и контрольной "светлым" выборкам тоже равны. А это уже банальный Стьюдент (при таких объемах выборок он работает, даже когда распределения ненормальные). Смущает меня в этом решении то, что домножать приходится на величину, которая сама является производной от этих выборок. Совершенно не факт, что это допустимо. Как минимум это надо доказывать... |
Автор: | Talanov [ 06 дек 2018, 20:27 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
Пусть для контрольной матрицы найдено значение [math]k=\frac{ < y_1 > }{ < y_2 > }[/math]. Тогда для опытной матрицы имеем две выборки [math]< x_1 >[/math] и [math]k< x_2 >[/math]. Тогда проверяем гипотезу о равенстве средних этих двух выборок. Вы это предлагаете? |
Автор: | Ushwood [ 06 дек 2018, 20:57 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
Не совсем. Изначально у меня контрольные выборки со средними <x1> и <x2> и опытные выборки со средними <y1> и <y2>. Я нахожу k=<x1>/<y1> и домножаю на k обе опытные выборки. Тогда средние по модифицированным опытным выборкам будут k<y1>=<x1> и k<y2>. Те соотношения средних, которые я изначально должен проверить на равенство, теперь будут выглядеть так: контрольные по-прежнему <x1>/<x2>, а опытные <x1>/(k<y2>). И теперь мне нужно проверить на равенство <x2> и k<y2>, то есть среднее по второй контрольной выборке и среднее по второй модифицированной опытной выборке. Весь вопрос, прокатит ли это? Когда я рассматриваю k как константу, все выглядит легко и приятно, однако если вспомнить, что на самом деле k=<x1>/<y1>, то фактически я проверяю на равенство <x2> и <x1>/<y1>*<y2>, то есть хрен редьки не слаще... |
Автор: | Talanov [ 06 дек 2018, 21:14 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
Ushwood писал(а): Не совсем. А я бы так делал. |
Автор: | Ushwood [ 07 дек 2018, 12:50 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
Talanov Я проанализировал ваше решение, оно идеологически такое же, как мое. Но в этом случае к нему у меня тот же вопрос, что и к своему: насколько корректно домножать выборку на константу, если эта константа - сама производная от выборок, т.е. ее мы тоже знаем неточно? |
Автор: | Talanov [ 07 дек 2018, 14:00 ] |
Заголовок сообщения: | Re: Проверка гипотезы о соотношении пары выборочных средних |
Ushwood писал(а): если эта константа - сама производная от выборок, т.е. ее мы тоже знаем неточно? Но мы же получили её из контрольной матрицы, с которой сравниваем экспериментальную. |
Страница 1 из 2 | Часовой пояс: UTC + 3 часа [ Летнее время ] |
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group http://www.phpbb.com/ |