Математический форум Math Help Planet
Обсуждение и решение задач по математике, физике, химии, экономике Теоретический раздел |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
новый онлайн-сервис число, сумма и дата прописью |
|
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Страница 1 из 2 |
[ Сообщений: 13 ] | На страницу 1, 2 След. |
|
Автор | Сообщение | |
---|---|---|
Ushwood |
|
|
Итак. У нас есть ЧЕТЫРЕ выборки: две контрольных и две основных. Есть соотношение средних по двум контрольным выборкам <x1>/<x2> и соотношение средних по двум основным выборкам <y1>/<y2>. Необходимо проверить гипотезу о равенстве этих соотношений (не о равенстве средних - они-то заведомо разные). И вот я ума не приложу, как и каким критерием нужно пользоваться... Дополнительная информация: все распределения заведомо ненормальные, выборки неотрицательные, т.е. содержат в том числе нулевые точки. Объемы контрольных выборок 100 и 200, объемы основных выборок больше 10000. |
||
Вернуться к началу | ||
passant |
|
|
А можно немного уточнить вашу задачу, для лучшего понимания.
1. Какова семантика пары выборок? Есть два варианта. 1. Пара выборок, это - как пример - выборочные значения роста и веса, причем не связанных с одним человеком. (Оценили средний вес ста людей, средний рост двухсот людей, потом поделили одно на другое). 2. Пара выборок - это традиционно, две выборки одних и тех-же данных - например, только вес человека - просто проведенные в ходе двух разных экспериментов. Но тогда непонятно, зачем их делить друг на друга. 2. Разброс количества данных в контрольных и основных выборках - это очень плохо. В задачах проверки гипотез все-же лучше, если эти величины хотя-бы примерно были бы близки между собой - тогда оценки будут более статистически надежны. Описанный вами разброс мощности выборок характерен для задач машинного обучения. Если вы поведаете семантику вашей задачи, возможно удастся что-то придумать. 3. Ну и наконец, если "все распределения заведомо ненормальные" - то что вам даст сравнение средних? Для таких выборок вообще-то надо применять непараметрические методы сравнения. Средняя, а уж тем более отношение средних для таких выборок вряд-ли дадут что-то осмысленное. Т.о. опять - нужна семантика эксперимента. |
||
Вернуться к началу | ||
Ushwood |
|
|
Если вкратце, то ситуация такая. Имеется матрица, заполненная случайными числами - теми самыми выборочными значениями. Она разделена на блоки, причем блоки чередуются: "темные" - там, где, условно говоря, большие числа, и "светлые" - где, условно говоря, маленькие. Темные блоки (все ячейки всех темных блоков) - одна выборка, светлые - другая. (Вопрос, действительно ли все темные блоки или все светлые блоки принадлежат к одной и той же генеральной совокупности, сейчас не стоит - считаем, что принадлежат.)
Вот один из сегментов одной из таких матриц (чем больше число, тем ячейка темнее). Из этих девяти ячеек "светлые" - 4 угловых и центральная, "темные" остальные. В общем, такая вот иррегулярная шахматная доска. Задача - определить, скажем так, усредненную "контрастность" этой матрицы, т.е. во сколько раз темные ячейки темнее светлых. Это и есть соотношение средних по двум выборкам. И сравнить с контрастностью контрольной матрицы. От размера матрицы, т.е. от объема выборок, этот показатель зависеть не должен. |
||
Вернуться к началу | ||
Talanov |
|
|
А контрольная матрица как выглядит?
|
||
Вернуться к началу | ||
Ushwood |
|
|
В данный момент нет под рукой конкретного примера.
Но качественно - так же, только она вся размером ~20х20. Размеры "светлых" и "темных" блоков тоже, понятно, другие. По правде скзаать, одно решение мне пришло в голову. Надо все числа основной матрицы, т.е. обе основные выборки, умножить на <x1>/<y1>. Тогда среднее по "темной" основной выборке будет такое же, как по "темной" контрольной. И теперь, если верна нулевая гипотеза о равенстве соотношений средних, это эквивалентно тому, что средние по основной и контрольной "светлым" выборкам тоже равны. А это уже банальный Стьюдент (при таких объемах выборок он работает, даже когда распределения ненормальные). Смущает меня в этом решении то, что домножать приходится на величину, которая сама является производной от этих выборок. Совершенно не факт, что это допустимо. Как минимум это надо доказывать... |
||
Вернуться к началу | ||
Talanov |
|
|
Пусть для контрольной матрицы найдено значение [math]k=\frac{ < y_1 > }{ < y_2 > }[/math]. Тогда для опытной матрицы имеем две выборки [math]< x_1 >[/math] и [math]k< x_2 >[/math]. Тогда проверяем гипотезу о равенстве средних этих двух выборок. Вы это предлагаете?
|
||
Вернуться к началу | ||
Ushwood |
|
|
Не совсем.
Изначально у меня контрольные выборки со средними <x1> и <x2> и опытные выборки со средними <y1> и <y2>. Я нахожу k=<x1>/<y1> и домножаю на k обе опытные выборки. Тогда средние по модифицированным опытным выборкам будут k<y1>=<x1> и k<y2>. Те соотношения средних, которые я изначально должен проверить на равенство, теперь будут выглядеть так: контрольные по-прежнему <x1>/<x2>, а опытные <x1>/(k<y2>). И теперь мне нужно проверить на равенство <x2> и k<y2>, то есть среднее по второй контрольной выборке и среднее по второй модифицированной опытной выборке. Весь вопрос, прокатит ли это? Когда я рассматриваю k как константу, все выглядит легко и приятно, однако если вспомнить, что на самом деле k=<x1>/<y1>, то фактически я проверяю на равенство <x2> и <x1>/<y1>*<y2>, то есть хрен редьки не слаще... |
||
Вернуться к началу | ||
Talanov |
|
|
Ushwood писал(а): Не совсем. А я бы так делал. |
||
Вернуться к началу | ||
Ushwood |
|
|
Talanov
Я проанализировал ваше решение, оно идеологически такое же, как мое. Но в этом случае к нему у меня тот же вопрос, что и к своему: насколько корректно домножать выборку на константу, если эта константа - сама производная от выборок, т.е. ее мы тоже знаем неточно? |
||
Вернуться к началу | ||
Talanov |
|
|
Ushwood писал(а): если эта константа - сама производная от выборок, т.е. ее мы тоже знаем неточно? Но мы же получили её из контрольной матрицы, с которой сравниваем экспериментальную. |
||
Вернуться к началу | ||
На страницу 1, 2 След. | [ Сообщений: 13 ] |
Похожие темы | Автор | Ответы | Просмотры | Последнее сообщение |
---|---|---|---|---|
Проверка гипотезы | 0 |
268 |
29 окт 2017, 18:21 |
|
Проверка статистической гипотезы
в форуме Теория вероятностей |
3 |
200 |
10 май 2020, 16:01 |
|
Проверка правильности гипотезы | 4 |
321 |
15 дек 2019, 18:17 |
|
Проверка гипотезы о нормальном распределении | 3 |
528 |
17 май 2016, 21:17 |
|
Проверка гипотезы. Буду признателен не только на словах ))
в форуме Теория вероятностей |
3 |
103 |
21 ноя 2023, 00:34 |
|
Проверка гипотезы против альтернатив. Вер. Ошибки 1 рода | 1 |
321 |
25 апр 2023, 09:50 |
|
Средняя линия трапеции но в соотношении 1:4 | 14 |
533 |
02 мар 2019, 20:27 |
|
Сравнение средних
в форуме Размышления по поводу и без |
1 |
188 |
27 мар 2020, 04:32 |
|
Предел средних значений
в форуме Теория вероятностей |
0 |
146 |
08 июн 2019, 17:32 |
|
Задача на Неравенства о Средних
в форуме Начала анализа и Другие разделы школьной математики |
3 |
354 |
24 янв 2022, 18:36 |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 14 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |