Математический форум Math Help Planet
Обсуждение и решение задач по математике, физике, химии, экономике Теоретический раздел |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
новый онлайн-сервис число, сумма и дата прописью |
|
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Страница 2 из 3 |
[ Сообщений: 30 ] | На страницу Пред. 1, 2, 3 След. |
|
Автор | Сообщение | |
---|---|---|
mathematic_x |
|
|
Talanov писал(а): А какой объём достаточный? Чем больше объем выборки, тем лучше |
||
Вернуться к началу | ||
Talanov |
|
|
При каком объеме вы начинаете считать выборки нерепрезентативными?
|
||
Вернуться к началу | ||
mathematic_x |
|
|
Talanov писал(а): При каком объеме вы начинаете считать выборки нерепрезентативными? 25 и меньше |
||
Вернуться к началу | ||
Talanov |
|
|
Это с какого потолка взято?
|
||
Вернуться к началу | ||
За это сообщение пользователю Talanov "Спасибо" сказали: ipgmvq |
||
ipgmvq |
|
|
mathematic_x
Размер выборки не имеет отношения к репрезентативности. Можно выбрать две трети некой ГС и эта выборка будет нерепрезентативной. mathematic_x писал(а): Я хочу выяснить, если извлечь бесконечное множество выборок размера 2 из этой ГС а затем усреднить их дисперсии, получится ли дисперсия ГС? Если да, то почему? Когда Вы говорите дисперсия ГС, я понимаю, о чём речь. Когда говорите: дисперсия выбоки, я не до конца понимаю, о чём речь.У ГС (точнее у случайной величины) есть параметры, в т.ч. дисперсия ([math]\sigma^{2}[/math]). Параметры обозначаются греческими буквами. У выборки параметров нет. У неё есть функции, которые называют "статистиками". Они обозначаются латинскими буквами (например, [math]s^{2}[/math]). Статистики выборки служат в т.ч. для того, чтобы ими оценить параметр случайной величины. Может быть несколько статистик выборки, каждая из которых называется дисперсией, и которая оценивает параметр дисперсия случайной величины. В частности есть в широком употреблении по меньшей мере две статистики выборочной дисперсии: [math]s^{2} = \frac{ \sum\limits_{i = 1}^{n} \left( x_{i} - \frac{ \sum\limits_{j=1}^{n} x_{ j } }{ n } \right)^{2} }{ n }[/math] и [math]s^{2} = \frac{ \sum\limits_{i = 1}^{n} \left( x_{i} - \frac{ \sum\limits_{j=1}^{n} x_{ j } }{ n } \right)^{2} }{ n - 1 }[/math] Вы можете изобрести какую-нибудь ещё статистику для оценки параметра дисперсия случайной величины, назвав её даже выборочная дисперсия имени mathematic_x и считать её исключительно как [math]s^{2} = \frac{ \sum\limits_{i = 1}^{n} \left( x_{i} - \frac{ \sum\limits_{j=1}^{ n } x_{j} }{ n - e^{-n} } \right)^{2} }{ n + \frac{ 1 }{ 3 } }[/math] Каждая из этих трёх функций выборки каким-то образом (хорошо или плохо) оценивает параметр дисперсия случайной величины. Если матожидание статистики равно оцениваемому параметру случайной величины, такое её свойство называют несмещенностью. Доказано, что статистика выборочной дисперсии, расчитываемая по формуле 2 выше, имеет матожидание равное параметру дисперсия. Поэтому именно её из всех называют несмещенной. Хоть выборки будут размером 2, хоть 3, матожидание такой выборочной дисперсии будет равно параметру. Доказательство по этому случаю есть даже в Википедии. |
||
Вернуться к началу | ||
За это сообщение пользователю ipgmvq "Спасибо" сказали: mathematic_x |
||
Talanov |
|
|
mathematic_x писал(а): если извлечь бесконечное множество выборок размера 2 из этой ГС а затем усреднить их дисперсии, получится ли дисперсия ГС? Статистическое моделирование показывает что да. |
||
Вернуться к началу | ||
За это сообщение пользователю Talanov "Спасибо" сказали: mathematic_x |
||
mathematic_x |
|
|
ipgmvq писал(а): Можно выбрать две трети некой ГС и эта выборка будет нерепрезентативной. Можно, но разве из этого следует что ipgmvq писал(а): Размер выборки не имеет отношения к репрезентативности ??? Допустим нам нужно исследовать размер некоторой детской одежды в 25 городах. Для этого нам надо исследовать как минимум по одной одежде из каждого города. Это минимум 25 одежды. Если взять одежду например только из 5 городов, то такая выборка будет не репрезентативной. С этой точки зрения размер выборки все же имеет отношение к репрезентативности. ipgmvq Остальное в принципе я понимал, только вот концовка вашего сообщения немного мне не понятна. ipgmvq писал(а): Доказательство по этому случаю есть даже в Википедии. То есть само доказательство к сожалению не понял. Буду рад если вы объясните мне его на пальцах Talanov писал(а): Статистическое моделирование показывает что да. Ну статистическое моделирование это одно, а можно ли это как то доказать (желательно на пальцах)? |
||
Вернуться к началу | ||
swan |
|
|
mathematic_x писал(а): Допустим нам нужно исследовать размер некоторой детской одежды в 25 городах. Для этого нам надо исследовать как минимум по одной одежде из каждого города. Не обязательно. mathematic_x писал(а): Если взять одежду например только из 5 городов, то такая выборка будет не репрезентативной Это ошибочное утверждение. Но пусть даже и так. Вы по прежнему хотите доказать, что средний рост |
||
Вернуться к началу | ||
ipgmvq |
|
|
mathematic_x писал(а): Допустим нам нужно исследовать размер некоторой детской одежды в 25 городах. Для этого нам надо исследовать как минимум по одной одежде из каждого города. Это минимум 25 одежды. Если взять одежду например только из 5 городов, то такая выборка будет не репрезентативной. С этой точки зрения размер выборки все же имеет отношение к репрезентативности. Если Вы обеспечите одинаковую вероятность попадания каждого экземпляра одежды из ГС в Вашу выборку, и при этом при каждом выборе нового экземпляра одежды для выборки те экземпляры, которые уже были выбраны, могут принять участие повторно на равных правах с невыбранными экземплярами, то выборка из двух элементов одежды (а с некоторой низкой вероятностью и одного единственного элемента одеджы, представленного в выборке дважды), например, случайно из Ростова-на-Дону и Томска, будет репрезентативной.Как это можно сделать технически? Представьте, что выбираете одежду со складов и розничных точек нескольких ритейловых сетей. И у них есть базы данных с уникальными номерами всех экземпляров одежды в стоке. Вы берете эти таблицы, располагаете все уникальные идентификаторы рядом в столбик. И дальше несколько раз (в данном случае два раза) генерите случайное дискретное число, имеющее равномерное распределение в интервале от 1 до размера выборки включительно. Выпадает номер строки в списке уникальных ID элементов одежды, Вы по таблице смотрите из какого она города, какого ритейла, где её можно забрать для проведения измерений. mathematic_x писал(а): То есть само доказательство к сожалению не понял. Буду рад если вы объясните мне его на пальцах Моё субъективное мнение, что чем дальше, тем "понять" доказательство и "геометрически" его представить будет всё более и более невозможно. Его нельзя "понять", можно только пройти по шагам и убедиться, что в нём (наверное) нет ошибок, а значит вывод верен, и на него нужно опираться дальше. Для борьбы с сомнениями очень полезно, как написал Talanov, провести симуляцию Монте Карло и убедиться, что матожидание именно этой функции/статистики (вероятно) приближается к параметру дисперсии максимально близко на любых размерах выборки (внутри общей выборки симуляции), даже супермаленьких. |
||
Вернуться к началу | ||
За это сообщение пользователю ipgmvq "Спасибо" сказали: mathematic_x |
||
mathematic_x |
|
|
swan писал(а): Это ошибочное утверждение. А в чем ошибка то? Не понял пример с игроками НБА. ipgmvq писал(а): Если Вы обеспечите одинаковую вероятность попадания каждого экземпляра одежды из ГС в Вашу выборку, и при этом при каждом выборе нового экземпляра одежды для выборки те экземпляры, которые уже были выбраны, могут принять участие повторно на равных правах с невыбранными экземплярами, то выборка из двух элементов одежды (а с некоторой низкой вероятностью и одного единственного элемента одеджы, представленного в выборке дважды), например, случайно из Ростова-на-Дону и Томска, будет репрезентативной. Здесь как я понял вы рассматриваете принципиально другой подход к формированию выборок. То о чем говорю я это стратифицированные выборки. Разве это какой то плохой способ провести исследование? На мой взгляд его результаты более надежнее чем прятаться за случайностью полагая что мы получим все необходимые данные формируя выборку... Что дает нам то что мы прячемся за случайностью по сравнению со стратифицированными выборками? В чем плюс? ipgmvq писал(а): И у них есть базы данных с уникальными номерами всех экземпляров одежды в стоке. Такая возможность не всегда есть. ipgmvq писал(а): Его нельзя "понять", можно только пройти по шагам и убедиться, что в нём (наверное) нет ошибок Ну вы же выше сказали что было доказано, а сейчас предлагаете использовать имперический подход для обоснования этого Не знаю, может я ошибаюсь и неправильно понимаю ваши слова... |
||
Вернуться к началу | ||
На страницу Пред. 1, 2, 3 След. | [ Сообщений: 30 ] |
Похожие темы | Автор | Ответы | Просмотры | Последнее сообщение |
---|---|---|---|---|
Выборочные моменты | 1 |
861 |
12 май 2018, 13:46 |
|
Выборочные регрессии | 0 |
286 |
30 май 2019, 19:45 |
|
По сгруппированным данным вычислить выборочные | 1 |
513 |
19 апр 2018, 17:19 |
|
Даны выборочные варианты и соответствующие им частоты | 17 |
372 |
04 ноя 2021, 18:06 |
|
По сгруппированным данным вычислить выборочные числовые
в форуме Теория вероятностей |
1 |
652 |
18 апр 2018, 12:45 |
|
Вычисление дисперсии | 0 |
504 |
03 июн 2014, 17:45 |
|
Формула дисперсии
в форуме Теория вероятностей |
5 |
523 |
23 мар 2021, 14:06 |
|
Оценка дисперсии | 0 |
374 |
05 авг 2016, 06:55 |
|
Задача на нахождение дисперсии D[X]
в форуме Теория вероятностей |
14 |
346 |
18 июн 2020, 23:02 |
|
Задача на вычисление дисперсии
в форуме Теория вероятностей |
0 |
518 |
09 окт 2017, 17:42 |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 18 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |