Математический форум Math Help Planet
Обсуждение и решение задач по математике, физике, химии, экономике Теоретический раздел |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
новый онлайн-сервис число, сумма и дата прописью |
|
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Страница 3 из 3 |
[ Сообщений: 30 ] | На страницу Пред. 1, 2, 3 |
|
Автор | Сообщение | |
---|---|---|
swan |
|
|
mathematic_x писал(а): имперический Нужное прилагательное происходит от греческого слова, означающего "опыт", а не от латинского "власть" |
||
Вернуться к началу | ||
mathematic_x |
|
|
swan писал(а): Нужное прилагательное происходит от греческого слова, означающего "опыт", а не от латинского "власть" Увы, но снова не понял к чему это. Я конечно рад тому что люди мне здесь отвечают, но к сожалению ответы обычно таковы, что причинно-следственная связь не прослеживается явным образом между заданным вопросом и ответом на него. |
||
Вернуться к началу | ||
ipgmvq |
|
|
mathematic_x писал(а): Здесь как я понял вы рассматриваете принципиально другой подход к формированию выборок. То о чем говорю я это стратифицированные выборки. Стратификация по сути это формирование нескольких выборок разных случайных величин (разных генеральных совокупностей). Вот такая выборка точно будет нерепрезентативна в отношении общей популяции.Представте, что Вы хотели делать нормальную одну выборку типа той, что я описал выше, но в рамках клинического исследования для редкого заболевания. Заболевание настолько редко, что все вновь диагностированные пациенты стекаются в два центра во всей России: в Москве и Новокузнецке. За одного редкого включенного пациента, который будет наблюдаться 2 года, исследователю платят, допустим, $5000. Исходя из аллокации регионов России к этим двум центрам, Вы предполагаете, что в Новокузнецк должны попадать 15% новых пациентов с этим заболеванием. Но для исследователя в Москве $5000 за одного пациента за 2 года это, допустим, не очень привлекательное предложение. И кроме этого исследования в том же центре идет исследование лекарства по другому заболеванию, где платят больше. А в Новокузнецке за $5000 будут лично обзванивать все областные больницы на территории, за которую они отвечают, раз в неделю, чтобы убедиться, что никого с похожими симптомами у них не появилось, и не пропустить редкий диагноз. Если в исследование планируют включить, допустим, 600 человек за 4 года набора, можно предположить, что большая часть из них будет набрана в Новокузнецке. И Вы специально стратифицируете, запрещая Новокузнецку набрать, допустим, больше 20% или 25% от цели в 600 человек. Или Вы продаете некий продукт и знаете по маркетинговым исследованиям, что около 80% потребителей старше 55 лет. Вы захотели изучить отношение к продукту тех людей, которые никогда им не пользовались. Делать выборку по ID Вы не сможете технически, но учитывая то, что всё равно среди будущих потребителей будет около 80% старше 55 лет, Вы ограничиваете набор людей младше 55 лет неким процентом от общего набора. Иначе случайно их набралось бы больше. Но набранные люди не являются репрезентативной выборкой относительно общей популяции людей в РФ. Статистики этой выборки вообще отражают другую случайную величину, или точнее комбинацию двух случайных величин (более желательную Вам, чем общая популяция людей, которые ещё не пользовались этим продуктом, в данном случае). Либо Вы заранее хотите сравнить попарно с контролем эффекты лекарства по возрастным группам. Опять же стратификация по сути даст несколько отдельных выборок из разных (очень разных) ГС. И это как делать параллельно несколько исследований. Обычные стат. тесты не работают и не валидны для стратификации. Они сделаны именно для случайной выборки из одной ГС. Поэтому это либо по сути несколько паралелльных исследований для разных страт, либо вынужденная мера для борьбы с ещё большей искусственной нерепрезентативностью ("меньшее зло") (как в случае с Новокузнецком выше). mathematic_x писал(а): подход для обоснования этого я же написал не для обоснования, а для самоуспокоения, когда имеющееся доказательство кажется валидным, но результат интуитивно неприемлем.В этой лекции Гарварского университета по теории вероятностей лектор рассказывает, говоря о Парадоксе Монти Холла, историю о том, что многие (тысячи) читателей и математики, в т.ч. сотни с научными степенями PhD, не могли (психологически) принять правильный ответ и вступали в грубую перепалку, обвиняя другую сторону в тупости. Причём это длилось долстаточно долго. В то же время, как говорит лектор, они могли просто проверить эту историю в симуляции, и не увидеть разницу между 2/3 и 1/2 в симуляции у них бы не получилось. Это простое упражнение, которое занимает несколько минут, позволило бы им не тратить много времени на препирательства относительно валидности доказательства противоположной стороны. |
||
Вернуться к началу | ||
За это сообщение пользователю ipgmvq "Спасибо" сказали: mathematic_x |
||
Talanov |
|
|
mathematic_x писал(а): Ну статистическое моделирование это одно, а можно ли это как то доказать (желательно на пальцах)? Имеем стандартное нормальное распределение для св [math]\xi_i, \; \eta_i[/math] и нормальную ГС с мо=[math]\mu[/math] и ско = [math]\sigma[/math]. Для выборки объёмом 2 имеем [math]x_1i=\mu+\sigma\xi_i[/math] и [math]x_2i=\mu+\sigma\eta_i[/math]. Среднее выборочное значение [math]\overline{x_i} =\frac{x_1i+x_2i}{2}=\mu+\frac{\sigma}{2}(\xi_i+\eta_i)[/math]. Исправленная выборочная дисперсия [math]D_i=(\mu+\frac{\sigma}{2}(\xi_i+\eta_i)-\mu-\sigma\xi_i)^2+(\mu+\frac{\sigma}{2}(\xi_i+\eta_i)-\mu-\sigma\eta_i)^2=\frac{\sigma^2}{2}(\xi_i^2+\eta_i^2-2\eta_i\xi_i)[/math]. Средняя дисперсия для множества пар [math]\frac{ \sum\limits_{i=1}^{ n} D_i }{ n } = \frac{\sigma^2}{2}(\frac{ \sum\limits_{i=1}^{ n} \eta_i^2 }{ n }+\frac{ \sum\limits_{i=1}^{ n} \xi_i^2 }{ n }+\frac{ \sum\limits_{i=1}^{ n} \eta_i\xi}{ n })=\frac{\sigma^2}{2}(1+1-0)=\sigma^2[/math]. Ч.т.д. |
||
Вернуться к началу | ||
За это сообщение пользователю Talanov "Спасибо" сказали: ipgmvq, mathematic_x |
||
mathematic_x |
|
|
ipgmvq писал(а): Стратификация по сути это формирование нескольких выборок разных случайных величин (разных генеральных совокупностей). Вот такая выборка точно будет нерепрезентативна в отношении общей популяции. Ну выборками я думаю назвать это сложно т.к по этим "выборкам" никак не оцениваются параметры ГС. ipgmvq А так то я понял мысль, спасибо за развернутый ответ! Однако если страты (группы) будут такими, что не отсекают часть ГС, то все же думаю можно будет сделать так что бы конечная выборка была репрезентативной относительно ГС. Но это конечно во многом зависит от характера исследования. Talanov Спасибо что постарались Однако пока путаюсь в специальных символах. Может спустя некоторое время пойму это доказательство |
||
Вернуться к началу | ||
Talanov |
|
|
mathematic_x писал(а): Мы же можем например извлекать из нее выборки размера 2, никто не запрещает. Но эти выборки не будут репрезентативными, так ведь? Не так. Для однородной ГС и случайном выборе будут. |
||
Вернуться к началу | ||
За это сообщение пользователю Talanov "Спасибо" сказали: mathematic_x |
||
Talanov |
|
|
mathematic_x писал(а): Может спустя некоторое время пойму это доказательство Пусть имеется ГС с известным матожиданием ([math]\mu =0[/math] для определённости)и с неизвестной дисперсией [math]D[/math]. Извлекаем множество выборок с одним элементом - [math]x_i[/math]. [math]\frac{ \sum\limits_{i=1}^{n} x_i^2 }{ n} =D[/math]. Так понятно? |
||
Вернуться к началу | ||
За это сообщение пользователю Talanov "Спасибо" сказали: mathematic_x |
||
mathematic_x |
|
|
Talanov писал(а): Так понятно? Очень даже понятно)) Спасибо! Talanov Только я не знаю насколько правильным будет обобщить этот результат на выборки всякого размера |
||
Вернуться к началу | ||
Talanov |
|
|
mathematic_x писал(а): Только я не знаю насколько правильным будет обобщить этот результат на выборки всякого размера Аналогично докажите сами. |
||
Вернуться к началу | ||
За это сообщение пользователю Talanov "Спасибо" сказали: mathematic_x |
||
mathematic_x |
|
|
Talanov писал(а): Аналогично докажите сами. Я пытался, но кое что осталось не ясным. В вашем примере используется исключительно среднее по ГС. Т.е оно общее для всех выборок размера 1. А я пытаюсь доказать используя выборочные средние (т.е оно каждый раз меняется). Или тут фишка в том что выборки репрезентативные, и среднее каждой из них +- очень близка к средней по ГС? |
||
Вернуться к началу | ||
На страницу Пред. 1, 2, 3 | [ Сообщений: 30 ] |
Похожие темы | Автор | Ответы | Просмотры | Последнее сообщение |
---|---|---|---|---|
Выборочные моменты | 1 |
862 |
12 май 2018, 13:46 |
|
Выборочные регрессии | 0 |
286 |
30 май 2019, 19:45 |
|
По сгруппированным данным вычислить выборочные | 1 |
513 |
19 апр 2018, 17:19 |
|
Даны выборочные варианты и соответствующие им частоты | 17 |
372 |
04 ноя 2021, 18:06 |
|
По сгруппированным данным вычислить выборочные числовые
в форуме Теория вероятностей |
1 |
652 |
18 апр 2018, 12:45 |
|
Вычисление дисперсии | 0 |
504 |
03 июн 2014, 17:45 |
|
Формула дисперсии
в форуме Теория вероятностей |
5 |
523 |
23 мар 2021, 14:06 |
|
Оценка дисперсии | 0 |
374 |
05 авг 2016, 06:55 |
|
Задача на нахождение дисперсии D[X]
в форуме Теория вероятностей |
14 |
346 |
18 июн 2020, 23:02 |
|
Задача на вычисление дисперсии
в форуме Теория вероятностей |
0 |
518 |
09 окт 2017, 17:42 |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 15 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |