Математический форум Math Help Planet
Обсуждение и решение задач по математике, физике, химии, экономике Теоретический раздел |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
новый онлайн-сервис число, сумма и дата прописью |
|
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Страница 1 из 1 |
[ Сообщений: 6 ] |
|
Автор | Сообщение | |
---|---|---|
tas13 |
|
|
Имеются два показателя характеризующие некоторые регионы, например:, Х1 - доля населения с высшим образованием, Х2 - доля населения с величиной доходов ниже прожиточного уровня. Хочу вычислить коэффициент парной линейной корреляции между ними. Если я закладываю эти данные в какой-либо статистический пакет, то он "тупо" считает среднее по этим данным, дисперсию и в результате выдает r, т.е. без учета распределения численности населения по регионам. Среднее вычисленное по долям = сумма долей/число регионов. С другой стороны, Среднее вычисленное по кол.людей = общее число людей данным признаком/суммарную численность населения регионов. Эти значения получаются разными. Скорее всего я чего-то не понимаю, но вопрос в том, могу ли я вводить такие данные в стандартные статистические пакеты (корреляция, регрессионный анализ, и т.д.)? |
||
Вернуться к началу | ||
swan |
|
|
tas13 писал(а): Среднее вычисленное по долям = сумма долей/число регионов Среднее вычисленное по долям что??? |
||
Вернуться к началу | ||
swan |
|
|
А, понятно. Среднее для расчета корреляции.
Однозначного ответа, на мой взгляд, здесь нет. В учебниках обычно корреляцию считают предполагая данные равноправными. С другой стороны доверие к долям в группе из 100 человек и из10000 человек немного разное. Тогда можно использовать что то типа взвешенной корреляции (вот только ничего я про него не слышал, в отличие от взвешенной регрессии, которая по сути из той же бочки). Мой совет - не заморачивайтесь. Для больших выборок (от десятка тысяч и более) разница будет уже несущественна |
||
Вернуться к началу | ||
Talanov |
|
|
tas13 писал(а): Эти значения получаются разными. Есть гипотезы о равенстве долей. Там учитывается разница в объёмах выборок. |
||
Вернуться к началу | ||
tas13 |
|
|
По реальным данным получено:
средняя доля с учетом численности населения регионов - 0.1268; среднее по долям - 0.1289. Если я формирую таблицу данных где указаны только доли могу ли я запускать ее на анализ в стандартном статистическом пакете? И стоит ли действительно заморачивается такой разницей? Но ведь при определенной структуре данных эта разница может повлиять на результаты последующего анализа. |
||
Вернуться к началу | ||
Talanov |
|
|
Постройте доверительные интервалы для долей. Посмотрите насколько сильно они пересекаются.
|
||
Вернуться к началу | ||
[ Сообщений: 6 ] |
Похожие темы | Автор | Ответы | Просмотры | Последнее сообщение |
---|---|---|---|---|
Анализ данных
в форуме MathCad |
2 |
387 |
03 дек 2017, 16:30 |
|
Анализ полученных данных | 1 |
274 |
05 дек 2016, 22:39 |
|
Анализ данных, нахождение взаимосвязи
в форуме Объявления участников Форума |
3 |
94 |
07 июн 2023, 20:14 |
|
Анализ данных просьба помочь разобраться
в форуме Экономика и Финансы |
1 |
331 |
04 мар 2015, 12:27 |
|
Как провести кластерный анализ большой выборки данных? | 4 |
213 |
03 фев 2022, 22:03 |
|
Статистический анализ данных в виде подмножества интервалов | 5 |
426 |
21 май 2015, 21:24 |
|
Анализ "игольчатых" данных | 0 |
80 |
28 фев 2024, 18:41 |
|
Базы данных
в форуме Информатика и Компьютерные науки |
0 |
123 |
05 ноя 2022, 20:49 |
|
Сортировки данных в c++
в форуме Информатика и Компьютерные науки |
0 |
390 |
13 мар 2018, 23:18 |
|
Выявление аномалий в данных
в форуме Теория вероятностей |
0 |
189 |
28 окт 2017, 12:23 |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 13 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |