Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
новый онлайн-сервис
число, сумма и дата прописью

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 6 ] 
Автор Сообщение
 Заголовок сообщения: Анализ данных представленных в долях
СообщениеДобавлено: 21 ноя 2017, 14:04 
Не в сети
Начинающий
Зарегистрирован:
25 июл 2017, 11:41
Сообщений: 8
Cпасибо сказано: 3
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Прошу развеять некоторые дилетантские сомнения.
Имеются два показателя характеризующие некоторые регионы, например:, Х1 - доля населения с высшим образованием, Х2 - доля населения с величиной доходов ниже прожиточного уровня.
Хочу вычислить коэффициент парной линейной корреляции между ними.
Если я закладываю эти данные в какой-либо статистический пакет, то он "тупо" считает среднее по этим данным, дисперсию и в результате выдает r, т.е. без учета распределения численности населения по регионам.
Среднее вычисленное по долям = сумма долей/число регионов.
С другой стороны, Среднее вычисленное по кол.людей = общее число людей данным признаком/суммарную численность населения регионов.
Эти значения получаются разными.
Скорее всего я чего-то не понимаю, но вопрос в том, могу ли я вводить такие данные в стандартные статистические пакеты (корреляция, регрессионный анализ, и т.д.)?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Анализ данных представленных в долях
СообщениеДобавлено: 21 ноя 2017, 16:21 
Не в сети
Последняя инстанция
Зарегистрирован:
06 дек 2014, 09:11
Сообщений: 7070
Cпасибо сказано: 115
Спасибо получено:
1662 раз в 1508 сообщениях
Очков репутации: 283

Добавить очки репутацииУменьшить очки репутации
tas13 писал(а):
Среднее вычисленное по долям = сумма долей/число регионов


Среднее вычисленное по долям что???

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Анализ данных представленных в долях
СообщениеДобавлено: 21 ноя 2017, 16:33 
Не в сети
Последняя инстанция
Зарегистрирован:
06 дек 2014, 09:11
Сообщений: 7070
Cпасибо сказано: 115
Спасибо получено:
1662 раз в 1508 сообщениях
Очков репутации: 283

Добавить очки репутацииУменьшить очки репутации
А, понятно. Среднее для расчета корреляции.
Однозначного ответа, на мой взгляд, здесь нет.

В учебниках обычно корреляцию считают предполагая данные равноправными.
С другой стороны доверие к долям в группе из 100 человек и из10000 человек немного разное.
Тогда можно использовать что то типа взвешенной корреляции (вот только ничего я про него не слышал, в отличие от взвешенной регрессии, которая по сути из той же бочки).

Мой совет - не заморачивайтесь. Для больших выборок (от десятка тысяч и более) разница будет уже несущественна

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Анализ данных представленных в долях
СообщениеДобавлено: 21 ноя 2017, 17:20 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
tas13 писал(а):
Эти значения получаются разными.

Есть гипотезы о равенстве долей. Там учитывается разница в объёмах выборок.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Анализ данных представленных в долях
СообщениеДобавлено: 21 ноя 2017, 21:23 
Не в сети
Начинающий
Зарегистрирован:
25 июл 2017, 11:41
Сообщений: 8
Cпасибо сказано: 3
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
По реальным данным получено:
средняя доля с учетом численности населения регионов - 0.1268;
среднее по долям - 0.1289.
Если я формирую таблицу данных где указаны только доли могу ли я
запускать ее на анализ в стандартном статистическом пакете?
И стоит ли действительно заморачивается такой разницей?
Но ведь при определенной структуре данных эта разница может повлиять
на результаты последующего анализа.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Анализ данных представленных в долях
СообщениеДобавлено: 22 ноя 2017, 02:36 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
Постройте доверительные интервалы для долей. Посмотрите насколько сильно они пересекаются.

Вернуться к началу
 Профиль  
Cпасибо сказано 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему      Страница 1 из 1 [ Сообщений: 6 ]

 Похожие темы   Автор   Ответы   Просмотры   Последнее сообщение 
Анализ данных

в форуме MathCad

Blackmov

2

387

03 дек 2017, 16:30

Анализ полученных данных

в форуме Математическая статистика и Эконометрика

Vick_Kama

1

274

05 дек 2016, 22:39

Анализ данных, нахождение взаимосвязи

в форуме Объявления участников Форума

Stiletk

3

94

07 июн 2023, 20:14

Анализ данных просьба помочь разобраться

в форуме Экономика и Финансы

Julia666

1

331

04 мар 2015, 12:27

Как провести кластерный анализ большой выборки данных?

в форуме Математическая статистика и Эконометрика

usilitel

4

213

03 фев 2022, 22:03

Статистический анализ данных в виде подмножества интервалов

в форуме Математическая статистика и Эконометрика

ser-gamer

5

426

21 май 2015, 21:24

Анализ "игольчатых" данных

в форуме Ряды Фурье и Интегральные преобразования

O Micron

0

80

28 фев 2024, 18:41

Базы данных

в форуме Информатика и Компьютерные науки

write2levent

0

123

05 ноя 2022, 20:49

Сортировки данных в c++

в форуме Информатика и Компьютерные науки

kvadratisharic

0

390

13 мар 2018, 23:18

Выявление аномалий в данных

в форуме Теория вероятностей

dvader

0

189

28 окт 2017, 12:23


Часовой пояс: UTC + 3 часа [ Летнее время ]



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 13


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Яндекс.Метрика

Copyright © 2010-2023 MathHelpPlanet.com. All rights reserved