Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
новый онлайн-сервис
число, сумма и дата прописью

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 11 ]  На страницу 1, 2  След.
Автор Сообщение
 Заголовок сообщения: Подбор параметров распределения
СообщениеДобавлено: 29 апр 2017, 21:31 
Не в сети
Начинающий
Зарегистрирован:
16 май 2015, 14:05
Сообщений: 11
Cпасибо сказано: 1
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Здравствуйте. Помогите разобраться с подбором параметров к распределению

Есть величина с такой гистограммой частот https://yadi.sk/i/WwGWzdJm3HUoyC.

Данное распределение похоже на распределение Фишера или Парето. С помощью википедии (распределение Фишера и Парето) я пытался подобрать параметры к моему распределению и проверить по тесту Колмогорова-Смирнова два распределения (исходное и полученное распределение на основе найденных параметров). Но все, к сожалению, тщетно: полученные p-value близки к нулю.

Подскажите, пожалуйста, в чем ошибка. Как я могу подобрать необходимое распределение?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 30 апр 2017, 02:43 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
По Колмогорову проверяют распределения с известными параметрами. Если параметры определяются по выборке, то лучше по критерию хи-квадрат. И обычно рядом с гистограммой рисуют график плотности гипотетического распределения.

Вернуться к началу
 Профиль  
Cпасибо сказано 
За это сообщение пользователю Talanov "Спасибо" сказали:
iperevalov
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 30 апр 2017, 06:02 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
iperevalov писал(а):
Есть величина с такой гистограммой частот https://yadi.sk/i/WwGWzdJm3HUoyC.

Похоже на вырожденное в нуле распределение. Каков источник порождения св?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 30 апр 2017, 18:50 
Не в сети
Начинающий
Зарегистрирован:
16 май 2015, 14:05
Сообщений: 11
Cпасибо сказано: 1
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Спасибо за ответ!

Вот гистограмма этой же случайной величины, но в интервале от 0 до 1000 https://yadi.sk/i/JX_xNZqo3HV9q9 (при малом масштабе тут нет вырожденности, в масштабе в [math]10^{7}[/math] видимо имеется). Данные взяты с одной из финансовых бирж, которые характеризуют показатель времени жизни заявки в мкс.

Код программы. По вашему совету применил хи-квадрат распределение. Но для гистограммы в интервале от 0 до 1000.

x <- pretty(c(0:10), 100) # разбиваем отрезок [0; 10] на 100 равных частей
y <- dchisq(x, df = 2) # с помощью встроенной функции в R dchisq находим значения хи-квадрат на этой отрезке с параметром распределения равным 2

x <- x * 100 # масштабируем ось Ox для того, чтобы наложить на гистограмму (для наглядности)
y <- y * 20000 # # масштабируем значения хи-квадрат на ось Oy для того, чтобы наложить на гистограмму (для наглядности)

hist(w) # показ гистограммы
lines(x,y) # кривая хи-квадрат


Вот что из это вышло https://yadi.sk/i/f1VPf4oA3HVhLj

Верно ли я делаю? В смысле верный ли алгоритм, который можно применить ко всем выборкам? Мы имеем право масштабировать?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 01 май 2017, 02:03 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
iperevalov писал(а):
Вот гистограмма этой же случайной величины, но в интервале от 0 до 1000 https://yadi.sk/i/JX_xNZqo3HV9q9

Здесь просматривается смесь как минимум 3-х распределений. Нужно делать расщепление смеси. Можно начать с нормальных.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 01 май 2017, 06:20 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
Каков объём выборки - [math]N[/math]? Тогда можно будет оценить оптимальное количество интервалов [math]k[/math], например, [math]k=\sqrt[3]{N}[/math].

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 01 май 2017, 13:00 
Не в сети
Начинающий
Зарегистрирован:
16 май 2015, 14:05
Сообщений: 11
Cпасибо сказано: 1
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Объем выборки равен 512999. [math]\sqrt[3]{512999} \approx 80[/math]. То есть вы предлагаете разбить на 80 равных интервалов, с помощью квантилей например, и затем посмотреть на каждом из интервалов как ведет себя св?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 01 май 2017, 14:41 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
Возможно это позволит разглядеть функцию распределения.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 02 май 2017, 20:30 
Не в сети
Начинающий
Зарегистрирован:
16 май 2015, 14:05
Сообщений: 11
Cпасибо сказано: 1
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Хорошо. Спасибо.

Примерно я такое делал раньше. Разбивал св на 20-30 интервалов и смотрел на них. В итоге я пришел к выводу, что данная св походит на распределение Фишера. Вы можете подсказать, что необходимо делать дальше?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Подбор параметров распределения
СообщениеДобавлено: 03 май 2017, 01:15 
Не в сети
Последняя инстанция
Аватара пользователя
Зарегистрирован:
28 дек 2011, 15:16
Сообщений: 11671
Откуда: Дивногорск
Cпасибо сказано: 795
Спасибо получено:
1984 раз в 1822 сообщениях
Очков репутации: 314

Добавить очки репутацииУменьшить очки репутации
Всё-таки полагаю что это смесь распределений.

Вернуться к началу
 Профиль  
Cпасибо сказано 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему    На страницу 1, 2  След.  Страница 1 из 2 [ Сообщений: 11 ]

 Похожие темы   Автор   Ответы   Просмотры   Последнее сообщение 
Подбор параметров для ARIMA модели с сеонными переменными

в форуме Математическая статистика и Эконометрика

Helen999121

2

589

10 июл 2021, 14:50

Тип параметров распределения

в форуме Теория вероятностей

give_up

6

904

13 апр 2018, 21:43

Подбор частного решения

в форуме Дифференциальные и Интегральные уравнения

351w

5

389

11 май 2018, 10:06

Подбор формулы для игры

в форуме Пределы числовых последовательностей и функций, Исследования функций

MichaelWonder

5

297

11 апр 2019, 18:14

Задача на подбор компонентов

в форуме Информатика и Компьютерные науки

webjema

3

390

23 фев 2015, 15:23

Подбор суммы из множества чисел

в форуме Информатика и Компьютерные науки

onekill

4

521

19 сен 2018, 15:12

Подбор критерия для проверки корреляции

в форуме Математическая статистика и Эконометрика

BobkaBop

1

88

04 июн 2023, 13:18

Подбор эмпирической функции 2х переменных

в форуме Численные методы

geoler

6

386

19 окт 2016, 18:52

Подбор инструмента для анализа данных исследования

в форуме Математическая статистика и Эконометрика

murmihel

12

472

11 апр 2018, 00:25

Подбор параметра. Организация обратного расчета

в форуме Microsoft Excel

belke

8

343

09 дек 2021, 09:46


Часовой пояс: UTC + 3 часа [ Летнее время ]



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 10


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Яндекс.Метрика

Copyright © 2010-2023 MathHelpPlanet.com. All rights reserved