Математический форум Math Help Planet
Обсуждение и решение задач по математике, физике, химии, экономике Теоретический раздел |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
новый онлайн-сервис число, сумма и дата прописью |
|
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Страница 1 из 1 |
[ Сообщений: 8 ] |
|
Автор | Сообщение | |
---|---|---|
ser6sol |
|
|
Есть задача оценить плотность распределения вероятностей методом KNN. Заданная выборка состоит из 15 значений {319, 319, 320, 325, 326, 326, 327, 327, 328, 328, 330, 331, 332, 336}. Для оценки плотности используется следующая формула: f(x)=[k-1]/[n [math]\cdot[/math] 2 [math]\cdot[/math] [math]\rho[/math] (x) ], ult [math]\rho[/math] - радиус минимального интервала с центром х, который охватывает k значений выборки; k - задаваемый параметр; На этой основе получены 3 оценки плотности (для k=3, 4, 5, см. рис.) Смущает такой момент - полученная плотность дает странный результат и, по всей видимости, не нормируется на единицу. Функция плотности до 316 (при k=1) очевидно будет иметь вид f(x)=3/(15 [math]\cdot[/math] 2 [math]\cdot[/math] (316 - x) ). Тогда, например, вероятность попадания случайной величины в интервал [150; 250] составляет почти 10%, что по данной выборке неочевидно. Возникает вопрос: данный недостаток связан с ошибкой использования метода или сам метод при малых выборках дает некорректный результат? Кто имел с таким подходом дело, пожалуйста, подскажите. Заранее спасибо! |
||
Вернуться к началу | ||
ipgmvq |
|
|
А это учебная задача в ВУЗе?
Или для себя, для работы? Просто это же выборка целых чисел. У их распределения наверняка нет плотности, потому что наверняка это дискретная случайная величина. У непрерывных случайных величин получение двух одинаковых значений в выборке не случится "почти никогда". А тут это "почти никогда" случилось аж 4 раза. |
||
Вернуться к началу | ||
ser6sol |
|
|
Задача для себя - разобраться в KNN методе и сравнить с другими.
Генерировал случайную выборку из нормального распределения, просто округлил до целых. Но, боюсь, что учет большего кол-ва знаков после запятой не спасет задачу, может центр подсгладится, но хвосты распределения останутся тяжелыми. |
||
Вернуться к началу | ||
ipgmvq |
|
|
Вы на R рисовали?
|
||
Вернуться к началу | ||
ser6sol |
|
|
Нет, в MathCAD
|
||
Вернуться к началу | ||
ipgmvq |
|
|
ser6sol писал(а): не нормируется на единицу Глобальная проблема этого метода, что там нормировать вообще нельзя, ибо интегралы концов такой "плотности" справа и слева бесконечны. |
||
Вернуться к началу | ||
За это сообщение пользователю ipgmvq "Спасибо" сказали: ser6sol |
||
ser6sol |
|
|
Есть еще пример с англоязычного форума: https://math.stackexchange.com/question ... -estimator.
Насколько могу судить, с интегрированием хвостов будет та же беда. |
||
Вернуться к началу | ||
ipgmvq |
|
|
А что можно ожидать от
[math]\int\limits_{-\infty}^{x_{(1)}} \frac{ a }{ x_{(k)} -x } d x[/math] и [math]\int\limits_{x_{(n)}}^{\infty} \frac{ a }{ x - x_{(n-k+1)} } d x[/math] где [math]x_{(i)}[/math] это соответствующая порядковая статистика (константа для конкретной выборки) и [math]a[/math] просто константа. |
||
Вернуться к началу | ||
За это сообщение пользователю ipgmvq "Спасибо" сказали: ser6sol |
||
[ Сообщений: 8 ] |
Похожие темы | Автор | Ответы | Просмотры | Последнее сообщение |
---|---|---|---|---|
Задача про соседей ) | 1 |
353 |
22 фев 2021, 13:42 |
|
Найти номер двух ближайших по величине элементов массива
в форуме MathCad |
1 |
417 |
12 окт 2017, 20:14 |
|
Восстановление функции по ее спектрам | 1 |
404 |
24 ноя 2014, 13:31 |
|
Восстановление функции по ее полному дифференциалу
в форуме Интегральное исчисление |
2 |
920 |
18 дек 2016, 20:50 |
|
Восстановление очерёдности элементов по их вероятности
в форуме Теория вероятностей |
18 |
567 |
20 апр 2017, 04:48 |
|
Восстановление базиса в пространстве по трём углам | 0 |
284 |
21 авг 2017, 15:34 |
|
Закон равномерной плотности
в форуме Теория вероятностей |
1 |
331 |
01 май 2018, 09:52 |
|
Вывод плотности вероятностей..
в форуме Теория вероятностей |
1 |
483 |
25 мар 2015, 18:12 |
|
Переоценка дискретной плотности
в форуме Комбинаторика и Теория вероятностей |
2 |
180 |
20 фев 2020, 12:07 |
|
Функция плотности распределения
в форуме Теория вероятностей |
7 |
507 |
28 апр 2018, 08:29 |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 23 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |