Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
новый онлайн-сервис
число, сумма и дата прописью

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 8 ] 
Автор Сообщение
 Заголовок сообщения: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 21 мар 2023, 19:46 
Не в сети
Начинающий
Зарегистрирован:
21 мар 2023, 18:55
Сообщений: 4
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Добрый день!
Есть задача оценить плотность распределения вероятностей методом KNN.
Заданная выборка состоит из 15 значений {319, 319, 320, 325, 326, 326, 327, 327, 328, 328, 330, 331, 332, 336}.
Для оценки плотности используется следующая формула: f(x)=[k-1]/[n [math]\cdot[/math] 2 [math]\cdot[/math] [math]\rho[/math] (x) ],
ult [math]\rho[/math] - радиус минимального интервала с центром х, который охватывает k значений выборки;
k - задаваемый параметр;

На этой основе получены 3 оценки плотности (для k=3, 4, 5, см. рис.)



Смущает такой момент - полученная плотность дает странный результат и, по всей видимости, не нормируется на единицу. Функция плотности до 316 (при k=1) очевидно будет иметь вид f(x)=3/(15 [math]\cdot[/math] 2 [math]\cdot[/math] (316 - x) ). Тогда, например, вероятность попадания случайной величины в интервал [150; 250] составляет почти 10%, что по данной выборке неочевидно.

Возникает вопрос: данный недостаток связан с ошибкой использования метода или сам метод при малых выборках дает некорректный результат?
Кто имел с таким подходом дело, пожалуйста, подскажите. Заранее спасибо!

Изображение

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 21 мар 2023, 23:34 
Не в сети
Профи
Зарегистрирован:
04 июн 2020, 01:04
Сообщений: 387
Cпасибо сказано: 33
Спасибо получено:
92 раз в 88 сообщениях
Очков репутации: 14

Добавить очки репутацииУменьшить очки репутации
А это учебная задача в ВУЗе?
Или для себя, для работы?
Просто это же выборка целых чисел. У их распределения наверняка нет плотности, потому что наверняка это дискретная случайная величина. У непрерывных случайных величин получение двух одинаковых значений в выборке не случится "почти никогда". А тут это "почти никогда" случилось аж 4 раза.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 22 мар 2023, 00:25 
Не в сети
Начинающий
Зарегистрирован:
21 мар 2023, 18:55
Сообщений: 4
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Задача для себя - разобраться в KNN методе и сравнить с другими.
Генерировал случайную выборку из нормального распределения, просто округлил до целых.
Но, боюсь, что учет большего кол-ва знаков после запятой не спасет задачу, может центр подсгладится, но хвосты распределения останутся тяжелыми.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 22 мар 2023, 00:30 
Не в сети
Профи
Зарегистрирован:
04 июн 2020, 01:04
Сообщений: 387
Cпасибо сказано: 33
Спасибо получено:
92 раз в 88 сообщениях
Очков репутации: 14

Добавить очки репутацииУменьшить очки репутации
Вы на R рисовали?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 22 мар 2023, 00:33 
Не в сети
Начинающий
Зарегистрирован:
21 мар 2023, 18:55
Сообщений: 4
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Нет, в MathCAD

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 22 мар 2023, 00:56 
Не в сети
Профи
Зарегистрирован:
04 июн 2020, 01:04
Сообщений: 387
Cпасибо сказано: 33
Спасибо получено:
92 раз в 88 сообщениях
Очков репутации: 14

Добавить очки репутацииУменьшить очки репутации
ser6sol писал(а):
не нормируется на единицу
Глобальная проблема этого метода, что там нормировать вообще нельзя, ибо интегралы концов такой "плотности" справа и слева бесконечны. :(

Вернуться к началу
 Профиль  
Cпасибо сказано 
За это сообщение пользователю ipgmvq "Спасибо" сказали:
ser6sol
 Заголовок сообщения: Re: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 22 мар 2023, 23:01 
Не в сети
Начинающий
Зарегистрирован:
21 мар 2023, 18:55
Сообщений: 4
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Есть еще пример с англоязычного форума: https://math.stackexchange.com/question ... -estimator.
Насколько могу судить, с интегрированием хвостов будет та же беда.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Восстановление плотности методом KNN (k ближайших соседей)
СообщениеДобавлено: 23 мар 2023, 00:03 
Не в сети
Профи
Зарегистрирован:
04 июн 2020, 01:04
Сообщений: 387
Cпасибо сказано: 33
Спасибо получено:
92 раз в 88 сообщениях
Очков репутации: 14

Добавить очки репутацииУменьшить очки репутации
А что можно ожидать от

[math]\int\limits_{-\infty}^{x_{(1)}} \frac{ a }{ x_{(k)} -x } d x[/math]

и

[math]\int\limits_{x_{(n)}}^{\infty} \frac{ a }{ x - x_{(n-k+1)} } d x[/math]

где [math]x_{(i)}[/math] это соответствующая порядковая статистика (константа для конкретной выборки) и [math]a[/math] просто константа.

Вернуться к началу
 Профиль  
Cпасибо сказано 
За это сообщение пользователю ipgmvq "Спасибо" сказали:
ser6sol
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему      Страница 1 из 1 [ Сообщений: 8 ]

 Похожие темы   Автор   Ответы   Просмотры   Последнее сообщение 
Задача про соседей )

в форуме Дискуссионные математические проблемы

user2021

1

353

22 фев 2021, 13:42

Найти номер двух ближайших по величине элементов массива

в форуме MathCad

Padik

1

417

12 окт 2017, 20:14

Восстановление функции по ее спектрам

в форуме Ряды Фурье и Интегральные преобразования

AlexImRe

1

404

24 ноя 2014, 13:31

Восстановление функции по ее полному дифференциалу

в форуме Интегральное исчисление

Lida980

2

920

18 дек 2016, 20:50

Восстановление очерёдности элементов по их вероятности

в форуме Теория вероятностей

dyadyakolya

18

567

20 апр 2017, 04:48

Восстановление базиса в пространстве по трём углам

в форуме Аналитическая геометрия и Векторная алгебра

YogeneP

0

284

21 авг 2017, 15:34

Закон равномерной плотности

в форуме Теория вероятностей

huffy

1

331

01 май 2018, 09:52

Вывод плотности вероятностей..

в форуме Теория вероятностей

Alexx74

1

483

25 мар 2015, 18:12

Переоценка дискретной плотности

в форуме Комбинаторика и Теория вероятностей

SnowBeaver

2

180

20 фев 2020, 12:07

Функция плотности распределения

в форуме Теория вероятностей

huffy

7

507

28 апр 2018, 08:29


Часовой пояс: UTC + 3 часа [ Летнее время ]



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 23


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Яндекс.Метрика

Copyright © 2010-2023 MathHelpPlanet.com. All rights reserved