Дискуссионный математический форумМатематический форум

Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 4 часа [ Летнее время ]
MathHelpPlanet.com RSS-лента Математического форума

Часовой пояс: UTC + 4 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 10 ] 
Автор Сообщение
 Заголовок сообщения: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 09 ноя 2018, 19:44 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 19:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Есть данные по производительности вычислений на процессорах. Y – производительность. X – факторы (характеристики процессоров). Необходимо получить возможность делать прогнозы по примерной производительности процессоров которых нет в списке наблюдений.
Преподаватель посоветовал «множественную регрессию». Были рассчитаны коэффициенты регрессии, а проверка их на исходных данных показала относительную близость к оригиналу (см. график).
B Коэффициенты регрессии: -1688753.364, 1327237.477, -3658456.675, -970881.832, 1184856.071, 599.906

Однако при прогнозировании производительности для некоторых случайно выбранных процессоров результат получается мягко говоря неадекватный.
Пример:

X1 Это IntelX2 Это ноутбукX3 Количество ядерX4 Количество потоковX5 Тактовая частотаY расчетный
00221000-660899


Производительность такого процессора может быть низкой, но никак не отрицательной :unknown:
Подскажите, что я делаю не так?
ps исходные данные сняты с реальных процессоров, на ваш сайт не грузит, поэтому залил на ядиск: https://yadi.sk/d/ELNX72qklNPuEw

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 09 ноя 2018, 21:16 
Не в сети
Мастер
Зарегистрирован:
30 окт 2015, 16:03
Сообщений: 279
Cпасибо сказано: 7
Спасибо получено:
60 раз в 59 сообщениях
Очков репутации: 14

Добавить очки репутацииУменьшить очки репутации
Коэффициент детерминации [math]R^2[/math] что показывает? Если близок к 1, то хорошая модель, и плохая, если к 0.

Так-то данных мало очень для таких сумасшедших чисел.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 09 ноя 2018, 22:53 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 19:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Zhenek писал(а):
Коэффициент детерминации R2 что показывает? Если близок к 1, то хорошая модель, и плохая, если к 0.

по ссылке на ядиске есть все результаты, в том числе коэффициент детерминации который 0,97
Zhenek писал(а):
Так-то данных мало очень для таких сумасшедших чисел.

у меня есть свежее данные, там уже 17 наблюдений и 6 факторов, против 9 наблюдений и 5 факторов здесь, однако это не спасает ситуацию. К большему числу компьютеров для тестов я не смогу получить доступ физически, и так пришлось подымать все связи и кидать клич, чтобы люди сделали замеры производительности, а я потом это собирал в таблицу.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 11:53 
Не в сети
Light & Truth
Зарегистрирован:
06 дек 2014, 10:11
Сообщений: 4006
Cпасибо сказано: 70
Спасибо получено:
855 раз в 777 сообщениях
Очков репутации: 204

Добавить очки репутацииУменьшить очки репутации
Данные не смотрел, доступа нет. У вас по количеству ядер получился отрицательный коэффициент. И скорее всего из-за того, что переменные сильно коррелированы. Подозреваю, что количество ядер с количеством потоков. Из этой пары оставляйте только одну переменную. Конечно, 17 наблюдений на 6 параметров - это несерьезно (9 на 5 -это вообще мрак) . И ежу понятно, что переобучение. Оставьте 1, максимум 2. Посмотрите матрицу корреляций, уберите сильно коррелирующие пары переменных (берете только одну из них) и убирайте слабые зависимости y от xi

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 12:12 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 19:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
swan, я знаю эти все подходы, их применение в данном случае только лишь ухудшает результат. потоки и ядра действительно сильно коррелированы.
Скорее всего все уперлось в количество наблюдений и их ограничения, при прогнозировании выход за пределы которых и приводит к неожиданному результату.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 12:40 
Не в сети
Light & Truth
Зарегистрирован:
06 дек 2014, 10:11
Сообщений: 4006
Cпасибо сказано: 70
Спасибо получено:
855 раз в 777 сообщениях
Очков репутации: 204

Добавить очки репутацииУменьшить очки репутации
beats писал(а):
их применение в данном случае только лишь ухудшает результат

У вас бредовый результат на выходе получился. Ваша модель предсказывает ухудшение производительности при увеличении ядер. Ну куда хуже то?
beats писал(а):
потоки и ядра действительно сильно коррелированы

Ну а что они оба тогда в модели делают, если вы всё знаете? Зачем суете?
Оставьте тактовую частоту и количество ядер и посмотрите.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 13:24 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 19:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Оставлял и смотрел, получается жопа. А так хотябы расчетные модели близки к обучающей выборке. Результат бредовый только для прогнозирования сильно для значений сильно отличающихся. Проверь сам в каком нибудь мат пакеты свои предположения

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 17:36 
Не в сети
Light & Truth
Зарегистрирован:
06 дек 2014, 10:11
Сообщений: 4006
Cпасибо сказано: 70
Спасибо получено:
855 раз в 777 сообщениях
Очков репутации: 204

Добавить очки репутацииУменьшить очки репутации
Посмотрел данные. Оставляй x1, x2, x3 и x6=x4/x3

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 22:02 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 19:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
swan писал(а):
Посмотрел данные. Оставляй x1, x2, x3 и x6=x4/x3

Ну допустим. Один из проверочный расчетных по обучающей сборке уже выходит за рамки дозволенного: https://yadi.sk/i/TLpQ7HvLOtf6hw
И потом даже если бы это работало, желательно все факторы оставлять. Я напишу допустим когда программку чтобы сдавать, а препод передвигая ползунки в интерфейсе скажет а почему когда я меняю частоту с 1000 до 4000 производительность не меняется? а я ему скажу да я этот фактор исключил :o может просто есть другой рабочий метод кроме регрессии для таких прогнозов?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 11 ноя 2018, 10:30 
Не в сети
Light & Truth
Зарегистрирован:
06 дек 2014, 10:11
Сообщений: 4006
Cпасибо сказано: 70
Спасибо получено:
855 раз в 777 сообщениях
Очков репутации: 204

Добавить очки репутацииУменьшить очки репутации
beats писал(а):
И потом даже если бы это работало, желательно все факторы оставлять.


Если бы у вас было хотя бы несколько сотен случаев.

beats писал(а):
Один из проверочный расчетных по обучающей сборке уже выходит за рамки дозволенного:


Регрессию делайте со свободным членом равным нулю. По факту это отвечает действительности.

beats писал(а):
есть другой рабочий метод кроме регрессии для таких прогнозов?


Полно методов, но у всех будет тот же недостаток: недостаточное количество случаев.
Возьмите random forest, например

Вернуться к началу
 Профиль  
Cпасибо сказано 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

 Похожие темы   Автор   Ответы   Просмотры   Последнее сообщение 
Множественная линейная регрессия

в форуме Информатика и Компьютерные науки

Tallika

3

290

02 июл 2015, 10:46

Множественная регрессия. Робастность

в форуме Математическая статистика и Эконометрика

HE9ICbITb

1

491

13 фев 2014, 12:13

Прогноз смертельного исхода

в форуме Математическая статистика и Эконометрика

Talanov

0

197

29 ноя 2012, 17:37

Прогноз с точки зрения науки

в форуме Размышления по поводу и без

Vegas

3

123

19 мар 2017, 15:26

Задача на интервальный прогноз объема потребления

в форуме Математическая статистика и Эконометрика

MrVladlen

0

203

22 май 2014, 19:14

Составить прогноз суммы и уровня издержек обращения

в форуме Экономика и Финансы

OLGA81

0

279

12 июл 2015, 13:57

Линейная регрессия

в форуме Математическая статистика и Эконометрика

Jujytr

1

253

05 апр 2015, 17:25

Экспоненциальная регрессия

в форуме Математическая статистика и Эконометрика

8906

2

470

27 май 2013, 22:56

Кубическая регрессия

в форуме Математическая статистика и Эконометрика

Luty

3

351

07 май 2015, 15:03

Ортогональная регрессия

в форуме Математическая статистика и Эконометрика

Gerren

4

134

04 окт 2017, 23:37


Часовой пояс: UTC + 4 часа [ Летнее время ]



Кто сейчас на конференции

Сейчас этот форум просматривают: passant и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Яндекс.Метрика

Copyright © 2010-2016 MathHelpPlanet.com. All rights reserved