Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
новый онлайн-сервис
число, сумма и дата прописью

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 10 ] 
Автор Сообщение
 Заголовок сообщения: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 09 ноя 2018, 18:44 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 18:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Есть данные по производительности вычислений на процессорах. Y – производительность. X – факторы (характеристики процессоров). Необходимо получить возможность делать прогнозы по примерной производительности процессоров которых нет в списке наблюдений.
Преподаватель посоветовал «множественную регрессию». Были рассчитаны коэффициенты регрессии, а проверка их на исходных данных показала относительную близость к оригиналу (см. график).
B Коэффициенты регрессии: -1688753.364, 1327237.477, -3658456.675, -970881.832, 1184856.071, 599.906

Однако при прогнозировании производительности для некоторых случайно выбранных процессоров результат получается мягко говоря неадекватный.
Пример:

X1 Это IntelX2 Это ноутбукX3 Количество ядерX4 Количество потоковX5 Тактовая частотаY расчетный
00221000-660899


Производительность такого процессора может быть низкой, но никак не отрицательной :unknown:
Подскажите, что я делаю не так?
ps исходные данные сняты с реальных процессоров, на ваш сайт не грузит, поэтому залил на ядиск: https://yadi.sk/d/ELNX72qklNPuEw

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 09 ноя 2018, 20:16 
Не в сети
Гений
Зарегистрирован:
30 окт 2015, 15:03
Сообщений: 510
Cпасибо сказано: 11
Спасибо получено:
98 раз в 96 сообщениях
Очков репутации: 14

Добавить очки репутацииУменьшить очки репутации
Коэффициент детерминации [math]R^2[/math] что показывает? Если близок к 1, то хорошая модель, и плохая, если к 0.

Так-то данных мало очень для таких сумасшедших чисел.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 09 ноя 2018, 21:53 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 18:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Zhenek писал(а):
Коэффициент детерминации R2 что показывает? Если близок к 1, то хорошая модель, и плохая, если к 0.

по ссылке на ядиске есть все результаты, в том числе коэффициент детерминации который 0,97
Zhenek писал(а):
Так-то данных мало очень для таких сумасшедших чисел.

у меня есть свежее данные, там уже 17 наблюдений и 6 факторов, против 9 наблюдений и 5 факторов здесь, однако это не спасает ситуацию. К большему числу компьютеров для тестов я не смогу получить доступ физически, и так пришлось подымать все связи и кидать клич, чтобы люди сделали замеры производительности, а я потом это собирал в таблицу.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 10:53 
Не в сети
Последняя инстанция
Зарегистрирован:
06 дек 2014, 09:11
Сообщений: 7070
Cпасибо сказано: 115
Спасибо получено:
1662 раз в 1508 сообщениях
Очков репутации: 283

Добавить очки репутацииУменьшить очки репутации
Данные не смотрел, доступа нет. У вас по количеству ядер получился отрицательный коэффициент. И скорее всего из-за того, что переменные сильно коррелированы. Подозреваю, что количество ядер с количеством потоков. Из этой пары оставляйте только одну переменную. Конечно, 17 наблюдений на 6 параметров - это несерьезно (9 на 5 -это вообще мрак) . И ежу понятно, что переобучение. Оставьте 1, максимум 2. Посмотрите матрицу корреляций, уберите сильно коррелирующие пары переменных (берете только одну из них) и убирайте слабые зависимости y от xi

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 11:12 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 18:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
swan, я знаю эти все подходы, их применение в данном случае только лишь ухудшает результат. потоки и ядра действительно сильно коррелированы.
Скорее всего все уперлось в количество наблюдений и их ограничения, при прогнозировании выход за пределы которых и приводит к неожиданному результату.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 11:40 
Не в сети
Последняя инстанция
Зарегистрирован:
06 дек 2014, 09:11
Сообщений: 7070
Cпасибо сказано: 115
Спасибо получено:
1662 раз в 1508 сообщениях
Очков репутации: 283

Добавить очки репутацииУменьшить очки репутации
beats писал(а):
их применение в данном случае только лишь ухудшает результат

У вас бредовый результат на выходе получился. Ваша модель предсказывает ухудшение производительности при увеличении ядер. Ну куда хуже то?
beats писал(а):
потоки и ядра действительно сильно коррелированы

Ну а что они оба тогда в модели делают, если вы всё знаете? Зачем суете?
Оставьте тактовую частоту и количество ядер и посмотрите.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 12:24 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 18:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Оставлял и смотрел, получается жопа. А так хотябы расчетные модели близки к обучающей выборке. Результат бредовый только для прогнозирования сильно для значений сильно отличающихся. Проверь сам в каком нибудь мат пакеты свои предположения

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 16:36 
Не в сети
Последняя инстанция
Зарегистрирован:
06 дек 2014, 09:11
Сообщений: 7070
Cпасибо сказано: 115
Спасибо получено:
1662 раз в 1508 сообщениях
Очков репутации: 283

Добавить очки репутацииУменьшить очки репутации
Посмотрел данные. Оставляй x1, x2, x3 и x6=x4/x3

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 10 ноя 2018, 21:02 
Не в сети
Начинающий
Зарегистрирован:
27 июн 2013, 18:18
Сообщений: 18
Cпасибо сказано: 2
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
swan писал(а):
Посмотрел данные. Оставляй x1, x2, x3 и x6=x4/x3

Ну допустим. Один из проверочный расчетных по обучающей сборке уже выходит за рамки дозволенного: https://yadi.sk/i/TLpQ7HvLOtf6hw
И потом даже если бы это работало, желательно все факторы оставлять. Я напишу допустим когда программку чтобы сдавать, а препод передвигая ползунки в интерфейсе скажет а почему когда я меняю частоту с 1000 до 4000 производительность не меняется? а я ему скажу да я этот фактор исключил :o может просто есть другой рабочий метод кроме регрессии для таких прогнозов?

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Множественная регрессия – некорректный прогноз
СообщениеДобавлено: 11 ноя 2018, 09:30 
Не в сети
Последняя инстанция
Зарегистрирован:
06 дек 2014, 09:11
Сообщений: 7070
Cпасибо сказано: 115
Спасибо получено:
1662 раз в 1508 сообщениях
Очков репутации: 283

Добавить очки репутацииУменьшить очки репутации
beats писал(а):
И потом даже если бы это работало, желательно все факторы оставлять.


Если бы у вас было хотя бы несколько сотен случаев.

beats писал(а):
Один из проверочный расчетных по обучающей сборке уже выходит за рамки дозволенного:


Регрессию делайте со свободным членом равным нулю. По факту это отвечает действительности.

beats писал(а):
есть другой рабочий метод кроме регрессии для таких прогнозов?


Полно методов, но у всех будет тот же недостаток: недостаточное количество случаев.
Возьмите random forest, например

Вернуться к началу
 Профиль  
Cпасибо сказано 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему      Страница 1 из 1 [ Сообщений: 10 ]

 Похожие темы   Автор   Ответы   Просмотры   Последнее сообщение 
Множественная линейная регрессия

в форуме Информатика и Компьютерные науки

Tallika

3

471

02 июл 2015, 09:46

Множественная корреляция Выш Мат Эконометрика

в форуме Математическая статистика и Эконометрика

Oligarch007

1

301

02 ноя 2020, 19:48

Прогноз показателя SL

в форуме Начала анализа и Другие разделы школьной математики

sarcasmprovider

0

259

15 мар 2020, 17:44

Прогноз продаж на следующий год

в форуме Математическая статистика и Эконометрика

iseman1993

2

2404

01 сен 2019, 00:02

Прогноз с точки зрения науки

в форуме Размышления по поводу и без

Vegas

3

436

19 мар 2017, 14:26

Прогноз следующего числа по алгоритму

в форуме Теория вероятностей

_Alina_

3

262

15 июл 2019, 07:11

Принцип неопределённости и прогноз погоды

в форуме Палата №6

Hoper

2

284

23 окт 2019, 18:52

Улучшить прогноз с помощью регрессии

в форуме Математическая статистика и Эконометрика

tiburon15

1

54

04 мар 2024, 16:41

Возможен ли более уточненный прогноз событий?

в форуме Теория вероятностей

evs

20

294

10 ноя 2019, 14:06

Задача на интервальный прогноз объема потребления

в форуме Математическая статистика и Эконометрика

MrVladlen

0

299

22 май 2014, 18:14


Часовой пояс: UTC + 3 часа [ Летнее время ]



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Яндекс.Метрика

Copyright © 2010-2023 MathHelpPlanet.com. All rights reserved