Математический форум Math Help Planet
Обсуждение и решение задач по математике, физике, химии, экономике Теоретический раздел |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
новый онлайн-сервис число, сумма и дата прописью |
|
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Страница 1 из 1 |
[ 1 сообщение ] |
|
Автор | Сообщение | |
---|---|---|
Roman_K |
|
|
Постановку задачи даю в максимально абстрагированном от предмета наших исследований виде — надеюсь, это не помешает выяснить математически корректный метод её решения. Итак... Имеются события, завершающиеся с результатами 1, 2 и 3. Имеется база, содержащая в себе сведения о 200000 событий и их результатах. Имеется средняя по всей базе процентная вероятность каждого из результатов. Имеется некоторое количество (в районе 2000) факторов, которые, предположительно, оказывают влияние на то, какой результат возвращает событие. При этом, в каждом конкретном событии присутствуют не все, а 5-15 факторов. Для каждого из факторов в отдельности мы высчитали отклонение от средней по базе. Выглядит это следующим образом: FactorName Res1 Res2 Res3 Factor---- -8.26% +3.10% +5.16% , что означает, что в выборке событий, в которых присутствует данный фактор, результат 1 встречается, к примеру, не в 50% случаев, как в среднем по базе, а в 41.74%, и так далее... При этом, подсчёт отклонения для фактора исходит из условности: мы рассматриваем его так, как будто бы в каждом из событий выборки он — единственный, что, конечно же, не так. Далее, для того, чтобы доказать (или опровергнуть) гипотезу о том, что рассматриваемые нами факторы действительно оказывают влияние на результат, нам необходимо, основываясь на них, добиться удовлетворительного прогноза по событиям, в нашу базу не входящим. Здесь-то перед нами и встаёт проблема суммирования отклонений нескольких отдельных факторов, имеющих место в событии, в единое «суммирующее» отклонение, которое должно описать/ скорректировать вероятности результатов в этом «неизвестном» для базы событии. Это-то мы и не знаем, как сделать, в связи с тем, что в каждом из тестовых событий должны присутствовать влияния не одного а нескольких факторов. Пробовали просто суммировать отклонения всех факторов, обнаруживающихся в рассматриваемом событии, выводя сумму по каждой из колонок-результатов — получаются совершенно неадекватные значения, которые, будучи прибавлены к стартовым вероятностям, не соотносятся с реальной картиной. Эмпирически, складывается впечатление, что отклонение от нормы, формируемое нашими факторами, в принципе, не может выходить в реальности из диапазона +/- 20% относительно средней, а при простом суммировании отдельных значений такое происходит сплошь и рядом... В связи с этим вопрос: как правильно сводить воедино показания нескольких факторов, присутствующих в событии? P.S. Понимаю, что вопрос сформулировался сумбурно... По мере появления ваших уточняющих вопросов и свободного времени, которого у меня, на данный момент, к сожалению, не так уж и много, буду уточнять. |
||
Вернуться к началу | ||
[ 1 сообщение ] |
Часовой пояс: UTC + 3 часа [ Летнее время ] |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 17 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |