Дискуссионный математический форумМатематический форум
Математический форум Math Help Planet

Обсуждение и решение задач по математике, физике, химии, экономике

Теоретический раздел
Часовой пояс: UTC + 3 часа [ Летнее время ]
новый онлайн-сервис
число, сумма и дата прописью

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 3 ] 
Автор Сообщение
 Заголовок сообщения: Приключения монеточки, или 1/e. Сложная задача
СообщениеДобавлено: 10 янв 2019, 23:55 
Не в сети
Начинающий
Зарегистрирован:
10 янв 2019, 20:01
Сообщений: 4
Cпасибо сказано: 1
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
Здравствуйте, уважаемые посетители форума ! У меня сформировалась задача по теории вероятностей, возможно она сама или подходы к ее решению многим пригодятся, сам с ней вожусь уже очень долго, она и простая и сложная одновременно. Заранее приношу извинения за неточность в формулировках, Итак :

Допустим, есть такая игра - игроку предлагается угадать орел-решка, монетка кидается N раз подряд (например 1000), у игрока есть M ед. (например 1000), монетка идеальная(50-50 без подвохов), а вот выплаты за решку +0.5 ед (коэффициент 1.5 вместо классических 2), за орла +2 ед.(коэффициент 3 вместо классических 2). Игроку позволено ставить любую сумму на каждый бросок, более того он может делать ставку, объединяя сразу несколько бросков, и если угадает цепочку, то получит соответствующую выплату(например при ставке 1 ед на цепочку орел-орел-орел игрок получит +26 ед. так как 3*3*3=27) Цель игрока - максимальная выгода при минимальном риске. То есть чем больше в итоге будет М тем лучше, а вот минимальный риск в тервере отсутствует, поэтому обозначим его примерно так - чтобы из 1000 таких игроков играющих параллельно по этой стратегии проигрывали в среднем не более 2(то есть 0.2% в районе 3 сигма даже с запасом)

Что в этой задаче на мой взгляд очевидно и не подлежит сомнению :

1. Игрок всегда ставит на орла, ну здесь само собой положительное мат ожидание, то есть на решку ставить смысла нет.
2. Игроку выгодно ставить, совмещая исходы, потому как опять же это значительно повышает выигрыш, и хотя риск тоже повышается, но это окупается. Например если он проставит 1000 раз по 1 ед на одиночный исход орла, то в среднем в конце игры будет иметь 1.5M (1500 ед потому как 500 раз проиграет и 500 раз выиграет ставку, умноженную на 3), если сериями по 2 орла, то это будет 1000 попыток, из которых удачно закончатся 250 и он будет иметь 2.25М (2250 ед или 250*9). И так далее - чем больше тем лучше.

Я долго не знал как к ней подступиться и даже с чего начать, если говорить о бесконечности то очевидно что игроку выгодно объединять наибольшее количество исходов в одну ставку, так как мат ожидание значительно повышается, то есть в теории получается что максимальная прибыль достигается в случае если он будет ставить одной ставкой 1000 единиц сразу на то что выпадет 1000 орлов подряд и при вероятности 2^1000 он выиграет 1000 ед * 3^1000 , это для случая когда мы говорим о бесконечном количестве его попыток. Из этого логически следует что ему нужна такая стратегия, которая будет захватывать как можно большее количество событий в одну ставку, ведь ставить совместные намного выгоднее чем поодиночке. Понятно что не все 1000 орлов подряд и не на все имеющиеся единицы.

В дальнейших расчетах будут округления и допущения, на конечный результат это повлияет не сильно.

Рассмотрим пример :

Игрок выбирает стратегию по которой будет ставить по 5 ед на ставки, каждая из которых включает в себя все пятерки орлов по порядку (1-5 6-10 и так далее) таким образом в случае успеха его выигрыш в каждом отдельном случае составит 5 * 3^5 = 1215 единиц(при хотя бы одном попадании из 200 попыток). При этом вероятность угадать 5 орлов в отдельно взятой такой ставке 1/32, а попыток у него 200. Вероятность проиграть 200 раз подряд равна 0.001747201 = (1 - 1/32) ^ 200 . Нас устраивает такой риск, в среднем примерно 5 раз из 200 попыток получится поймать серию из 5 орлов, то есть в итоге он будет иметь примерно 6M (или 6075 ед) при риске 0.175%


Вроде бы подходит, но как-то маловато всего лишь 6М для такого серьезного преимущества в данной игре. Условие задачи дает обширное поле действий, возможно здесь дело в размере ставок, например как-то их варьировать ? Скорее всего идеальный алгоритм - это пересчитывать размер ставки при повышении M то есть при попадании в серию орлов, ставка повышается соразмерно текущему M, Если по этой схеме действовать в моем примере то после 110 бросков (22 ставок)наше М с вероятностью 50% увеличится до 2105 единиц(-110 ед на ставки +1215 за угадывание 5 орлов) и тогда следующие ставки будут не по 5 единиц, а по 11(округлим 2105/200), ведь риск то мы уже просчитали.

Теперь пересчитаем по-новому.

Раз у нас попадание происходит в среднем 5 раз за 200 попыток, то и перерасчет произойдет тоже 5 раз, логично усреднить эти точки на значениях 33 - 66 - 99 - 132 - 165 чтобы они были равномерно распределены, вместе с тем следует учитывать что после какого-то количества ставок не только увеличивается банк, но и остается меньше событий (после 33 попыток у нас остается не 200 а 167) Логично предположить что после 5 попаданий необходимо ставку пересчитать до среднего значения, чтобы под конец не проиграть все что накопилось(или не логично ?- здесь сомневаюсь)

1. на 33-й попытке (165 бросков) М станет 2050 ед.(-165 на ставки +1215 за попадание) повышаем до 13 ед(2050/167)
2. на 66-й попытке (330 бросков) М станет 4780 ед. (-429 на ставки + 3159 за попадание) повышаем до 36 ед (4780/133)
3. на 99 й попытке (495 бросков) М станет 12340 ед. (-1188 на ставки + 8748 за попадание) ставка повышается до 122 ед
4. на 132-й попытке М станет 37963 ед (-4026 + 29649) ставка повышается до 567 ед
5. на 165 -й попытке М станет 157033 ед (-18711 + 137781) ставка меняется до среднего значения 185 ед(567+122+36+13 делим на 4)
6. После 1000 броска М становится 150 558 ед (-6475 +0)

Тогда мы уже получаем 150М вместо первоначальных 6М, но мне кажется что этот результат все равно какой то маленький. Опустим некоторые неточности, например что 5 из 200 заходит в среднем (у меня получилось 4.5) и погрешность не 0.02 а 0.0175% Но это уже мелочи, намного интересней сам алгоритм, насколько он правильный, и как его улучшить ?

Основная цель - чтобы у 1000 параллельных таких игроков оказался максимальный совокупный банк, при этом двое из 1000 могут его проиграть. Или же у игрока есть 1000 таких попыток (каждый раз заново с 1000 ед и 1000 бросков) и допускается всего 2 раза проиграться в ноль. Думаю тут без разницы, смысл понятен.

Заранее спасибо за помощь и участие всем кто откликнется и что-то посоветует.

Вернуться к началу
 Профиль  
Cпасибо сказано 
 Заголовок сообщения: Re: Приключения монеточки, или 1/e. Сложная задача
СообщениеДобавлено: 11 янв 2019, 10:10 
Не в сети
Оракул
Зарегистрирован:
10 окт 2018, 22:06
Сообщений: 830
Cпасибо сказано: 209
Спасибо получено:
245 раз в 225 сообщениях
Очков репутации: 38

Добавить очки репутацииУменьшить очки репутации
Хм. Может, стоит попробовать игры с природой для выбора оптимальной стратегии ставок одного игрока (не уверен)? Проверить критерии Байеса, Лапласа и какие там есть еще.

Вернуться к началу
 Профиль  
Cпасибо сказано 
За это сообщение пользователю AGN "Спасибо" сказали:
Dmitriy4444
 Заголовок сообщения: Re: Приключения монеточки, или 1/e. Сложная задача
СообщениеДобавлено: 11 янв 2019, 12:34 
Не в сети
Начинающий
Зарегистрирован:
10 янв 2019, 20:01
Сообщений: 4
Cпасибо сказано: 1
Спасибо получено:
0 раз в 0 сообщении
Очков репутации: 1

Добавить очки репутацииУменьшить очки репутации
С этих сторон не знаю как подойти. Интуитивно мне кажется что ответ на задачу 633М, потому как в подобных ситуациях часто встречается пропорция 1/e, ну например если вероятность события 1/64 то за 64 попытки вероятность его не угадать 1/e то есть 0.36787. Да и по подбору в принципе подходит.

В своем примере я на последнем шаге усреднил ставку чтобы дать примерную оценку в 150М, на деле игроку выгодней на дистанции продолжать увеличивать ставку, не останавливаясь, так как его выигрыш будет значительно выше в среднем чем 150М. Вот последние шаги :
...
5. на 165 -й попытке М станет 157033 ед (-18711 + 137781) ставка меняется до среднего значения 185 ед(567+122+36+13 делим на 4)
6. После 1000 броска М становится 150 558 ед (-6475 +0)

Если игрок не усредняет ставку, а продолжает играть по алгоритму, то

5. на 165 -й попытке М станет 157033 ед (-18711 + 137781) ставка меняется 4486(вместо 4487, чтобы не проиграть М до конца)
6. после 1000-го броска М становится 1090341 или 23, то есть либо 1000М либо 0.023М при вероятности как раз 1/е в пользу игрока.

Понятно что из 1000 случаев у нас будет разный разброс М от указанных выше 0.02М до 10000М (примерно), ведь если в какой то из игр он сможет поймать не 5 раз, а например 7-9, то это существенно увеличит М, и покроет все неудачные попытки в 0.02М

С другой стороны если нас устраивает 0.02М (это почти проигрыш всего банка) то имеет смысл развивать эту тем дальше, но как это сделать ? Мы можем еще повысить риски, у нас увеличится количество этих 0.02М в итоговом результате (из 1000 таких игр), но зато за счет повышения риска мы сможем увеличить верхнюю границу(например не 10000М, а 30000М) тогда и среднее значение увеличится.

То есть в алгоритме со средним 150М мы будем иметь в большинстве случаев как раз это значение( примерно от 100М до 200М) , очень мало шансов на низкое значение М, нас же интересует общий результат за все 1000 таких параллельных игр, иными словами, ничего страшного если будет 900 попыток с результатом 0.02М, зато в оставшихся 100 среднее М будет с лихвой покрывать эти риски.

Возможно, стоит чередовать ставки на 5 орлов со ставками на 6 орлов. Ставка на 5 орлов подряд была выбрана так как риск составлял 0.175%, если же мы ставим на 6 орлов то риск уже составит 0.72%, что с одной стороны выше чем нам нужно, с другой стороны при чередовании можно добиться как раз среднего 0.2%. А раз у нас много попыток и нам не страшно 0.02М, то можно иногда брать и 7 орлов, у чистой стратегии из 7 орлов будет риск проиграть банк в 32%, но с другой стороны если мы будем аккуратно по одному разу в каждую стратегию вставлять, где-то да поймаем. Например ловим стандартные 5 иногда 6 и очень редко 7. То есть (5-5-6-5-5-5-7-5...5) Чтобы примерно прикинуть итоговое М предположим что ставку на 7 орлов мы делаем случайно в каждой из 1000 наших параллельных игр. А по условию 7 орлов дадут нам 3^7 = 2187 умноженное на ставку, которая очень сильно отличается в разных случаях (в нашем усредненном примере от 13 до 4486, на деле же может достигать и более высоких значений). Возьмем нечто среднее например 500 ед, тогда при попадании в 7 орлов мы получим 1000 000 единиц, или 1000М, и это будет не итоговое М, а на момент того когда мы поймаем, то есть оно может еще увеличиться.

Раз мы взяли по разу в каждой параллельной стратегии 7 орлов (остальные 993 бросков распределены между 5 и 6 орлами, в пользу 5) то у нас фактически 1000 попыток угадать 1/128 это вполне реально, более того мы будем угадывать это довольно часто. Тогда точно так же мы можем рассуждать и про 8 орлов, 9 и даже 10.
На 10 остановимся потому что как раз упираемся снова в 1/e, строго говоря попыток у нас не 1024 а 1000, округлим чтобы не напрягаться.

Значит, если на предыдущих этапах не было ошибок, то идеальная стратегия должна в себя включать серии по 5-6-7-8-9-10 орлов в определенной пропорции, 11 орлов нам дают уже 61.36% того что не сыграют ни в одной из 1000 попыток, поэтому мы их использовать не будем(а возможно, стоило ?) 10 орлов нам дают 3^10 * на среднюю ставку 500 = 30 000 000 ед или 30 000М

Таким образом, чем больше мы повышаем серию орлов, тем сильнее становится разброс между М(много 0.02М и мало крупных значений М), но при этом те немногие попытки из 1000 параллельных игр, которые сыграют, дадут нам такое большое М, что оно не только покроет все неудачные попытки, но еще и повысит среднее М. Нам же необходимо не просто повысить среднее М, но еще и уложиться в границы по риску, это мы можем сделать так - раз у нас положительное МО, то и банк в среднем будет расти, нужно просто слегка корректировать каждую ставку, чтобы риск не превысил 0.02% потому что у нас для чистых стратегий из 5 орлов риск 0.175%, для 6 - 0.72%, для 7-32% и так далее, и в чистом виде 0.02% мы не получим, разве что пропорционально брать 5 и 6 орлов чтобы усреднить 0.175% и 0.72%.

на сегодня открытые вопросы :

1. Стоит ли применять стратегию с использованием 11 орлов(и выше), пусть в редких случаях, или не стоит ее использовать вообще ?
2. Какой оптимальный алгоритм действий ?
3. Какое итоговое среднее М при оптимальном алгоритме ?

Вообще по цифрам все есть и мат ожидание и вероятности, оно лежит на ладони, а вот как именно это считается ума не приложу. Или дело тут даже не в формулах, а в каком то изящном решении задачи, которое не лежит на поверхности...

Пока что алгоритм указанный выше из одних только 5 орлов даст в среднем 633М но есть подозрения что использование смеси 5-6 или 5-6-7-8-9-10 даст больше.

Вернуться к началу
 Профиль  
Cпасибо сказано 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему      Страница 1 из 1 [ Сообщений: 3 ]

 Похожие темы   Автор   Ответы   Просмотры   Последнее сообщение 
Сложная задача

в форуме Теория вероятностей

galachel

7

1363

19 дек 2015, 20:41

Сложная задача

в форуме Начала анализа и Другие разделы школьной математики

olegog

10

906

14 июл 2015, 12:54

Сложная задача

в форуме Алгебра

lemur

3

182

25 ноя 2021, 14:43

Сложная задача

в форуме Алгебра

Alexsander

1

498

21 фев 2016, 15:11

Сложная задача

в форуме Геометрия

Pazuiorstv

1

557

15 май 2014, 21:53

Сложная стереометрическая задача №272

в форуме Геометрия

Mikiloy

11

486

09 фев 2023, 23:14

Сложная задача по терверу

в форуме Теория вероятностей

IvanM

1

286

09 апр 2016, 11:01

Сложная геометрическая задача

в форуме Задачи со школьных и студенческих олимпиад

Jambo

4

1105

03 мар 2015, 18:43

Многочлены (сложная задача)

в форуме Задачи со школьных и студенческих олимпиад

wrobel

0

77

26 дек 2023, 16:10

Очень сложная задача

в форуме Интересные задачи участников форума MHP

gkio

1

416

20 апр 2016, 21:31


Часовой пояс: UTC + 3 часа [ Летнее время ]



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 24


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Яндекс.Метрика

Copyright © 2010-2023 MathHelpPlanet.com. All rights reserved