Банк рефератов содержит более 364 тысяч рефератов, курсовых и дипломных работ, шпаргалок и докладов по различным дисциплинам: истории, психологии, экономике, менеджменту, философии, праву, экологии. А также изложения, сочинения по литературе, отчеты по практике, топики по английскому.
Полнотекстовый поиск
Всего работ:
364139
Теги названий
Разделы
Авиация и космонавтика (304)
Административное право (123)
Арбитражный процесс (23)
Архитектура (113)
Астрология (4)
Астрономия (4814)
Банковское дело (5227)
Безопасность жизнедеятельности (2616)
Биографии (3423)
Биология (4214)
Биология и химия (1518)
Биржевое дело (68)
Ботаника и сельское хоз-во (2836)
Бухгалтерский учет и аудит (8269)
Валютные отношения (50)
Ветеринария (50)
Военная кафедра (762)
ГДЗ (2)
География (5275)
Геодезия (30)
Геология (1222)
Геополитика (43)
Государство и право (20403)
Гражданское право и процесс (465)
Делопроизводство (19)
Деньги и кредит (108)
ЕГЭ (173)
Естествознание (96)
Журналистика (899)
ЗНО (54)
Зоология (34)
Издательское дело и полиграфия (476)
Инвестиции (106)
Иностранный язык (62791)
Информатика (3562)
Информатика, программирование (6444)
Исторические личности (2165)
История (21319)
История техники (766)
Кибернетика (64)
Коммуникации и связь (3145)
Компьютерные науки (60)
Косметология (17)
Краеведение и этнография (588)
Краткое содержание произведений (1000)
Криминалистика (106)
Криминология (48)
Криптология (3)
Кулинария (1167)
Культура и искусство (8485)
Культурология (537)
Литература : зарубежная (2044)
Литература и русский язык (11657)
Логика (532)
Логистика (21)
Маркетинг (7985)
Математика (3721)
Медицина, здоровье (10549)
Медицинские науки (88)
Международное публичное право (58)
Международное частное право (36)
Международные отношения (2257)
Менеджмент (12491)
Металлургия (91)
Москвоведение (797)
Музыка (1338)
Муниципальное право (24)
Налоги, налогообложение (214)
Наука и техника (1141)
Начертательная геометрия (3)
Оккультизм и уфология (8)
Остальные рефераты (21692)
Педагогика (7850)
Политология (3801)
Право (682)
Право, юриспруденция (2881)
Предпринимательство (475)
Прикладные науки (1)
Промышленность, производство (7100)
Психология (8692)
психология, педагогика (4121)
Радиоэлектроника (443)
Реклама (952)
Религия и мифология (2967)
Риторика (23)
Сексология (748)
Социология (4876)
Статистика (95)
Страхование (107)
Строительные науки (7)
Строительство (2004)
Схемотехника (15)
Таможенная система (663)
Теория государства и права (240)
Теория организации (39)
Теплотехника (25)
Технология (624)
Товароведение (16)
Транспорт (2652)
Трудовое право (136)
Туризм (90)
Уголовное право и процесс (406)
Управление (95)
Управленческие науки (24)
Физика (3462)
Физкультура и спорт (4482)
Философия (7216)
Финансовые науки (4592)
Финансы (5386)
Фотография (3)
Химия (2244)
Хозяйственное право (23)
Цифровые устройства (29)
Экологическое право (35)
Экология (4517)
Экономика (20644)
Экономико-математическое моделирование (666)
Экономическая география (119)
Экономическая теория (2573)
Этика (889)
Юриспруденция (288)
Языковедение (148)
Языкознание, филология (1140)

Реферат: Решение игры в смешанных стратегиях

Название: Решение игры в смешанных стратегиях
Раздел: Рефераты по математике
Тип: реферат Добавлен 11:36:06 03 июля 2011 Похожие работы
Просмотров: 313 Комментариев: 19 Оценило: 2 человек Средний балл: 5 Оценка: неизвестно     Скачать

Решение игр в смешанных стратегиях.

Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. Так, в примере 1 α ≠ β , седловая точка отсутствует. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.

Смешанной стратегией SA игрока А называется применение чистых стратегий A1 , A2 , ..., Am с вероятностями p1 , p2 , ..., pi , ..., pm причем сумма вероятностей равна 1:

Смешанные стратегии игрока А записываются в виде матрицы

или в виде строки SA = (p1 , p2 , ..., pi , ..., pm )

Аналогично смешанные стратегии игрока В обозначаются:

, или, SB = (q1 , q2 , ..., qi , ..., qn ),

где сумма вероятностей появления стратегий равна 1:

Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии. На основании принципа минимакса определяется оптимальное решение (или решение ) игры: это пара оптимальных стратегий S* A , S* B в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v . Цена игры удовлетворяет неравенству:

α ≤ v ≤ β

где α и β — нижняя и верхняя цены игры. Справедлива следующая основная теорема теории игр — теорема Неймана . Каждая конечная игра имеет по крайней мере одно оптимальное решение , возможно, среди смешанных стратегий . Пусть S* A = (p* 1 , p* 2 , ..., p* i , ..., p* m ) и S* B = (q* 1 , q* 2 , ..., q* i , ..., q* n ) — пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v , если второй игрок не выходит за пределы своих активных стратегий .

Эта теорема имеет большое практическое значение — она дает конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки.

Рассмотрим игру размера 2×2 , которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение — это пара чистых стратегий, соответствующих этой точке.

Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий S* A = (p* 1, p* 2 ) и S* B = (q* 1 , q* 2 ).

Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии S'A , то его средний выигрыш будет равен цене игры v , какой бы активной стратегией ни пользовался игрок В . Для игры 2×2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В ) — случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрока А (оптимальная стратегия) будет равен v и для 1 -й, и для 2 -й стратегии противника.

Пусть игра задана платежной матрицей

Средний выигрыш игрока А , если он использует оптимальную смешанную стратегию

,

а игрок В — чистую стратегию B1 (это соответствует 1 -му столбцу платежной матрицы Р ), равен цене игры v : a11 p* 1 + a21 p* 2 = v . Тот же средний выигрыш получает игрок А , если 2 -й игрок применяет стратегию B2 , т.е. a12 p* 1 + a22 p* 2 = v . Учитывая, что p* 1 + p* 2 = 1 , получаем систему уравнений для определения оптимальной стратегии S'A и цены игры v :

Решая эту систему, получим оптимальную стратегию

и цену игры

Применяя теорему об активных стратегиях при отыскании S* B - оптимальной стратегии игрока В , получаем, что при любой чистой стратегии игрока А (А1 или А2 ) средний проигрыш игрока В равен цене игры v , т.е.

Тогда оптимальная стратегия определяется формулами:

Пример 1.

Игра «поиск»

Игрок А может спрятаться в одном из двух убежищ (I и II ); игрок В ищет игрока А , и если найдет, то получает штраф 1 ден. ед. от А , в противном случае платит игроку А 1 ден. ед. Необходимо построить платежную матрицу игры.

Решение . Для составления платежной матрицы следует проанализировать поведение каждого из игроков. Игрок А может спрятаться в убежище I – обозначим эту стратегию через A1 или в убежище II — стратегия A2 .

Игрок В может искать первого игрока в убежище I — стратегия B1 , либо в убежище II — стратегия B2 . Если игрок А находится в убежище I и там его обнаруживает игрок В , т.е. осуществляется пара стратегий (A1 , B1 ), то игрок А платит штраф, т.е. a11 = - 1 . Аналогично получаем a22 = - 1 (A2 , B2 ) . Очевидно, что стратегии (A1 , B2 ) и (A2 , B1 ) дают игроку А выигрыш 1 , поэтому a12 = a21 = 1. Таким образом, для игры "поиск" размера 2×2 получаем платежную матрицу

Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной в примере 1.

Пример 2.

Найти оптимальные стратегии игры, приведенной в примере 1.

Решение . Игра "поиск" задана платежной матрицей без седловой точки:

Поэтому ищем решение в смешанных стратегиях; для игрока А средний выигрыш равен цене игры v (при B1 и B2 ) ; для игрока В средний проигрыш равен цене игры v (при A1 и B2 ). Системы уравнений в данном случае имеют вид:

Решая эти системы, получаем

Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2 , при этом средний выигрыш равен 0 .

РЕФЕРАТ ПО ДИСЦИПЛИНЕ «МАТЕМАТИКА»

НА ТЕМУ: «Решение игры в смешанных стратегиях».

Оценить/Добавить комментарий
Имя
Оценка
Комментарии:
Хватит париться. На сайте FAST-REFERAT.RU вам сделают любой реферат, курсовую или дипломную. Сам пользуюсь, и вам советую!
Никита00:23:34 05 ноября 2021
.
.00:23:32 05 ноября 2021
.
.00:23:31 05 ноября 2021
.
.00:23:29 05 ноября 2021
.
.00:23:27 05 ноября 2021

Смотреть все комментарии (19)
Работы, похожие на Реферат: Решение игры в смешанных стратегиях

Назад
Меню
Главная
Рефераты
Благодарности
Опрос
Станете ли вы заказывать работу за деньги, если не найдете ее в Интернете?

Да, в любом случае.
Да, но только в случае крайней необходимости.
Возможно, в зависимости от цены.
Нет, напишу его сам.
Нет, забью.



Результаты(287430)
Комментарии (4159)
Copyright © 2005-2021 HEKIMA.RU [email protected] реклама на сайте