Федеральное государственное бюджетное образовательное учреждение высшего
образования «Санкт-Петербургский государственный университет телекоммуникаций имени
профессора М. А. Бонч-Бруевича»
Выполнил: Цибульский Н. В.
Академическая группа: ИСТ-013
Преподаватель: Литвинов В. Л.
Санкт-Петербург,
2020
Теория игр относится к числу тех немногих наук, момент «оформления» которых в отдельную дисциплину известен достаточно точно. В 1944 г. вышла монография Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (см. русский перевод), в которой были изложены известные на то время результаты. Монография положила начало бурному развитию этой науки, не прекращающемуся и по сей день.
С теоретико-игровой точки зрения задача управления состоит в том, чтобы создать для управляемых субъектов (агентов) игру с такими правилами, чтобы исход игры был как можно более благоприятным для управляющего органа (центра). Центр является как бы метаигроком, он делает первый ход, формируя правила игры для агентов. После этого агенты выбирают свою стратегию поведения тем или иным образом, с учетом выбора центра.
Предметом настоящей работы является вполне определенное управляющее воздействие – информационное, т. е. целенаправленное влияние на информированность агентов. Модель включает в себя агента (агентов) и управляющий орган – центр. Каждый агент характеризуется циклом «информированность агента ® действие агента ® наблюдаемый агентом результат ® информированность агента», и у разных агентов эти три компоненты цикла являются, вообще говоря, различными. Можно считать этот цикл общим для всей управляемой подсистемы, т. е. для всего набора агентов.
Если задана структура I информированности игры,
то тем самым задана и структура информированности
каждого из агентов (как реальных, так и фантомных).
Выбор t-агентом своег о действия xt в рамках гипотезы
рационального поведения определяется его структурой
информированности It, поэтому, имея перед собой эту
структуру, можно смоделировать его рассуждения и определить
это его действие. Выбирая свое действие, агент моделирует
действия других агентов (осуществляет рефлексию).
Поэтому при определении исхода игры необходимо учитывать
действия как реальных, так и фантомных агентов.
Управлением, в соответствии с определением, приведенным в называется воздействие на управляемую систему с целью обеспечения требуемого ее поведения. Управляемая система – множество рациональных агентов, принимающих самостоятельные решения о выбираемых действиях – в рамках теоретико-игровой модели (см. раздел 1.3) описывается множеством агентов N, совокупностью их целевых функций (fi(Ч))i О N, допустимых множеств (Xi)i О N и информированностью I.
Игра поиска в условиях общего знания. Поиск активно уклоняющегося
объекта является типичным примером конфликтного взаимодействия,
который может быть исследован методами теории игр. Простейшие игровые
задачи поиска были исследованы в конце 60-х годов XX в. Общей теории
игр поиска на данный момент не существует.
Рассмотрим ситуацию, в которой участвуют агент, являющийся производителем некоторого вида продукции, и центр, являющийся посредником. Они взаимодействуют следующим образом:
Рассмотрим ситуацию, в которой участвуют агент, являющийся производителем некоторого вида продукции, и центр, являющийся посредником. Они взаимодействуют следующим образом:
Суть принципа дефицита состоит в следующем: «ценность чего-либо позитивного в наших глазах существенно увеличивается, если оно становится недоступным». В частности, это относится к дефицитной информации, причем «эксклюзивная информация является более убедительной. В качестве одного из подтверждений этого тезиса приводится следующий эксперимент, проведенный изучавшим психологию бизнесменом, владельцем компании, импортирующей в США говядину.
Предположим, что агентам объективно не известны эффективности (параметры функций затрат) друг друга.
Однако для каждого i О N i-й агент знает свой тип ri, имеет представления о типах оппонентов rij,
j О N, и считает известный ему набор типов общим знанием. Иными словами, информационная структура
игры задается соотношениями: risj = rij, i, j О N, s О S.
Рассмотрим организационную систему, состоящую из центра и n агентов, осуществляющих совместную деятельность.
Стратегией i-го агента является выбор действия yi О Xi = В1 , i О N, стратегией центра – выбор
системы стимулирования, определяющей размер вознаграждения каждого агента в зависимости от результата их совместной деятельности.
Настоящая модель наиболее тесно связана с рассмотренными, например, в нерефлексивными теоретико-игровыми моделями определения параметров договора на основании анализа оптимального действия исполнителя, т.е. действия, максимизирующего разность между доходом заказчика и затратами исполнителя. В настоящей модели присутствует единственный неопределенный параметр – эффективность деятельности исполнителя q О W, значение которого достоверно известно исполнителю, но неизвестно заказчику.
Рассмотрим следующую теоретико-игровую модель коррупции. Пусть имеются n агентов – чиновников, дополнительный доход каждого из которых
пропорционален сумме полученных им взяток xi ³ 0, предложение которых будем считать неограниченным, i О N= {1, …, n}. Пусть каждый из
n агентов характеризуется своим типом ri > 0, i О N, и тип агента достоверно ему известен, но не известен остальным агентам.
Содержательно тип агента может интерпретироваться как субъективное восприятие им «силы» штрафов.
Рассмотрим ситуацию, когда агенты из бесконечно большой «популяции» осуществляют выбор между двумя альтернативами, которые будем для
общности называть позитивным и негативным полюсами. Это может быть кандидат на выборах (голосовать «за» или «против»), продукт или
услуга (покупать или нет), этический выбор (поступить «хорошо» или «плохо») и пр.
В силу бесконечности числа агентов будем считать, что при решении задачи управления всей «популяцией» выбор каждого конкретного
агента не играет роли, а важна доля агентов, выбирающих позитивный полюс. Иначе это можно сформулировать следующим образом:
действием «агрегированного» агента является вероятность x выбора им позитивного полюса.
Рассмотрим пример рефлексивного управления агентами со стороны центра в модели активной экспертизы. Сначала приведем описание модели и известные результаты исследования механизмов экспертизы – получения и обработки информации от экспертов – специалистов в предметных областях. Пусть имеются n экспертов (далее – агентов), оценивающих какой-либо объект по скалярной шкале (объектом может быть кандидат на пост руководителя, вариант финансирования, эффективность проекта и т.д.). Каждый агент сообщает оценку si О [d; D], i О N, где d – минимальная, а D – максимальная оценка.
В рассмотренных выше моделях исследовалась стабильность информационного равновесия, которое является обобщением равновесия Нэша. В ряде моделей оказывается, что существует более сильное равновесие – равновесие в доминантных стратегиях (РДС), определяемое как вектор абсолютно оптимальных (то есть не зависящих от обстановки и вектора типов остальных агентов) действий агентов.
В рассмотренных выше моделях исследовалась стабильность информационного равновесия, которое является обобщением равновесия Нэша.
В ряде моделей оказывается, что существует более сильное равновесие – равновесие в доминантных стратегиях (РДС), определяемое как
вектор абсолютно оптимальных (то есть не зависящих от обстановки и вектора типов остальных агентов) действий агентов.