Федеральное государственное бюджетное образовательное учреждение высшего
образования «Санкт-Петербургский государственный университет телекоммуникаций имени
профессора М. А. Бонч-Бруевича»

Теоретико-игровые модели
в информационных системах

Выполнил: Цибульский Н. В.
Академическая группа: ИСТ-013
Преподаватель: Литвинов В. Л.

Санкт-Петербург,
2020

История появления

Теория игр относится к числу тех немногих наук, момент «оформления» которых в отдельную дисциплину известен достаточно точно. В 1944 г. вышла монография Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (см. русский перевод), в которой были изложены известные на то время результаты. Монография положила начало бурному развитию этой науки, не прекращающемуся и по сей день.

Цель

С теоретико-игровой точки зрения задача управления состоит в том, чтобы создать для управляемых субъектов (агентов) игру с такими правилами, чтобы исход игры был как можно более благоприятным для управляющего органа (центра). Центр является как бы метаигроком, он делает первый ход, формируя правила игры для агентов. После этого агенты выбирают свою стратегию поведения тем или иным образом, с учетом выбора центра.

Общая постановка задачи информационного управления

Предметом настоящей работы является вполне определенное управляющее воздействие – информационное, т. е. целенаправленное влияние на информированность агентов. Модель включает в себя агента (агентов) и управляющий орган – центр. Каждый агент характеризуется циклом «информированность агента ® действие агента ® наблюдаемый агентом результат ® информированность агента», и у разных агентов эти три компоненты цикла являются, вообще говоря, различными. Можно считать этот цикл общим для всей управляемой подсистемы, т. е. для всего набора агентов.

Информационное равновесие

весы Если задана структура I информированности игры, то тем самым задана и структура информированности каждого из агентов (как реальных, так и фантомных). Выбор t-агентом своег о действия xt в рамках гипотезы рационального поведения определяется его структурой информированности It, поэтому, имея перед собой эту структуру, можно смоделировать его рассуждения и определить это его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определении исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.

Информационное управление

Управлением, в соответствии с определением, приведенным в называется воздействие на управляемую систему с целью обеспечения требуемого ее поведения. Управляемая система – множество рациональных агентов, принимающих самостоятельные решения о выбираемых действиях – в рамках теоретико-игровой модели (см. раздел 1.3) описывается множеством агентов N, совокупностью их целевых функций (fi(Ч))i О N, допустимых множеств (Xi)i О N и информированностью I.

Игры поиска

Игра поиска в условиях общего знания. Поиск активно уклоняющегося объекта является типичным примером конфликтного взаимодействия, который может быть исследован методами теории игр. Простейшие игровые задачи поиска были исследованы в конце 60-х годов XX в. Общей теории игр поиска на данный момент не существует.

Производитель и посредник

Рассмотрим ситуацию, в которой участвуют агент, являющийся производителем некоторого вида продукции, и центр, являющийся посредником. Они взаимодействуют следующим образом:

  1. Оговариваются доли l и (1 – l), в соответствии с которыми доход делится между производителем и посредником соответственно, l О (0; 1);
  2. Посредник сообщает производителю оценку q рыночной цены q;
  3. Производитель производит некоторый объем продукта y ³ 0 и передает его посреднику;
  4. Посредник реализует его по рыночной цене и передает производителю оговоренную долю дохода l q y, а себе забирает (1 – l) q y.

Рассмотрим ситуацию, в которой участвуют агент, являющийся производителем некоторого вида продукции, и центр, являющийся посредником. Они взаимодействуют следующим образом:

  1. Проговариваются доли l и (1 – l), в соответствии с которыми доход делится между производителем и посредником соответственно, l О (0; 1);
  2. Посредник сообщает производителю оценку q рыночной цены q;
  3. Производитель производит некоторый объем продукта y ³ 0 и передает его посреднику;
  4. Посредник реализует его по рыночной цене и передает производителю оговоренную долю дохода l q y, а себе забирает (1 – l) q y. Предполагается, что посредник в точности знает рыночную цену, а производитель, напротив, не обладает никакой априорной информацией о ней.

Принцип дефецита

Суть принципа дефицита состоит в следующем: «ценность чего-либо позитивного в наших глазах существенно увеличивается, если оно становится недоступным». В частности, это относится к дефицитной информации, причем «эксклюзивная информация является более убедительной. В качестве одного из подтверждений этого тезиса приводится следующий эксперимент, проведенный изучавшим психологию бизнесменом, владельцем компании, импортирующей в США говядину.

Конкуренция на рынке

Предположим, что агентам объективно не известны эффективности (параметры функций затрат) друг друга. Однако для каждого i О N i-й агент знает свой тип ri, имеет представления о типах оппонентов rij, j О N, и считает известный ему набор типов общим знанием. Иными словами, информационная структура игры задается соотношениями: risj = rij, i, j О N, s О S.

Аккордная оплата труда

Рассмотрим организационную систему, состоящую из центра и n агентов, осуществляющих совместную деятельность. Стратегией i-го агента является выбор действия yi О Xi = В1 , i О N, стратегией центра – выбор системы стимулирования, определяющей размер вознаграждения каждого агента в зависимости от результата их совместной деятельности.

Заказчик и исполнитель

Настоящая модель наиболее тесно связана с рассмотренными, например, в нерефлексивными теоретико-игровыми моделями определения параметров договора на основании анализа оптимального действия исполнителя, т.е. действия, максимизирующего разность между доходом заказчика и затратами исполнителя. В настоящей модели присутствует единственный неопределенный параметр – эффективность деятельности исполнителя q О W, значение которого достоверно известно исполнителю, но неизвестно заказчику.

Коррупция

Рассмотрим следующую теоретико-игровую модель коррупции. Пусть имеются n агентов – чиновников, дополнительный доход каждого из которых пропорционален сумме полученных им взяток xi ³ 0, предложение которых будем считать неограниченным, i О N= {1, …, n}. Пусть каждый из n агентов характеризуется своим типом ri > 0, i О N, и тип агента достоверно ему известен, но не известен остальным агентам. Содержательно тип агента может интерпретироваться как субъективное восприятие им «силы» штрафов.

Биполярный выбор

Рассмотрим ситуацию, когда агенты из бесконечно большой «популяции» осуществляют выбор между двумя альтернативами, которые будем для общности называть позитивным и негативным полюсами. Это может быть кандидат на выборах (голосовать «за» или «против»), продукт или услуга (покупать или нет), этический выбор (поступить «хорошо» или «плохо») и пр.

В силу бесконечности числа агентов будем считать, что при решении задачи управления всей «популяцией» выбор каждого конкретного агента не играет роли, а важна доля агентов, выбирающих позитивный полюс. Иначе это можно сформулировать следующим образом: действием «агрегированного» агента является вероятность x выбора им позитивного полюса.

Активная экспертиза

Рассмотрим пример рефлексивного управления агентами со стороны центра в модели активной экспертизы. Сначала приведем описание модели и известные результаты исследования механизмов экспертизы – получения и обработки информации от экспертов – специалистов в предметных областях. Пусть имеются n экспертов (далее – агентов), оценивающих какой-либо объект по скалярной шкале (объектом может быть кандидат на пост руководителя, вариант финансирования, эффективность проекта и т.д.). Каждый агент сообщает оценку si О [d; D], i О N, где d – минимальная, а D – максимальная оценка.

Рacпределение ресурса

В рассмотренных выше моделях исследовалась стабильность информационного равновесия, которое является обобщением равновесия Нэша. В ряде моделей оказывается, что существует более сильное равновесие – равновесие в доминантных стратегиях (РДС), определяемое как вектор абсолютно оптимальных (то есть не зависящих от обстановки и вектора типов остальных агентов) действий агентов.

Страхование

В рассмотренных выше моделях исследовалась стабильность информационного равновесия, которое является обобщением равновесия Нэша. В ряде моделей оказывается, что существует более сильное равновесие – равновесие в доминантных стратегиях (РДС), определяемое как вектор абсолютно оптимальных (то есть не зависящих от обстановки и вектора типов остальных агентов) действий агентов.

Список использованных источников

  1. http://window.edu.ru/catalog/pdf2txt/763/47763/23721?p – Теоретико-игровые модели информационного управления. Дата обращения 25.11.2020
  2. http://www.mtas.ru/upload/iblock/41a/ChhartishviliAG-dfmn.pdf - Теоретико-игровые модели информационного управления в активных системах. Дата обращения 25.11.2020
  3. https://core.ac.uk/download/pdf/197419389.pdf - Теоретико-игровые модели информационного управления в активных системах. Дата обращения 25.11.2020
  4. http://tekhnosfera.com/teoretiko-igrovye-modeli-i-algoritmy-informatsionnyh-protsessov-vzaimodeystviya-nalogoplatelschikov-i-nalogovyh-organov - теоретико-игровые модели и алгоритмы информационных процессов взаимодействия налогоплательщиков и налоговых органов 26.11.2020