Свойство синтезирования критерия Вальда–Сэвиджа и его экономическое приложение
Свойство синтезирования критерия Вальда–Сэвиджа и его экономическое приложение
Аннотация
Код статьи
S042473880006775-1-1
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Лабскер Лев Григорьевич 
Должность: профессор кафедры
Аффилиация: Финансовый университет при Правительстве РФ
Адрес: Москва, РФ
Страницы
89-103
Аннотация

оптимальность стратегий с синтетической (совместной) точки зрения выигрышей и рисков. Дается определение синтезированной стратегии, т.е. стратегии, оптимальной по критерию Вальда–Сэвиджа и не оптимальной ни по критерию Вальда, ни по критерию Сэвиджа. Вводится в рассмотрение свойство синтезирования, заключающееся в существовании синтезированной стратегии. Научная новизна работы состоит в решении сформулированной проблемы синтезирования, состоящем в нахождении необходимых и достаточных условий отсутствия у критерия Вальда–Сэвиджа свойства синтезирования. Достаточные условия имеют и практическое значение при анализе задач по принятию оптимальных экономических решений, поскольку выполнение этих условий означает, что применять критерий Вальда–Сэвиджа для отыскания синтезированных стратегий не имеет смысла. Проверка достаточных условий не требует обращения к собственно критерию Вальда–Сэвиджа, а основывается лишь на составляющих критериях. Однако применение критерия Вальда–Сэвиджа в случае отсутствия у него свойства синтезирования не является абсолютно бесполезным, поскольку выявляет зависимость применения критериев Вальда и Сэвиджа от определяемого выигрыш-показателя. Применение полученных результатов иллюстрируется на решении задачи экономического содержания об оптимальном выборе технологического способа производства продукции.

Ключевые слова
игра с природой, критерий Вальда, критерий Сэвиджа, выигрыш-показатель, критерий Вальда–Сэвиджа, синтезированная стратегия, проблема синтезирования критерием Вальда–Сэвиджа, решение проблемы синтезирования, двухкритериальная задача оптимизации, технологические способы производства продукции, потребность в продукции, оптимальный выбор способа производства.
Классификатор
Получено
21.10.2019
Дата публикации
16.12.2019
Всего подписок
87
Всего просмотров
1836
Оценка читателей
0.0 (0 голосов)
Цитировать   Скачать pdf
1

Введение

2 Во многих задачах финансово-экономического содержания принятие решений зависит не только от лица, принимающего решение (ЛПР), но и от объективной действительности, о которой у ЛПР в момент принятия решения недостаточно информации. Часто подходящей математической моделью для анализа таких задач служит «Игра с природой» (или, в другой терминологии, «Статистическая игра»), в которой участвуют два игрока: рациональный игрок A — ЛПР и П — природа, представляющая собой объективную действительность, определяющую при каждом решении игрока A появление конкретного исхода (результата). Природа не является ни противником, ни союзником игрока A. Она в любой момент случайным образом принимает то или иное свое состояние, не преследуя никакой конкретной цели, и абсолютно безразлична к результатам игры.
3 Таким образом, ЛПР принимает решение в условиях неопределенности, которая все же не будет абсолютной, поскольку ЛПР известны все возможные состояния природы, но при этом неизвестны вероятности, с которыми природа может находиться в этих состояниях, и отсутствует всякая статистическая возможность их определения.
4 Для принятия решения, которое, как известно, является одной из главных составляющих любого управления, игрок A, будучи рациональным, стремится из возможных альтернативных стратегий выбрать стратегию, максимально отвечающую поставленным целям решения задачи. Для сравнения стратегий по их эффективности ЛПР необходимо подобрать подходящий принцип оптимальности.
5 Проблема выбора принципа оптимальности стратегий в играх с природой (Лабскер, 2014, с. 12–59) — одна из центральных в теории принятия решений. Существуют разнообразные критерии оптимальности с различными свойствами. Некоторые из них, выигрыш-критерии, определяют оптимальность выбираемых стратегий с точки зрения выигрышей, абстрагируясь от рисков, например критерий Вальда (Wald, 1950; Лабскер, 2014, с. 273–308), максимаксный критерий (Лабскер, 2014, с. 349–362) и др. Риск-критерии характеризуют оптимальность стратегий с позиций рисков, абстрагируясь от выигрышей. Например, критерий Сэвиджа (Savage, 1951; Лабскер, 2014, с. 308–349), миниминный критерий (Лабскер, 2014, с. 362–376) и др. Широко используются комбинированные критерии, составленные из двух выигрыш-критериев или двух риск-критериев. В каждой такой паре один из критериев является крайне пессимистическим, а другой — крайне оптимистическим, например, классический выигрыш-критерий Гурвица (Hurwicz, 1951; Arrow, Hurwicz, 1972; Лабскер, 2014, с. 479–558) и риск-критерий Гурвица (Лабскер, 2014, с. 534–558).
6 Заслуживает внимания подход выбора стратегии, оптимальной с синтетической (совместной) точки зрения выигрышей и игровых рисков. Такие критерии будем называть синтетическими. В (Лабскер, 2014, с. 652–655) предложен общий подход к конструированию синтетических критериев и приведены формулы показателей эффективности стратегий по различным синтетическим критериям. В работах (Лабскер, Ященко, Амелина, 2011, 2012) был введен в рассмотрение конкретный синтетический критерий Вальда–Сэвиджа, проведен его детальный математический анализ и дано приложение к решению задачи об установлении приоритетного порядка кредитования потенциальных корпоративных заемщиков банка. Для описания критерия Вальда–Сэвиджа кратко напомним необходимые определения.
7

Критерий Вальда–Сэвиджа

8 Пусть в игре с природой игрок A обладает множеством альтернативных стратегий S={A1,...,Am} , m2 ; П1,  ...,  Пn — состояния природы, n2 . Пусть действительные числа aij , iI={1,...,m} , jJ={1,...,n} — это выигрыши игрока A в игровой ситуации (Ai,Пj) , когда игрок A выбирает стратегию Ai, а природа находится в состоянии Пj. Величину βj=max{aij:iI} , jJ , назовем показателем благоприятности состояния Пj. Выбор игроком A стратегии Ai, когда природа находится в состоянии Пj, сопровождается риском rij=βj-aij,iI,jJ , неполучения игроком A наибольшего при состоянии природы Пj выигрыша βj (Лабскер, 2014, с. 18–25). Таким образом, риск rij количественно характеризует упущенную игроком A возможность (при выборе им стратегии Ai) получения максимального выигрыша βj при нахождении природы в состоянии Пj и может интерпретироваться как своеобразная плата за отсутствие у игрока A информации о состоянии природы при выборе им стратегии Ai.
9 Критерий Вальда (W-критерий) определяется следующими компонентами (Wald, 1950; Лабскер, 2014, с. 273–308): Wi=min{aij:jJ} — показатель эффективности стратегии Ai, iI ; WS=max{Wi:iI} — цена игры (W-цена); стратегия Ak называется оптимальной (W-оптимальной), если Wk=WS ; SO(W) — множество W-оптимальных стратегий.
10 Критерий Сэвиджа (Sav-критерий) описывается следующими составляющими (Savage, 1951; Лабскер, 2014, с. 308–349): Savi=max{rij:jJ} — показатель неэффективности стратегии Ai, iI ; SavS=min{Savi:    iI} — цена игры (Sav-цена); стратегия Ak называется оптимальной (Sav-оптимальной), если Savk=SavS ; SO(Sav)  — множество Sav-оптимальных стратегий.
11 Далее нам понадобится критерий (-Sav) , противоположный критерию Сэвиджа, который определяется следующим образом: (-Sav)i=-Savi — показатель эффективности стратегии Ai, iI ; (-Sav)S=-SavS — цена игры (–Sav-цена); стратегия Ak называется оптимальной (–Sav-оптимальной), если (-Sav)k=(-Sav)S ; SO((-Sav)) — множество –Sav-оптимальных стратегий.
12 Два критерия будем называть эквивалентными, если множества оптимальных стратегий по этим критериям совпадают. Нетрудно показать, что критерий Сэвиджа и противоположный ему критерий эквивалентны.
13 В определении критерия Вальда–Сэвиджа важную роль играют выигрыш-показатель α[0,1] и риск-показатель (1-α)[0,1] , количественно выражающие степень предпочтения, отдаваемого игроком A соответственно выигрышам и рискам. Выбор игроком A значения выигрыш-показателя α является субъективным и связан с его психологическими особенностями, определяющими его отношение к выигрышам и рискам.
14 При α=0 и, следовательно, 1-α=1 игрок A при выборе стратегии абстрагируется от выигрышей, сконцентрировав свое внимание только на рисках. И, наоборот, при α=1 и, следовательно, 1-α=0 игрок A во главу угла ставит выигрыши, абстрагируясь от рисков.
15 Критерий Вальда–Сэвиджа с выигрыш-показателем α[0,1] (далее — (WSav)(α)-критерий) определяется следующим образом:
16 (WSav)i(α)=αWi-(1-α)Savi=(Wi+Savi)α-Savi — (WSav)(α)-показатель эффективности стратегии Ai, iI ; (WSav)S=max{(WSav)i(α):iI} — (WSav)(α)-цена игры; стратегию Ak назовем (WSav)(α)-оптимальной, если (WSav)i(α)=(WSav)S(α) ; SO((WSav)(α)) — множество (WSav)(α)-оптимальных стратегий.
17 Очевидно, что при α=0 критерий Вальда–Сэвиджа превращается в критерий, противоположный критерию Сэвиджа, и, следовательно, эквивалентен критерию Сэвиджа. При α=1 критерий Вальда–Сэвиджа превращается в критерий Вальда.
18 Из определения показателя (WSav)i(α) видно, что он является линейной функцией аргумента α[0,1] с угловым коэффициентом (Wi+Savi) . Следовательно, графиком показателя (WSav)i(α) является отрезок (-Savi)Wi (обозначаемый двумя его концами) с левым концом (-Savi)=(WSav)i(0) и правым концом Wi=(WSav)i(1) . Тогда графиком цены игры (WSav)S(α) является верхняя огибающая m отрезков (-Savi)Wi , iI , представляющая собой ломаную, состоящую из не более m звеньев, число которых обозначим через lI . Очевидно, что 1lm .
19

Проблема синтезирования критерием Вальда–Сэвиджа

20 Определение 1. Стратегию, оптимальную по критерию Вальда–Сэвиджа при выигрыш-показателе α(0,    1) , будем называть синтезированной при данном значении выигрыш-показателя α, если она не является оптимальной ни по критерию Вальда, ни по критерию Сэвиджа.
21 Определение 2. Будем говорить, что в данной игре с природой критерий Вальда–Сэвиджа при фиксированном значении выигрыш-показателя α(0,1) обладает свойством синтезирования, если при данном значении выигрыш-показателя α существует синтезированная стратегия, т.е. SO((WSav)(α))[SO(W)SO(Sav)] .
22 Определение 3. Если в данной игре с природой ни при каком значении выигрыш-показателя α[0,1] не существует синтезированной стратегии, т.е. при любом значении α[0,1] каждая стратегия, оптимальная по критерию Вальда–Сэвиджа, оптимальна по критерию Вальда или по критерию Сэвиджа:
23 SO((WSav)(α))[SO(W)SO(Sav)] , α[0,1] , —(1)
24 будем говорить, что в данной игре критерий Вальда–Сэвиджа не обладает свойством синтезирования.
25 Нетрудно убедиться в том, что в общем случае включение (1) необратимо.
26 Так как при α=0 и α=1 критерий Вальда–Сэвиджа соответственно эквивалентен критерию Сэвиджа и совпадает с критерием Вальда, то при этих значениях α критерий Вальда–Сэвиджа свойством синтезирования не обладает. Именно поэтому в определениях 1 и 2 указанные значения α исключены из рассмотрения.
27 В следующем предложении сформулировано еще одно условие отсутствия у критерия Вальда–Сэвиджа свойства синтезирования.
28 Предложение 1. В игре с природой, в которой число m стратегий игрока A равно 2, критерий Вальда–Сэвиджа свойством синтезирования не обладает.
29 Доказательство. В рассматриваемой игре у игрока A имеется две стратегии A1 и A2 . Отрезки (-Sav1)W1 и (-Sav2)W2 , представляющие графики показателей эффективности (WSav)1(α) и (WSav)2(α) этих стратегий либо совпадают, либо не пересекаются, либо пересекаются.
30 В первых двух случаях графиком цены игры (WSav)S(α) является отрезок. Тогда (Лабскер, Ященко, Амелина, 2011, теорема 11) выполняется условие
31 SO(W)SO(Sav) Ø. (2)
32 Из условия (2) (Лабскер и др., 2011, теорема 10) следует равенство SO((WSav)(α))=SO(W)SO(Sav) , α(0,1) , из которого вытекает включение (1).
33 Если же отрезки (-Sav1)W1 и (-Sav2)W2 пересекаются, очевидно, что выполняется и включение (1).
34 Таким образом, во всех трех возможных случаях имеет место включение (1), означающее по определению 3, что (WSav)(α)-критерий свойством синтезирования не обладает. ▄
35 Таким образом, при α=0, или α=1 , или m=2 никакого синтезирования быть не может. Значит, ожидать синтезированное решение в результате применения критерия Вальда–Сэвиджа можно только при выигрыш-показателях α(0,1) и при числе стратегий m3 , что мы и будем предполагать в дальнейшем.
36 Из определения критерия Вальда–Сэвиджа следует, что основное его предназначение состоит в синтезировании крайне высоких предпочтений, отдаваемых ЛПР выигрышам ( α=1 , используется критерий Вальда) и рискам ( α=0 , используется критерий Сэвиджа).
37 Применяя критерий Вальда–Сэвиджа при определенном значении выигрыш-показателя α(0,1) , ЛПР надеется получить собственно взвешенное оптимальное решение по этому критерию, а не оптимальные решения, которые в то же время будут оптимальными по исходным критериям Вальда или Сэвиджа, так как в последнем случае применение критерия Вальда–Сэвиджа при выбранном значении выигрыш-показателя не дает желаемых результатов. Столкнувшись с этим, ЛПР задается естественным вопросом, а, может быть, при каких-то других значениях выигрыш-показателя существует собственно взвешенное оптимальное решение. Но проверить это для каждого значения выигрыш-показателя α(0,1) прямым вычислением показателей эффективности стратегий по критерию Вальда–Сэвиджа для последующего их сравнения, к сожалению, принципиально не представляется возможным, поскольку этих значений бесконечно много. В связи с этим возникает вопрос, в любой ли игре (при условиях α(0,1) и m3 ) критерий Вальда–Сэвиджа обладает свойством синтезирования. Этот вопрос порождает проблему синтезирования критерием Вальда–Сэвиджа.
38 В настоящей статье дано решение этой проблемы, а именно найдены необходимые и достаточные условия на игру с природой, при которых критерий Вальда–Сэвиджа в этой игре свойством синтезирования не обладает и, следовательно, применять его для отыскания синтезированных стратегий не имеет смысла. При этом важно отметить, что эти условия не связаны с вычислением и последующим сравнением между собой показателей эффективности стратегий по критерию Вальда–Сэвиджа, а основываются только на исходных критериях Вальда и Сэвиджа. Тем не менее любое решение, полученное в результате применения критерия Вальда–Сэвиджа, синтезированное или нет, выявляет распределение стратегий, оптимальных по критерию Вальда или по критерию Сэвиджа, по значениям выигрыш-показателя α[0,1] . Приложение полученных результатов иллюстрируется на решении задачи экономического содержания.
39 Рассматриваемая проблема с математической точки зрения, абстрагированной от теории игр с природой, является задачей о нахождении в двухкритериальной задаче оптимизации необходимых и достаточных условий существования решений, оптимальных по взвешенному критерию и не оптимальных ни по одному из двух исходных критериев.
40

Математическое решение проблемы

41 Приведем необходимые обозначения и определения для постановки и решения задачи в рамках двухкритериальной задачи оптимизации.
42 I={1,...,m},    m3, J={1,...,n},    n3; S — множество m векторов Ai=(ai1,...,ain),    iI, в пространстве Rn ; K1 — первый исходный критерий ( K1 -критерий); Ki1=min{aij:jJ} — целевая функция K1 -критерия, определенная на множестве S ( K1 -показатель вектора Ai ); KS1=max{Ki1:iI}=max{min{aij:jJ}:iI} — максимин; SO(K1)={Ai:Ki1=KS1}; — множество векторов, оптимальных по K1 -критерию ( K1 -оптимальных) во множестве S, т.е. векторов Ai , удовлетворяющих условию Ki1=KS1; K2 — второй исходный критерий ( K2 -критерий); Ki2=max{rij:jJ} , где rij=βj-aij , βj=max{aij:iI} , — целевая функция K2 -критерия, определенная на множестве S ( K2 —показатель вектора Ai ); KS2=min{Ki2:iI}=min{max{rij:jJ}:iI} — минимакс; SO(K2)={Ai:Ki2=KS2} — множество векторов, оптимальных по K2 -критерию ( K2 -оптимальных) во множестве S, т.е. векторов Ai , удовлетворяющих условию Ki2=KS2 ; K(α)  — синтетический критерий ( K(α) -критерий), где α[0,1] — коэффициент критерия K(α) ; Ki(α)=αKi1-(1-α)Ki2=(Ki1+Ki2)α-Ki2,    iI, — целевая функция K(α) -критерия, определенная на множестве S ( K(α) — показатель вектора Ai ); KS(α)=max{Ki(α):iI} — максимальное значение целевой функции Ki(α) на множестве S при фиксированном α[0,1] ; SO(K(α))={Ai:Ki(α)=KS(α)} — множество векторов, оптимальных по K(α) -критерию ( K(α) -оптимальных) во множестве S, т.е. векторов Ai , удовлетворяющих условию Ki(α)=KS(α) ; (SO(K1))O(K2) — множество векторов, K2 -оптимальных во множестве K1 -оптимальных; KSO(K1)2=min{Ki2:AiSO(K1)} ; (SO(K2))O(K1) — множество векторов, K1 -оптимальных во множестве K2 -оптимальных; KSO(K2)1=max{Ki1:AiSO(K2)} .
43 Нетрудно убедиться, что (SO(K1))O(K2), (SO(K2))O(K1), (SO(K1))O(K2)SO(K1), (SO(K2))O(K1)SO(K2).
44 Графиками показателей Ki(α),iI, как линейных функций аргумента α[0,    1] , являются отрезки (-Ki2)Ki1,iI, с левым концом Ki(0)=(-Ki2) и правым концом Ki(1)=Ki1 . Тогда графиком функции KS(α) является ломаная с l звеньями, представляющая верхнюю огибающую указанных отрезков.
45 Графики показателей Kσ(α) всех векторов Aσ(SO(K2))O(K1) совпадают и представляют отрезок (-KS2)KSO(K2)1, а графики показателей Kω(α) всех векторов Aω(SO(K1))O(K2) совпадают и представляют отрезок (-KSO(K1)2)KS1 (рис. 1).
46 Рис. 1. Графики показателей векторов в случае, когда ломаная, представляющая график KS(α) , состоит из трех звеньев (l=3)
47 Вектор, оптимальный по K(α) -критерию при некотором α[0,1] , назовем синтезированным, если он не является оптимальным ни по одному из критериев K1 и K2 . Математическая задача состоит в нахождении необходимых и достаточных условий отсутствия синтезированных векторов при любом α[0,1] , т.е. в справедливости включения
48 SO(K(α))[SO(K1)SO(K2)],α[0,1]. (3)
49 Очевидно, что при α=0 или α=1 выполняется (3). При m=2 включение (3) также имеет место. Чтобы в этом убедиться, достаточно воспроизвести доказательство предложения 1 в терминах математической задачи.
50 Далее будем предполагать, что α(0,1) , m3 ,
51 SO(K1)SO(K2)= ,(4)
52 S[SO(K1)SO(K2)]. (5)
53 Через τ(K) обозначим условие, состоящее в том, что для каждого вектора
54 AρSO(K1)SO(K2) (6)
55 (существующего в силу (5)), справедливо неравенство
56 (KSO(K1)2-KS2)Kρ1-(KS1-KSO(K2)1)Kρ2<KSO(K2)1KSO(K1)2-KS1KS2 . (7)
57 Аналогично доказательству леммы 3 (Лабскер и др., 2011а; Лабскер, Ященко, 2013) можно показать справедливость следующего предложения.
58 Предложение 2. Пусть выполняется условие (4) и Aσ(SO(K2))O(K1), Aω(SO(K1))O(K2) . Тогда отрезки Kσ(α)=(-KS2)KSO(K2)1 и Kω(α)=(-KSO(K1)2)KS1 не совпадают и пересекаются в точке N(α(K),δ(K)) с абсциссой
59 α(K)=KSO(K1)2-KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1)(0,1) (8)
60 и ординатой
61 δ(K)=KSO(K2)1KSO(K1)2-KS1KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1) (9)
62 (см. рис. 1).
63 Предложение 3 (необходимые условия). При условиях (4) и (5) условие (3) влечет за собой справедливость утверждений:
64 a)l=2 ;
65 b) выполняется условие τ(K) ;
66 с) множество
67 SO(K(α))=SO(K2)    при    α=0;(SO(K2))O(K1)    при    0<α<α(K);SO(K(α))=(SO(K2))O(K1)(SO(K1))O(K2)    при    α=α(K);(SO(K1))O(K2)    при    α(K)<α<1;SO(K1)    при    α=1, (10)
68 где α(K) определяется формулой (8).
69 Доказательство. Докажем утверждение a). Допустим противное этому утверждению: l2 . При этом нетрудно убедиться, что (4) эквивалентно неравенству l2 . Следовательно, l3 . В этом случае найдется вектор Aρ такой, что отрезок (-Kρ2)Kρ1 будет пересекать отрезок (-KS2)N во внутренней его точке N1 , порождая звено N1N2 ломаной KS(α) (см. рис. 1). Отрезок (-KS2)N1 является первым (слева направо) звеном ломаной KS(α) . Точка N2 будет концом второго звена и началом третьего звена (на рис. 1 l=3 и ломаная KS(α)=(-KS2)N1N2KS1 выделена полужирной линией).
70 По определению KS2 справедливо неравенство Kρ2KS2 . Но Kρ2KS2 , поскольку в противном случае отрезок (-Kρ2)Kρ1 не мог бы пересекать отрезок (-Kρ2)N во внутренней его точке N1 . Следовательно, имеет место неравенство Kρ2>KS2 , означающее, что вектор AρSO(K2) .
71 Справедливо неравенство -Kρ2>-KSO(K1)2 , поскольку в противном случае -Kρ2-KSO(K1)2 , и тогда отрезок (-Kρ2)Kρ1 не мог бы пересекать отрезок (-Kρ2)N во внутренней его точке N1 (см. рис.1). По определению KS1 справедливо неравенство Kρ1KS1 . Но Kρ1KS1 , поскольку в противном случае вектор AρSO(K1) и по определению KSO(K1)2 было бы справедливо неравенство Kρ2KSO(K1)2 , противоречащее неравенству -Kρ2>-KSO(K1)2 . Таким образом, Kρ1<KS1 и, следовательно, стратегия AρSO(K1) .
72 Пусть α1 и α2 — абсциссы соответственно левого и правого концов второго звена ломаной KS(α) (см. рис.1). Тогда при каждом α(α1,α2) справедливо равенство Kρ(α)=KS(α) , т.е. AkSO(K(α)) . Таким образом, совокупность AkSO(K(α)) , AρSO(K1) и AρSO(K2) противоречит условию (3) теоремы. Полученное противоречие доказывает, что l=2 . Утверждение а) доказано.
73 Докажем утверждение b). По доказанному утверждению a) число звеньев ломаной KS(α) равно 2 ( l=2 ). Символический вид этой ломаной изображен на рис. 2 (выделена полужирной линией).
74 Рис. 2. Графики показателей векторов в случае, когда ломаная, представляющая график KS(α) , состоит из двух звеньев (l=2)
75 Пусть чистая стратегия Aρ удовлетворяет условию (6) (существование таких стратегий обусловлено требованием (5) ). Докажем неравенство
76 Kρ(α(K))<δ(K) (11)
77 (на рис. 2, Kρ(α(K))=-Nρα(K) , где Nρα(K) — длина отрезка Nρα(K) ).
78 Для левого конца Kρ(0)=-Kρ2 и правого конца Kρ(1)=Kρ1 отрезка Kρ(α)=(-Kρ2)Kρ1 имеем соответственно
79 -Kρ2-KS2 и Kρ1KS1 , (12)
80 так как в противном случае соответственно AρSO(K2) и AρSO(K1) , что противоречит (6).
81 Для этих же концов в силу определения (-KS2) и KS1 имеем соответственно
82 -Kρ2-KS2 и Kρ1KS1 . (13)
83 Из (12) и (13) следует, что отрезок (-Kρ2)Kρ1 не может пересекать только один из отрезков (-KS2)N или NKS1 . Но отрезок не может пересекать и оба отрезка (-KS2)N и NKS1 , поскольку в противном случае ломаная KS(α) имела бы 3 звена, что противоречит утверждению а).
84 Отрезок (-Kρ2)Kρ1 не может иметь с отрезками (-KS2)N и NKS1 единственную общую точку N . В самом деле, если бы отрезок (-Kρ2)Kρ1 проходил бы через точку N и не имел бы других общих точек ни с отрезком (-KS2)N , ни с отрезком NKS1 , то Kρ(α(K))=KS(α(K)) , т.е. AρSO(K(α(K))) и, следовательно, вектор Aρ был бы синтезированным при α=α(K) , что противоречит условию (3) теоремы.
85 Итак, мы доказали, что отрезок (-Kρ2)Kρ1 лежит ниже точки N . Этим доказано неравенство (11).
86 Левую часть неравенства (11) заменим по ее определению, а вместо α(K) и δ(K) подставим их значения соответственно по формулам (8) и (9); в результате получим:
87 (Kρ1+Kρ2)KSO(K1)2-KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1)-Kρ2<KSO(K2)1KSO(K1)2-KS1KS2(KSO(K1)2-KS2)+(KS1-KSO(K1)1) . (14)
88 Из положительности α(K) и KSO(K1)2-KS2 следует положительность знаменателя в (14). Поэтому обе части неравенства (14) можем умножить на этот знаменатель, после чего элементарными преобразованиями получаем неравенство (7). Таким образом, для любой стратегии Aρ , удовлетворяющей условию (6), справедливо неравенство (7), т.е. выполняется условие τ(K) . Утверждение b) доказано.
89 Утверждение c) следует из утверждения b) (Лабскер, Ященко, 2013; доказательство в терминах теории игр с природой). ▄
90 Предложение 4 (достаточные условия). Пусть выполняются условия (4) и (5). Тогда каждое из следующих условий:
91 a) выполняется условие τ(K) и b) множество SO(K(α)) имеет структуру (10), влечет за собой включение (3).
92 Доказательство. Докажем, что из условия a) следует включение (3). Допустим противное: существуют αρ(0,1) и стратегия Aρ , удовлетворяющая условию (6) (существование такой стратегии гарантировано условием (5)) и такая, что
93 AρSO(K(αρ)) . (15)
94 Из (15) следует равенство Kρ(αρ)=KS(αρ) , означающее, что при α=αρ отрезок Kρ(α) имеет общую точку с ломаной KS(α) .
95 В силу (4) число звеньев ломаной KS(α) не меньше 2 (l2) и, следовательно, отрезки (-KS2)KSO(K2)1 и (-KSO(K1)2)KS1 не совпадают и пересекаются в точке N (рис. 3, на котором число звеньев l=4 ). В силу (6) отрезок Kρ(α) не может совпадать ни с одним из отрезков (-KS2)KSO(K2)1 и (-KSO(K1)2)KS1 и не может пересекать только один из отрезков (-KS2)N или NKS1 , поскольку из (6) следует, что -Kρ2<-KS2 и Kρ1<KS1 .
96

Рис. 3. Графики показателей K(α) -оптимальных векторов в случае, когда ломаная, представляющая график функции KS(α) , состоит из четырех звеньев (l=4)

97 Если отрезок Kρ(α) пересекает оба отрезка (-KS2)N и NKS1 и занимает, например, положение отрезка Kρ1(α)=(-Kρ12)Kρ11 (см. рис. 3), то
98 Kρ(α(K))=Kρ1(α(K))>δ(K) , (16)
99 где δ(K) — ордината точки N ( рис. 3, δ(K)=-Nα(K) , где Nα(K) — длина отрезка Nα(K) ).
100 Если отрезок Kρ(α) имеет с отрезками (-KS2)N и NKS1 единственную общую точку N и занимает, например, положение отрезка Kρ2(α)=(-Kρ22)Kρ21 , то
101 Kρ(α(K))=Kρ2(α(K))=δ(K) . (17)
102 Оба случая (16) и (17) можно объединить одним неравенством Kρ(α(K))δ(K) . Подставляя в это неравенство выражения для α(K) и δ(K) по формулам соответственно (8) и (9), получим
103 (Kρ1+Kρ1)KSO(K1)2-KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1)-Kρ2KSO(K2)1KSO(K1)2-KS1KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1) . (18)
104 Умножая обе части неравенства (18) на положительный знаменатель и проведя элементарные преобразования, получим неравенство
105 (KSO(K1)2-KS2)Kρ1-(KS1-KSO(K2)1)Kρ2KSO(K2)1KSO(K1)2-KS1KS2 ,
106 которое противоречит неравенству (7). Следовательно, отрезок Kρ(α)=(-Kρ2)Kρ1 не имеет общих точек с ломаной KS(α) , и потому вектор Aρ не является K(α) -оптимальным, что противоречит допущению (15). Таким образом, доказано, что из условия a) следует (3).
107 Теперь докажем, что (3) следует также и из условия b). Пусть множество SO(K(α)) имеет структуру (10) и пусть AρSO(K(αρ)) при некотором α=αρ[0,1] .
108 Из структуры (10) очевидным образом вытекают следующие утверждения: если αρ[0,α(K)) , то AρSO(K2) ; если αρ=α(K) , то AρSO(K2)SO(K1) ; если αρ(α(K),1] , то AρSO(K1) .Таким образом, справедливо включение SO(K(αρ))SO(K2)SO(K1) , но поскольку αρ[0,1] было произвольным, для которого AρSO(K(αρ)) , то справедливо включение (3). ▄
109

Формулировка полученных результатов в терминах теории игр с природой

110 Придадим обозначениям в терминах двухкритериальной задачи оптимизации конкретный смысл из теории игр с природой. Пусть S — множество стратегий Ai=(ai1,...,ain),    iI, игрока A, где aij,iI,jJ, — его выигрыши; K1=W — критерий Вальда и K2=Sav — критерий Сэвиджа. Тогда Ki1=Wi — показатель эффективности стратегии Ai,iI, по критерию Вальда; KS1=WSW-цена игры; SO(K1)=SO(W) — множество W-оптимальных стратегий; Ki2=Savi — показатель неэффективности стратегии Ai,iI, по критерию Сэвиджа; KS2=SavSSav-цена игры; SO(K2)=SO(Sav) — множество Sav-оптимальных стратегий; K(α)=(WSav)(α) — критерий Вальда–Сэвиджа с выигрыш-показателем α[0,1]; Ki(α)=(WSav)i(α),iI, — показатель эффективности стратегии Ai,iI, по критерию Вальда–Сэвиджа; KS(α)=(WSav)S(α) — цена игры по критерию Вальда–Сэвиджа; SO(K(α))=SO((WSav)(α)) — множество (WSav)(α) -оптимальных стратегий; (SO(K1))O(K2)=(SO(W))O(Sav) ; KSO(K1)2=SavSO(W) ; (SO(K2))O(K1)=(SO(Sav))O(W) ; KSO(K2)1=WSO(Sav) .
111 Условия (4) и (5) будут выглядеть так:
112 SO(W)SO(Sav)=, (19)
113 S[SO(W)SO(Sav)], (20)
114 условие τ(K) превратится в условие τ(WSav) : для каждого вектора AρSO(W)SO(Sav) (существующего в силу (20)), справедливо неравенство
115 (SavSO(W)-SavS)Wρ-(WS-WSO(Sav))Savρ<WSO(Sav)SavSO(W)-WSSavS . (21)
116 Тогда предложение 3 перефразируется в терминах теории игр с природой следующим образом.
117 Теорема 1 (необходимые условия отсутствия синтезирования). Пусть в игре с природой не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа (выполняется условие (19)), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа (выполняется условие (20)). Тогда если в данной игре критерий Вальда–Сэвиджа не обладает свойством синтезирования, то справедливы следующие утверждения:
118
  1. а) число звеньев ломаной, представляющей график цены игры по критерию Вальда–Сэвиджа, равно 2;
  2. игра удовлетворяет условию τ(WSav) ;
  3. с) множество стратегий, оптимальных по критерию Вальда–Сэвиджа, имеет структуру
119 SO((WSav)(α))=SO(Sav)    при    α=0;(SO(Sav))O(W)    при    0<α<α(K);SO((WSav)(α))=(SO(Sav))O(W)(SO(W))O(Sav)    при    α=α(K);(SO(W))O(Sav)    при    α(K)<α<1;SO(W)    при    α=1, (22)
120 где
121 α(WSav)=SavSO(W)-SavS(SavSO(W)-SavS)+(WS-WSO(Sav)). (23)
122 Теорема 2 (достаточные условия отсутствия синтезирования). Пусть в игре с природой не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа (выполняется условие (19)), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа (выполняется условие (20)). Тогда из каждого из следующих условий:
123
  1. игра удовлетворяет условию τ(WSav) ;
  2. множество стратегий, оптимальных по критерию Вальда–Сэвиджа, имеет структуру (22); —
124 следует, что критерий Вальда–Сэвиджа не обладает свойством синтезирования.
125 Из теорем 1 и 2 следует, что каждое из утверждений a) и b) теоремы 2 есть необходимое и достаточное условие того, что критерий Вальда–Сэвиджа не обладает свойством синтезирования.
126 Отметим, что необходимое условие a) теоремы 1 не является достаточным условием отсутствия у критерия Вальда–Сэвиджа свойства синтезирования. Для доказательства этого нетрудно привести соответствующий пример.
127

Иллюстрация применения полученных результатов

Применение полученных результатов проиллюстрируем на решении следующей задачи (Лабскер, 2016).
128 Задача. Для изготовления X единиц определенной продукции предприятием должен быть выбран один из четырех технологических способов производства. Потребность количества этой продукции носит случайный характер и, как показывает маркетинговый анализ данных за прошлые периоды, может принимать значения 25, 35, 45 и 50 единиц. Производственные затраты TCi на изготовление X единиц продукции технологическим способом i ( i=1,...,4 ) включают фиксированные затраты Q1=145 , Q2=70 , Q3=180 , Q4=110 условных денежных единиц (у.е.) и удельные затраты c1=3 , c2=5 , c3=2 , c4=4 у.е. на производство единицы продукции и выражаются формулой
129 TCi=Qi+ciX , i=1,...,4 . (24)
130 Перед предприятием стоит задача выбора одного из четырех технологических способов изготовления продукции, с тем чтобы производственные затраты были наименьшие.
131 Предприятию до принятия им решения о выборе технологического способа известны возможные значения спроса на изготавливаемую продукцию (25, 35, 45, 50 ед.). Если бы предприятие в момент выбора технологического способа знало, какой будет спрос, оно выбрало бы технологический способ, при котором наименьшие производственные затраты. Но предприятие этого не знает. Также у предприятия отсутствует информация о вероятностях значений спроса, и нет статистической возможности определить это вероятностное распределение. Реальный спрос в режиме реального времени становится известным предприятию в период реализации готовой продукции после выбора технологического способа и производства продукции по выбранной технологии. Таким образом, предприятию предстоит принять решение о выборе технологического способа производства в условиях неопределенности.
132 Решение. Для анализа данной задачи подходящей является модель «Игра с природой», в которой рациональным игроком A выступает предприятие, а природой является потребность в изготавливаемой продукции. Игрок A располагает четырьмя стратегиями Ai , i=1,...,4 и выбрать для изготовления продукции технологический способ i. Природа может пребывать в одном из четырех состояний: П1=25, П2=35, П3=45 и П4=50 ед. спроса.
133 Отметим, что одним из принципов модели «Игра с природой» является принцип синхронности выбора определенной стратегии рациональным игроком и принятия природой одного из возможных состояний. Понятие синхронности не означает одновременность этих событий в смысле реального хронологического времени, а указывает на то, что выбор стратегии рациональным игроком осуществляется в условиях незнания им состояния природы, т.е. эти события происходят одновременно в смысле игрового времени.
134 В модели в качестве выигрышей aij , i,j=1,2,3,4 , игрока A в игровой ситуации (Ai,Пj) , когда игрок A выбирает стратегию Ai , а природа находится в состоянии Пj , будем рассматривать производственные затраты предприятия, вычисляемые по формуле (24). Таким образом, выигрыши aij , i,j=1,...,4 , — это отрицательные величины, которые в обозначениях модели подсчитываются по формуле aij=-(Qi+ciПj) , i,j=1,...,4 . Из них формируем платежную матрицу А.
135 Подсчитываем показатели βj=max{aij:i=1,...,4} , j=1,...,4 , благоприятности состояний природы и проставляем их в последней дополнительной строке матрицы А. Находим риски rij=βj-aij,i,j=1,...,4 , и формируем матрицу рисков R.
136
АА= П1 П2 П3 П4 Wi , R= П1 П2 П3 П4 Savi
A1 –220 –250 –280 –295 –295 A1 25 5 10 15 25
A2 –195 –245 –290 –320 –320 A2 0 0 20 40 40
A3 –230 –250 –270 –280 –280 A3 35 5 0 0 35
A4 –210 –250 –290 –310 –310 A4 15 5 20 30 30
βj –195 –245 –270 –280
137 В последних добавленных столбцах матриц А и R стоят W- показатели и Sav- показатели стратегий. Перед тем как приступить к процедуре нахождения синтезированных стратегий, целесообразно выяснить их существование. Для этого используем условие τ(WSav) . Из столбцов Wi и Savi матриц А и R видно, что
138 WSp=-280 , SO(W)=(SO(W))O(Sav)={A3} , SavSO(W)=35 ,
139 SavS=25 , SO(Sav)=(SO(Sav))O(W)={A1} , WSO(Sav)=-295 .
140 Тогда правая часть неравенства (21)
141 WSO(Sav)SavSO(W)-WSSavS=-3325 . (25)
142 Так как стратегии A2 и A4 не принадлежат множеству SO(W)SO(Sav) , левую часть неравенства (21) надо подсчитать только для этих стратегий, тогда:
143 (SavSO(w)-SavS)W2-(WS-WSO(Sav))Sav2=-3575 , (26)
144 (SavSO(w)-SavS)W4-(WS-WSO(Sav))Sav4=-3550 .(27)
145 Из неравенств (25)–(27) заключаем, что для стратегий A2 и A4 справедливо неравенство (21), т.е. данная игра удовлетворяет условию τ(WSav) . Нетрудно убедиться, что выполняются также условия (19) и (20). Таким образом, справедливы все условия теоремы 2, по которой критерий Вальда–Сэвиджа не обладает свойством синтезирования. Это означает, что применение критерия Вальда–Сэвиджа ни при каком значении выигрыш-показателя α[0,1] не приводит к синтезированным решениям, т.е. каждая стратегия, оптимальная по критерию Вальда–Сэвиджа, оптимальна по критерию Вальда или по критерию Сэвиджа. По формуле (23) имеем α(WSav)=0,4 . Тогда, используя формулу (22), получим следующую структуру множества оптимальных несинтезированных стратегий по критерию Вальда–Сэвиджа:
146 SO((WSav)(α))={A1,A3}  при    α=0,4;{A1}  при    0α<0,4;{A3}  при    0,4<α1.
147 Условно-геометрическая интерпретация данной задачи представлена на рис. 4.
148 Найденное решение экономически можно проинтерпретировать следующим образом. Если значение выигрыш-показателя α находится в пределах 0α<0,4 , критерий Вальда–Сэвиджа рекомендует для изготовления продукции в качестве оптимального выбрать технологический способ 1 (стратегия A1 в матрице R, оптимальная по критерию Сэвиджа), при котором предприятие гарантирует себе наибольший риск недостижения наименьших затрат при каждой потребности производимой продукции, равный 25 ед. (первая строка матрицы R), т.е. при выборе технологического способа 1 производства риск недостижения наименьших затрат не может быть больше 25 ед.
149 При выборе другого способа производства указанный риск может оказаться больше 25 ед. Действительно, например, при выборе способа производства 2, 3 или 4 и при потребности соответственно в 50, 25 и 50 ед. продукции риск будет равен соответственно 40, 35 и 30 ед. (см. игровые ситуации (A2,П4) , (A3,П1) , (A4,П4) в матрице рисков R ). Принятое решение является крайне пессимистическим относительно рисков, поскольку выбору технологического способа 1 сопутствует наибольший при этом способе риск в 25 ед.
150

Рис. 4. Геометрическое представление задачи

151 Если значение выигрыш-показателя α находится в пределах 0,4<α1 , то оптимальным по критерию Вальда–Сэвиджа является решение изготавливать продукцию по технологическому способу 3 (стратегия A3 в матрице А, оптимальная по критерию Вальда). При этом издержки предприятия при любой потребности в продукции составят не более 280 ед. Если предприятие отклонится от оптимального решения и выберет 1, 2 или 4 способ производства, то при потребности в продукции в 50 ед. издержки составят соответственно 295, 320 или 310 у.е. (см. игровые ситуации (A1,П4) , (A2,П4) , (A4,П4) в платежной матрице А). Принятое решение крайне пессимистично относительно издержек, так как при способе 3 издержки в 280 у.е. являются максимальными при этом способе производства.
152 Если α=0,4 , то с точки зрения критерия Вальда–Сэвиджа безразлично, какой выбрать способ производства, 1 или 3.
153 Замечание 1. При желании платежную матрицу А с помощью аффинного преобразования a'ij=0,2aij+64 , i,j=1,...,4 , можно было бы редуцировать к матрице с более простыми элементами.

Библиография

1. Лабскер Л.Г., Ященко Н.А., Амелина А.В. (2011а). Оптимизация выбора корпоративного заемщика банка на основе синтетического критерия Вальда–Сэвиджа // Финансовая аналитика: проблемы и решения. № 34 (76). С. 43–54.

2. Лабскер Л.Г., Ященко Н.А., Амелина А.В. (2011б). Формирование приоритетной очередности кредитования банком корпоративных заемщиков по синтетическому критерию Вальда–Сэвиджа // Финансы и кредит. № 38 (518). С. 31–41.

3. Лабскер Л.Г., Ященко Н.А., Амелина А.В. (2012). Очередность кредитования банком корпоративных заемщиков: формирование приоритетного порядка на основе синтетического критерия Вальда–Сэвиджа. Saarbrucken: LAMBERT Academic Publishing GmbH & Co. KG.

4. Лабскер Л.Г., Ященко Н.А. (2013). К вопросу о доказательстве теоремы о структуре множества стратегий, оптимальных по критерию Вальда–Сэвиджа // Наука и Мир. Международный научный журнал. № 1 (1). С. 158–167.

5. Лабскер Л.Г. (2014). Теория критериев оптимальности и экономические решения. М.: КНОРУС.

6. Лабскер Л.Г. (2016). К вопросу о проблеме сглаживания критерием Гурвица и экономическое приложение // Инновации и инвестиции. № 6. С. 134–145.

7. Arrow K.J., Hurwicz L. (1972) An Optimality Criterion for Decision Making under Ignorance. In: “Uncertainty and expectations in economics”. Oxford: Basil Blackwell and Mott.

8. Hurwicz L. (1951). Optimality Criteria for Decision Making under Ignorance. Cowles commission papers No. 370.

9. Savage L.J. (1951).The Theory of Statistical Decision // J. Amer. Statist. Assoc. Vol. 46. No.1. P. 55–67.

10. Wald A. (1950). Statistical Decision Functions. N.Y.: Wiley; L., Chapman & Hall.

Комментарии

Сообщения не найдены

Написать отзыв
Перевести