The function restoration method by integrals for analysis  and forecasting of rare events in the economy

Korablev, Yuri

doi:10.31857/S042473880010485-2

1. Введение

Анализ и прогнозирование событий позволяет должным образом к ним подготовиться, что способствует уменьшению возможных потерь или увеличению прибыли. Для этого могут использоваться различные математические методы, среди которых выделяют методы работы с редкими событиями. Редкие события отличаются от частых, как правило, тем, что представляются в виде потоков дискретных событий, возникающих через случайные периоды времени, а не в виде числа событий за период времени (или временного ряда). Время между событиями может быть произвольным (дни, года, микросекунды, при этом события будут по-прежнему относиться к редким). Важным является способ представления данных.

Представление редких событий в виде временного ряда приведет к тому, что такой временной ряд будет содержать множество нулей. Тем не менее некоторые методы работают и с такими рядами. Иногда для этого адаптируются методы классификации. Например, метод «ближайших соседей» (Altman, 1992; Cover, Hart, 1967) ищет в наблюдениях подпоследовательности похожие на вектор предшествующих значений фиксированной длины, после чего возвращает прогноз как значение, следующее за наиболее похожей подпоследовательностью.

Если временной ряд состоит из нулей и единиц, то иногда применяют метод логистической регрессии (Walker, Duncan, 1967), когда по набору данных внешних признаков строится классификационная модель, которая показывает, что при заданных признаках должна появиться единица или ноль. Иногда используют нейронные сети (Барцев, Охонин, 1986; Rumelhart, Hinton, Williams, 1986), которые строят модель, но уже скрытым от исследователя способом. Метод Кростона (Croston, 1972; Johnston, Boylan, 1996) предполагает разделение исходного ряда данных на два — ряд из ненулевых значений и ряд длительности между ненулевыми значениями, — после чего проводится экспоненциальное сглаживание каждого ряда, а прогнозное значение получается как ожидаемое ненулевое значение через ожидаемое число нулевых значений.

В логистике, когда надо определить размер запаса, достаточного для удовлетворения спроса для заданного числа периодов, иногда используется метод бутстрэппинга (Виллемейна) (Efron, Tibshirani, 1993; Willemain, Park, Kim, Shin, 2001). Для этого из имеющихся наблюдений случайным образом извлекают число значений, соответствующих числу периодов, и суммируют их; эту процедуру многократно повторяют, а затем строят функцию распределения для этой суммы значений. Размер запаса устанавливается на уровне, который обеспечит удовлетворение спроса с заданной доверительной вероятностью. Иногда для этого применяют селективные методы (Иванько, 2005), которые переключают модели прогнозирования по значению ошибки прогноза на предыдущем шаге.

Перечисленные методы работают с временными рядами, содержащими большое число нулевых значений. Однако наиболее обоснованным является представление событий в виде потоков дискретных событий, которые появляются через произвольные периоды времени. Для работы с данными в виде потоков событий используется теория случайных процессов (Вентцель, Овчаров, 2000). Потоки событий представляются в виде пуассоновского потока, когда время между событиями подчиняется экспоненциальному распределению, или в более сложном варианте – потоком Пальма с ограниченным последействием (здесь время между событиями соответствует произвольному закону распределения). Иногда для моделирования сверхредких событий вводят модифицированные пуассоновские процессы (Дзанагова, Хугаева, 2015). На практике чаще всего применяют классические пуассоновские процессы, когда на основе статистических данных редких продаж определяют параметры потока событий, после чего рассчитывают размер собственных запасов, зная вероятности возникновения определенного числа событий за выбранный период времени (Лукинский, Замалетдинова, 2015; Вожжов А., Луняков, Вожжов С., 2015). С помощью пуассоновских потоков можно определить вероятность появления заданного числа событий на выбранном интервале времени, а с помощью потоков Пальма — ожидаемое оставшееся время до следующего события (однако потоки Пальма являются стационарными и подходят только для случаев с постоянной интенсивностью). Использование нестационарных непуассоновских потоков не встречается.

У каждого метода есть своя область применения, в которой он может дать хорошие результаты. Причем для одних и тех же задач иногда можно применять разные методы, но их эффективность будет разной. Также существуют условия, для которых методы еще не разработаны. Разработка новых методов, которые дадут новые возможности либо будут более эффективными — есть цель науки.

2. Основная идея

Почему процесс возникновения событий представляется случайным? Почему интервалы между событиями должны быть случайными числами? Неужели нет информации о том, как возникают эти события? Почему из статистических данных определяется закон распределения случайных интервалов времени, а не процесс, который порождает эти события? Используя знания о характере процесса, определяя из статистических данных его параметры и закономерности, а затем, экстраполируя параметры процесса на будущее время, можно получить более точный прогноз возникновения будущих событий (рис. 1). Информация о процессе формирования событий способна избавить нас от неопределенности при их появлении. События формируются уже не случайным образом, не через абсолютно случайные периоды времени, а по определенному механизму, параметры которого стали известны из статистических данных.

Рис. 1. Схема анализа и прогнозирования редких событий

Самыми распространенными причинами появления событий в экономике могут быть процессы потребления (запас ведет себя как опустошающаяся емкость) и процессы накопления некоторого возмущения до определенного уровня, вследствие чего возникает некоторое событие. В обоих вариантах источники событий¹ можно моделировать как емкости. Предложенный метод анализа и прогнозирования редких событий получил название «емкостный метод» (Кораблев, 2015а, 2015б, 2018, 2019а, 2019б). Согласно этому методу параметром процесса образования событий является нестационарная функция скорости расхода запаса или накопления воздействия $f (t)$ , подлежащая определению. Такой функцией может быть, например, спрос, зависящий от времени, индивидуальная скорость потребления продукции, интенсивность покупок у выбранного не подконтрольного нам оптового покупателя (ненаблюдаемые значения).

1. Под источниками события понимаются некоторые объекты или системы, в которых происходят какие-то процессы, приводящие к возникновению этих событий.

Оказывается, что из данных редких событий можно легко восстановить функцию $f (t)$ . Для этого инвертируем процесс потребления продукции и получаем задачу, обратную к задаче управления запасами (алгоритм в минус первой степени), когда по имеющимся данным о моментах времени и величинах воздействия события (покупок) $(t_{i}, y_{i})$ определяется скорость воздействия $f (t)$ . Для этого используем основное предположение.

Предположение. Величина совершенного события $y_{i}$ есть интеграл функции $f (t)$ за время от момента возникновения этого события $t_{i}$ до момента совершения следующего события $t_{i + 1}$ .

Для процессов потребления или накопления возмущения это предположение справедливо, оно также негласно применяется в теории управления запасами при моделировании собственных запасов (Бауэрсокс, Клосс, 2008). Изменение предпочтений потребителей не нарушает этого предположения, а выражается в изменении функции $f (t) .$ Конечно, для отдельных видов товаров или услуг это предположение может выполняться не всегда, а при определенном поведении потребителей оно может нарушаться. Но в данной работе мы будем считать, что предположение в большей степени выполняется, пусть и с погрешностью $y_{i} = \int_{t_{i}}^{t_{i + 1}} f (t) d t + ε_{i} .$

Используя это предположение, задача определения (регрессии) $f (t)$ превращается в оптимизационную задачу восстановления неизвестной функции, для которой известна последовательность интегралов за непересекающиеся периоды времени, с дополнительным штрафом на нелинейность (С — параметр, влияющий на степень сглаживания, n — размер выборки):

$\begin{array}{l} \overset{n - 1}{\sum_{i = 1}} {(y_{i} - \int_{t_{i}}^{t_{i + 1}} f (t) d t)}^{2} + C \int_{t_{1}}^{t_{n}} {(f'' (t))}^{2} d t \to m i n . \end{array}$ (1)

Нам необходимо найти решение этой оптимизационной задачи и продемонстрировать работу метода для событий, которые образуются процессами, схожими с процессами опустошения емкости.

3. Построение интегрального сплайна

Наиболее подробно задачи восстановления функций по интегралам изучены в работах (Киреев, 1994; Киреев, Бирюкова, 1998, 2014; Бирюкова, Киреев, Гершкович, 2016). Исследования этих авторов посвящены сплайнам, построение которых зависит одновременно от интегралов и дифференциалов. Такие сплайны получили название интегро-дифференциальные сплайны, или ИД-сплайны. Однако в этих работах сплайн строится на основе системы уравнений, состоящей из условий согласования $y_{i} = \int_{t_{i}}^{t_{i + 1}} \hat{f} (t) d t$ в виде точных равенств, что, по сути, является интерполяцией интегралов, а не их аппроксимацией. Кроме того, в них строятся параболические сплайны, а не кубические. В работе (Boor, 2001, р. 79) также рассматривается интерполяционный параболический сплайн, а не сглаживающий кубический. В работах (Федорова, 2008, 2016) строится одномерный и двумерный сплайны по известной площади под кривой закона распределения, однако в этой работе сплайн также является интерполяционным, а не аппроксимирующим. Готового решения нашей задачи мне найти не удалось, поэтому его пришлось разрабатывать самостоятельно.

Мой метод базируется на методе аппроксимации кубическими сплайнами обычных функций (не интегралов функции) со штрафом на нелинейность², но модифицируется для работы с интегралами функции. Решение ищется в виде $\hat{f} (t) = g (t)$ , где $g (t)$ — кубический сплайн³, причем на каждом участке функция записывается не как полином с четырьмя неизвестными коэффициентами, а выражается только через две переменные — значение функции в точке $g_{i} = g (t_{i})$ и ее вторую производную в этой точке $γ_{i} = g'' (t_{i})$ . Значение сплайна в произвольной точке определяется по формуле

2. В великолепно написанной работе (Green, Silverman, 1994) представлено необходимое объяснение всей теории.

3. Сочленение кусочков из полиномов третьей степени в точках ti с условием непрерывности как самой функции, так и ее производной в точках сочленения.

$\begin{array}{l} g (t) = \frac{(t - t_{i}) g_{i + 1} + (t_{i + 1} - t) g_{i}}{t_{i + 1} - t_{i}} - \frac{1}{6} (t - t_{i}) (t_{i + 1} - t) \{(1 + \frac{t - t_{i}}{t_{i + 1} - t_{i}}) γ_{i + 1} + (1 + \frac{t_{i + 1} - t}{t_{i + 1} - t_{i}}) γ_{i}\}, \\ \begin{array}{l} i : t_{i} \leq t \leq t_{i + 1} . \end{array} \end{array}$ (2)

Набор всех значений $g = {(g_{1}, \dots, g_{n})}^{T}, γ = {(γ_{2}, \dots, γ_{n - 1})}^{T}$ (в начальной и последней точке $γ_{1} = γ_{n} = 0$ ) полностью задает весь сплайн. Условия непрерывности первой производной в точках сочленения $g' (t_{i} + 0) = g' (t_{i} - 0), i = 2, . . ., n - 1$ дают систему из $n - 2$ уравнений, которая может быть записана в матричном виде через матрицы коэффициентов $Q, R$ при неизвестных $g_{i}, γ_{i}$ :

$\begin{array}{l} \frac{g_{i + 1} - g_{i}}{t_{i + 1} - t_{i}} - \frac{g_{i} - g_{i - 1}}{t_{i} - t_{i - 1}} = \{(t_{i + 1} - t_{i}) (γ_{i + 1} + 2 γ_{i}) + (t_{i} - t_{i - 1}) (2 γ_{i} + γ_{i - 1})\} / 6, i = 2, . . ., n - 1, \\ \begin{array}{l} Q^{T} g = R γ, \end{array} \end{array}$ (3)

где матрица Q размерностью $n \times (n - 2)$ и R размерностью $(n - 2) \times (n - 2)$ имеют вид:

$Q = (\begin{array}{l} \begin{matrix} {h_{1}}^{- 1} \\ - {h_{1}}^{- 1} - {h_{2}}^{- 1} \\ {h_{2}}^{- 1} \\ 0 \\ . . . \\ 0 \\ 0 \\ 0 \end{matrix} & \begin{matrix} 0 \\ {h_{2}}^{- 1} \\ - {h_{2}}^{- 1} - {h_{3}}^{- 1} \\ {h_{3}}^{- 1} \\ . . . \\ 0 \\ 0 \\ 0 \end{matrix} & \begin{array}{l} . . . \\ . . . \\ . . . \\ . . . \\ . . . \\ . . . \\ . . . \\ . . . \end{array} & \begin{matrix} 0 \\ 0 \\ 0 \\ 0 \\ . . . \\ {h_{n - 2}}^{- 1} \\ - {h_{n - 2}}^{- 1} - {h_{n - 1}}^{- 1} \\ {h_{n - 1}}^{- 1} \end{matrix} \end{array}), R = (\begin{array}{l} \begin{matrix} (h_{1} + h_{2}) / 3 \\ h_{2} / 6 \\ 0 \\ 0 \\ . . . \\ 0 \\ 0 \end{matrix} & \begin{matrix} h_{2} / 6 \\ (h_{2} + h_{3}) / 3 \\ h_{3} / 6 \\ 0 \\ . . . \\ 0 \\ 0 \end{matrix} & \begin{matrix} 0 \\ h_{3} / 6 \\ (h_{3} + h_{4}) / 3 \\ h_{4} / 6 \\ . . . \\ 0 \\ 0 \end{matrix} \end{array} \begin{array}{l} \begin{array}{l} . . . \\ . . . \\ . . . \\ . . . \\ . . . \\ . . . \\ . . . \end{array} & \begin{matrix} 0 \\ 0 \\ 0 \\ 0 \\ . . . \\ h_{n - 2} / 6 \\ (h_{n - 2} + h_{n - 1}) / 3 \end{matrix} \end{array}),$

$h_{i} = t_{i + 1} - t_{i}, i = 1, . . ., n - 1$ .

Штраф на нелинейность $\int_{a}^{b} {(g'' (x))}^{2} d x$ упрощается (Green, Silverman, 1994, р. 24–25):

$\begin{array}{l} \int_{a}^{b} {(g'' (x))}^{2} d x = γ^{T} Q^{T} g = γ^{T} R γ = g^{T} [Q R^{- 1} Q^{T}] g = g^{T} K g . \end{array}$ (4)

Для решения задачи (1), где $\hat{f} (t) = g (t)$ , найдем интеграл $\int_{t_{i}}^{t_{i + 1}} g (t) d t$ , где $g (t)$ определяется через искомые неизвестные $g_{i}, γ_{i}$ по формуле (2). После преобразований получаем формулу:

$\begin{array}{l} \int_{t_{i}}^{t_{i + 1}} g (t) d t = \frac{g_{i + 1} h_{i}}{2} + \frac{g_{i} h_{i}}{2} - \frac{γ_{i + 1} {h_{i}}^{3}}{24} - \frac{γ_{i} {h_{i}}^{3}}{24} . \end{array}$ (5)

Тогда оптимизационная задача (1) для искомых $g$ и $γ$ может быть записана в виде

$\begin{array}{l} S (g) = {(Y - V g + P γ)}^{T} (Y - V g + P γ) + α g^{T} K g \to m i n, \end{array}$ (6)

где $Y = {(y_{1}, \dots, y_{n - 1})}^{T}$ ; $V$ — матрица размера $(n - 1) \times n$ и $P$ — матрица размера $(n - 1) \times (n - 2)$ являются матрицами коэффициентов при неизвестных $g$ и $γ$ :

$V = \frac{1}{2} (\begin{array}{l} h_{1} & h_{1} & 0 & \dots & 0 & 0 \\ 0 & h_{2} & h_{2} & \dots & 0 & 0 \\ \dots & \dots & \dots & \dots & \dots & \dots \\ 0 & 0 & 0 & 0 & h_{n - 1} & h_{n - 1} \end{array}),$ $P = \frac{1}{24} (\begin{array}{l} {h_{1}}^{3} & 0 & 0 & 0 & \dots & 0 & 0 \\ {h_{2}}^{3} & {h_{2}}^{3} & 0 & 0 & \dots & 0 & 0 \\ 0 & {h_{3}}^{3} & {h_{3}}^{3} & 0 & \dots & 0 & 0 \\ \dots & \dots & \dots & \dots & \dots & \dots & \dots \\ 0 & 0 & 0 & 0 & 0 & {h_{n - 2}}^{3} & {h_{n - 2}}^{3} \\ 0 & 0 & 0 & 0 & 0 & 0 & {h_{n - 1}}^{3} \end{array}) .$

Далее, благодаря тому, что условия непрерывности по-прежнему дают систему уравнений $Q^{T} g = R γ$ , выражая $γ = R^{- 1} Q^{T} g,$ перепишем формулу (6) так, чтобы в ней была только одна неизвестная:

$S (g) = {(Y - (V - P R^{- 1} Q^{T}) g)}^{T} (Y - (V - P R^{- 1} Q^{T}) g) + α g^{T} K g \begin{array}{l} = {(Y - C g)}^{T} (Y - C g) + α g^{T} K g, \end{array}$ (7)

где $C = V - P R^{- 1} Q^{T}$ матрица размера $(n - 1) \times n$ . Для нахождения минимума выражения (7) раскроем скобки, перегруппируем слагаемые и приравняем производную по $g$ к нулю $(d (x^{T} b) / d x = b,$ $d (b x) / d x = b^{T},$ а если матрица симметрична (что у нас выполняется), то $d (x^{T} A x) / d x = (A + A^{T}) x = 2 A x)$ :

$\begin{matrix} S (g) = g^{T} (C^{T} C + α K) g - 2 Y^{T} C g + Y^{T} Y, S' (g) = 2 (C^{T} C + α K) g - 2 {(Y^{T} C)}^{T} = 0, \\ \begin{array}{l} g = {(C^{T} C + α K)}^{- 1} C^{T} Y . \end{array} \end{matrix}$ (8)

На этом сплайн полностью построен (значения $g$ и $γ = R^{- 1} Q^{T} g$ задают сплайн $g (t)$ ).

Заметим, что исходные матрицы $Q, R, V, P$ (из которых также получаются $K = Q R^{- 1} Q^{T}$ и $C = V - P R^{- 1} Q^{T})$ зависят только от интервала между наблюдениями $h_{i} = t_{i + 1} - t_{i},$ но не зависят от значений в этих наблюдениях $y_{i}$ , а значения $Y = {(y_{1}, . . ., y_{n - 1})}^{T}$ участвуют только в выражении (8).

Пример использования интегрального сплайна. Пусть нам известны данные $(t_{i}, y_{i})$ о датах и объемах поставок полуторалитровых бутылок кваса в универсам (табл. 1). По ним можно построить график (рис. 2), на котором ступенчатой линией показано среднее число проданных за день бутылок. Гладкая линия обозначает аппроксимирующий сплайн, который минимизирует разницу между интегралами функции и объемом поставки (площадь под ступенькой). Большое расхождение в ширине интервалов наблюдений (куски сплайнов имеют разную ширину) и неудачный выбор параметра $α$ могут влиять на сглаживающие свойства сплайна (местами функция становится отрицательной, что противоречит физическому смыслу). Также при очень больших наборах данных, когда кусков сплайна, привязанных к точкам наблюдения, становится очень много, вычисления могут быть очень трудоемкими. Желательно, чтобы участки сплайна не были привязаны к точкам наблюдения.

Таблица 1. Данные о поставках бутылок кваса в универсам

Дата Поставки Дата Поставки Дата Поставки 02.02.2018 12 28.05.2018 60 12.11.2018 18 12.02.2018 12 18.06.2018 18 17.12.2018 42 26.02.2018 24 29.06.2018 60 27.12.2018 18 12.03.2018 12 16.07.2018 54 14.01.2019 12 26.03.2018 18 30.07.2018 24 11.02.2019 18 09.04.2018 36 06.08.2018 30 04.03.2019 18 23.04.2018 18 20.08.2018 30 11.03.2019 6 07.05.2018 60 03.09.2018 48 14.05.2018 60 29.10.2018 24 Рис. 2. Скорость расхода бутылок кваса универсамом, шт. в день

4. Переход к базисному сплайну

Чтобы куски сплайнов не были привязаны к точкам наблюдения, следует перейти к базисному сплайну (B-сплайну), состоящему из набора $m$ базисных функций $β_{k} (t)$ , которые, как правило, тоже будут полиномами, но определенными в произвольных точках $s_{1} < \dots < s_{m}$ (чаще всего распределенными равномерно). Каждая функция $β_{k} (t)$ берется с некоторым коэффициентом $δ_{k}$ , который является некоторым индикатором, принимающим значение 0 или 1 в зависимости от того, какая функция соответствует текущему моменту времени, $g (t) = \sum_{k = 1}^{m} δ_{k} β_{k} (t) .$

Дополнительно добавим возможность задавать вес каждого наблюдения $w_{i}$ . Тогда оптимизационная задача примет вид

$\begin{array}{l} S_{W} (g) = \sum_{i = 1}^{n - 1} w_{i} {\{y_{i} - \int_{t_{i}}^{t_{i + 1}} \overset{m}{\sum_{k = 1}} δ_{k} β_{k} (t) d t\}}^{2} + α \int_{t_{1}}^{t_{n}} {({(\overset{m}{\sum_{k = 1}} δ_{k} β_{k} (t))}^{''})}^{2} d t \to m i n . \end{array}$ (9)

Для ее решения надо найти значения сплайна $g = {(g_{1}, \dots, g_{m})}^{T}$ и его вторых производных $γ = {(γ_{2}, \dots, γ_{m - 1})}^{T}$ , но уже в новых точках $s_{1} < s_{2} < \dots < s_{m}$ .

Штраф на нелинейность по-прежнему будет выражаться как $α g^{T} K g$ , где $K = Q R^{- 1} Q^{T}$ , но при этом размерность матриц $Q$ и $R$ будет зависеть не от $n$ , а от $m$ , а элементы — от расстояния между новыми точками, где $h_{k} = s_{k + 1} - s_{k}, k = 1, . . ., m - 1 .$

Рассчитаем интеграл $\int_{t_{i}}^{t_{i + 1}} \sum_{k = 1}^{m} δ_{k} β_{k} (t) d t$ . В зависимости от того, где появятся точки наблюдений (рис. 3) и как будут заданы новые точки сплайна, возможно несколько способов расчета.

абв Рис. 3. Расположение соседних наблюдений на разных участках сплайна: а) в одном интервале; б) в двух соседних интервалах; в) в $L$ интервалах друг от друга

Для того чтобы получить универсальное выражение, подходящее для всех трех случаев, представим интеграл в виде

$\begin{matrix} \int_{t_{i}}^{t_{i + 1}} \overset{m}{\sum_{k = 1}} δ_{k} β_{k} (t) d t = \overset{L}{\sum_{l = 0}} \int_{s_{k + l}}^{s_{k + l + 1}} β_{k + l} (t) d t - \int_{s_{k}}^{t_{i}} β_{k} (t) d t - \int_{t_{i + 1}}^{s_{k + L + 1}} β_{k + L} (t) d t, \\ L : s_{k + L} < t_{i + 1} \leq s_{k + L + 1} . \end{matrix}$ (10)

Первая часть выражения (10) есть интеграл от всех $L$ участков сплайна; вторая — интеграл от начала первой базисной функции $k$ до текущего наблюдения $i$ ; третья — интеграл от наблюдения $i + 1$ до конца последнего интервала $k + L$ , на который попало следующее наблюдение. Значения $k$ и $L$ определяются в зависимости от того, куда попало текущее и следующее наблюдение.

Первая часть выражения находится из полученной ранее формулы, но границами интервала стали новые точки:

$\overset{L}{\sum_{l = 0}} \int_{s_{k + l}}^{s_{k + l + 1}} β_{k + l} (t) d t = \overset{L}{\sum_{l = 0}} [\frac{h_{k + l}}{2} g_{k + l + 1} + \frac{h_{k + l}}{2} g_{k + l} - \frac{{h_{k + l}}^{3}}{24} γ_{k + l + 1} - \frac{{h_{k + l}}^{3}}{24} γ_{k + l}] .$ (11)

После некоторых преобразований вторую часть можно представить в компактной форме

$\begin{matrix} \int_{s_{k}}^{t_{i}} β_{k} (t) d t = \frac{{(h_{k}^{- i})}^{2}}{2 h_{k}} g_{k + 1} + \frac{{(h_{k})}^{2} - {(h_{k}^{+ i})}^{2}}{2 h_{k}} g_{k} + \frac{γ_{k + 1}}{24 h_{k}} {(h_{k}^{- i})}^{2} ({(h_{k}^{- i})}^{2} - 2 {(h_{k})}^{2}) - \\ - \frac{γ_{k}}{24 h_{k}} {(h_{k}^{- i})}^{2} {(h_{k}^{+ i} + h_{k})}^{2}, h_{k}^{- i} = t_{i} - s_{k}, h_{k}^{+ i} = s_{k + 1} - t_{i}, h_{k} = s_{k + 1} - s_{k}; \end{matrix}$ (12)

третья часть —

$\begin{array}{l} \int_{t_{i + 1}}^{s_{k + L + 1}} β_{k + L} (t) d t = \frac{g_{k + L + 1} ({(h_{k + L})}^{2} - {(h_{k + L}^{- (i + 1)})}^{2})}{2 h_{k + L}} + \frac{g_{k + L} {(h_{k + L}^{+ (i + 1)})}^{2}}{2 h_{k + L}} - \frac{γ_{k + L + 1} {(h_{k + L}^{+ (i + 1)})}^{2} {(h_{k + L}^{- (i + 1)} + h_{k + L})}^{2}}{24 h_{k + L}} + \\ \begin{array}{l} + \frac{γ_{k + L} {(h_{k + L}^{+ (i + 1)})}^{2} ({(h_{k + L}^{+ (i + 1)})}^{2} - 2 {(h_{k + L})}^{2})}{24 h_{k + L}}, \end{array} h_{k + L}^{- (i + 1)} = t_{i + 1} - s_{k + L}, h_{k + L}^{+ (i + 1)} = s_{k + L + 1} - t_{i + 1} . \end{array}$ (13)

Подставляя выражения (11)–(13) в (10), можем найти $\int_{t_{i}}^{t_{i + 1}} \overset{m}{\sum_{k = 1}} δ_{k} β_{k} (t) d t$ . Как и раньше, форма этого выражения будет линейной по отношению к неизвестным $g$ и $γ$ . В результате оптимизационную задачу для нахождения искомого B-сплайна интегралов можно записать в знакомом виде $\begin{array}{l} S_{W} (g) = {(Y - V g + P γ)}^{T} W (Y - V g + P γ) + α g^{T} K g \to m i n \end{array} .$ Заполнение матриц $V$ и $P$ происходит на основе наблюдений о моментах времени возникновения текущего и следующего событий, в зависимости от того, на интервал какой базисной функции выпало это наблюдение.

Возможно, будет удобно воспользоваться следующим представлением: $V = G^{I} - G^{I I} - G^{I I I},$ $P = Γ^{I} - Γ^{I I} - Γ^{I I I},$ где матрицы $G^{I}, G^{I I}, G^{I I I}$ имеют размерность $(n - 1) \times m$ , $Γ^{I}, Γ^{I I}, Γ^{I I I}$ — размерность $(n - 1) \times (m - 2)$ (так как $γ_{1} = γ_{m} = 0$ не участвуют). Элементы этих матриц заполняются по формулам:

$G_{i, k}^{I} = 0,5 h_{k}, t_{k} \leq t_{i} < t_{k + 1}; G_{i, k + l}^{I} = 0,5 (h_{k + l - 1} + h_{k + l}), l = 1, . . ., L : t_{k} \leq t_{i}, t_{k + L} \leq t_{i + 1} < t_{k + L + 1};$

$G_{i, k + L + 1}^{I} = h_{k + L} / 2, L : t_{k + L} \leq t_{i + 1} < t_{k + L + 1};$

$G_{i, k}^{I I} = h_{k} / 2 - {(h_{k}^{+ i})}^{2} / 2 h_{k}, t_{k} \leq t_{i} < t_{k + 1}; G_{i, k + 1}^{I I} = {(h_{k}^{- i})}^{2} / 2 h_{k}, t_{k} \leq t_{i} < t_{k + 1};$

$G_{i, k + L}^{I I I} = {(h_{k + L}^{+ (i + 1)})}^{2} / 2 h_{k + L}, t_{k + L} \leq t_{i + 1} < t_{k + L + 1}; G_{i, k + L + 1}^{I I I} = h_{k + L} / 2 - {(h_{k + L}^{- (i + 1)})}^{2} / 2 h_{k + L}, t_{k + L} \leq t_{i + 1} < t_{k + L + 1};$

$Γ_{i, k}^{I} = {h_{k}}^{3} / 24, t_{k} \leq t_{i} < t_{k + 1}; Γ_{i, k + l}^{I} = ({h_{k + l - 1}}^{3} + {h_{k + l}}^{3}) / 24, l = 1, \dots, L : t_{k} \leq t_{i}, t_{k + L} \leq t_{i + 1} < t_{k + L + 1};$

$Γ_{i, k + L + 1}^{I} = {h_{k + L}}^{3} / 24, L : t_{k + L} \leq t_{i + 1} < t_{k + L + 1};$

$Γ_{i, k}^{I I} = {(h_{k}^{- i})}^{2} {(h_{k}^{+ i} + h_{k})}^{2} / 24 h_{k}, t_{k} \leq t_{i} < t_{k + 1}; Γ_{i, k + 1}^{I I} = - {(h_{k}^{- i})}^{2} ({(h_{k}^{- i})}^{2} - 2 {(h_{k})}^{2}) / 24 h_{k}, t_{k} \leq t_{i} < t_{k + 1};$

$Γ_{i, k + L}^{I I I} = - {(h_{k + L}^{+ (i + 1)})}^{2} ({(h_{k + L}^{+ (i + 1)})}^{2} - 2 {(h_{k + L})}^{2}) / 24 h_{k + L}, t_{k + L} \leq t_{i + 1} < t_{k + L + 1};$

$Γ_{i, k + L + 1}^{I I I} = {(h_{k + L}^{+ (i + 1)})}^{2} {(h_{k + L}^{- (i + 1)} + h_{k + L})}^{2} / 24 h_{k + L}, t_{k + L} \leq t_{i + 1} < t_{k + L + 1} .$

Обозначим $C = V - P R^{- 1} Q^{T},$ где матрица С будет иметь размерность $(n - 1) \times m .$ Тогда оптимизационная задача примет знакомый вид $\begin{array}{l} S_{W} (g) = {(Y - C g)}^{T} W (Y - C g) + α g^{T} K g \to m i n \end{array},$ решение которой дает искомые значения $\begin{array}{l} g = {(C^{T} W C + α K)}^{- 1} C^{T} W Y \end{array}$ , $γ = R^{- 1} Q^{T} g$ , определяющие сплайн $g (t)$ в любой точке по формуле (2).

На рис. 4 для примера с поставками кваса в универсам показана построенная функция, которая в значительной степени лишена недостатка способа без использования базисных функций (когда узлами сплайна являлись точки наблюдений). Так как разница в сумме квадратов считается между значениями интегралов, которые значительно превосходят значение самой функции, квадрат второй производной у которой достаточно мал; параметр $α,$ отвечающий за сглаживание, должен быть взят достаточно большим, например $α = 1 0^{5}$ .

Рис. 4. Скорость расхода бутылок кваса универсамом, шт. в день !Верстка! вместо дефиса точку

5. Результаты и обсуждения

Представленный математический аппарат позволяет восстанавливать функцию по последовательности ее интегралов, причем в условиях, когда эти интегралы наблюдаются с погрешностью. По данным редких событий, таких как дискретные продажи и поставки, которые образуются в результате процесса потребления, схожего с опустошением емкости, можно определить, с какой скоростью заканчивался запас продукта у клиентов (в этом примере клиентом был сам универсам). В свою очередь, если со стороны универсама применить описанный метод, можно определить, с какой интенсивность расходуется квас у каждого конечного потребителя.

Определить точность восстановления функции на реальных данных не получится, так как неизвестна исходная функция, т.е. не с чем сравнивать. Мы можем самостоятельно заложить исходную функцию (спрос), моделируя процесс потребления (модели управления запасами) и получая данные покупок (табл. 2). Восстановление исходной функции происходит с очень хорошей точностью (рис. 5). Далее можно переходить к следующему этапу: определять закономерность и проводить экстраполяцию любыми известными методами.

Таблица 2. Данные моделирования системы управления запасами

$t_{i}$	$y_{i}$	$t_{i}$	$y_{i}$	$t_{i}$	$y_{i}$	$t_{i}$	$y_{i}$	$t_{i}$	$y_{i}$
01.01.2018	1444,92	02.06.2018	1431,26	27.09.2018	1423,71	29.03.2019	1409,63	26.07.2019	1423,52
07.02.2018	1419,99	28.06.2018	1447,22	01.11.2018	1405,42	22.04.2019	1421,73	16.08.2019	1463,59
22.03.2018	1405,61	23.07.2018	1460,58	08.12.2018	1427,89	14.05.2019	1425,66	06.09.2019	1419,05
18.04.2018	1420,30	13.08.2018	1418,59	09.01.2019	1418,25	07.06.2019	1423,06	03.10.2019	1415,66
10.05.2018	1415,2	03.09.2018	1467,09	21.02.2019	1421,34	03.07.2019	1435,58	11.11.2019	1427,14

Рис. 5. Пример анализа и прогнозирования редких событий

На этапе поиска закономерности ответственность за результат экстраполяции полностью ложится на плечи исследователя, который, как предполагается, является специалистом в соответствующей прикладной области. На этом шаге можно использовать экспертное мнение и информацию из внешних источников, например пробовать искать зависимость от таких внешних признаков, как ВВП, уровень безработицы, курс рубля и др. В последнем примере внешней информацией является знание того, что исходная функция являлась гармонической, с помощью алгоритма Куинна–Фернандеса (Quinn–Fernandes algorithm) (Quinn, Fernandes, 1991; Quinn, Hannan, 2001) происходит определение соответствующей закономерности как разложение на фиксированное количество гармонических функций.

Стоит заметить, что наибольшая погрешность восстановления наблюдается на концах интервала, так как в этих точках сплайн не знает, куда стремиться, поэтому можно улучшить качество модели, если отбросить часть значений с обоих концов восстановленной функции. На рис. 5 линия «Экстраполяция» построена по модели, оцененной по всей выборке, а «Экстраполяция 2» — по выборке после отбрасывания 20 точек с каждого конца. После экстраполяции функции скорости расхода запаса определяем моменты будущих событий, моделируя процесс потребления как в системах управления запасами (величина заказа определяется из данных редких событий) (табл. 3).

Таблица 3. Сравнение моментов времени прогнозных и фактических событий

Прогноз	15.12.2019	18.01.2020	02.03.2020	01.04.2020	24.04.2020	16.05.2020
Факт	15.12.2019	18.01.2020	03.03.2020	02.04.2020	25.04.2020	18.05.2020
Прогноз	09.06.2020	05.07.2020	28.07.2020	18.08.2020	10.09.2020	11.10.2020
Факт	12.06.2020	07.07.2020	29.07.2020	18.08.2020	10.09.2020	12.10.2020

Полученные прогнозные значения моментов времени возникновения будущих событий очень близки к моментам фактических событий (если продолжать моделирование). Ни один другой метод анализа редких событий не в состоянии дать прогноз с такой точностью. Однако из-за того что восстановление функции было неидеальным и параметры модели (частота, амплитуда и фаза колебаний) определялись с погрешностью, расхождение может со временем нарастать, и прогнозирование на очень далекую перспективу будет неточным. Стоить отметить, что способ восстановления функции, приводящей к событиям, может иметь большое значение для науки в соответствующей прикладной области.

GOST	Korablev Y. The function restoration method by integrals for analysis and forecasting of rare events in the economy // Economics and the Mathematical Methods. – 2020. – V. 56. – Issue 3 C. 113-124 . URL: https://emmras.ru/s042473880010485-2-1/?version_id=14605. DOI: 10.31857/S042473880010485-2
MLA	Korablev, Yuri "The function restoration method by integrals for analysis and forecasting of rare events in the economy." Economics and the Mathematical Methods. 56.3 (2020).:113-124. DOI: 10.31857/S042473880010485-2
APA	Korablev Y. (2020). The function restoration method by integrals for analysis and forecasting of rare events in the economy. Economics and the Mathematical Methods. vol. 56, no. 3, pp.113-124 DOI: 10.31857/S042473880010485-2

RAS Social ScienceЭкономика и математические методы Economics and the Mathematical Methods

The function restoration method by integrals for analysis and forecasting of rare events in the economy

You can

References

Indexing

RAS Social ScienceЭкономика и математические методы Economics and the Mathematical Methods

The function restoration method by integrals for analysis and forecasting of rare events in the economy

You can

References

Indexing

Via social network