В статье рассматривается метод анализа редких событий, который базируется на изучении процессов, порождающих эти события. В экономике самым распространенным процессом образования событий являются процессы потребления или накопления возмущения, которые можно моделировать как процесс опустошения/наполнения «емкости». Параметром процесса образования событий будет нестационарная функция скорости опустошения/наполнения емкости, которую можно восстановить из имеющихся данных. После этого с ней можно проводить необходимые для исследователя действия (анализировать и экстраполировать функцию, построить модель, получить прогноз будущих событий) и cнова запустить процесс образования событий. Такой метод исследования редких событий мною был назван емкостным методом. Для восстановления функции скорости опустошения/наполнения/ емкости в статье приведена оптимизационная задача в виде нахождения специального сглаживающего интегрирующего кубического сплайна. Получены формулы в матричном виде для восстановления (регрессии) искомой функции. Так как интервалы между событиями, как правило, могут быть разными, следует переходить к базисным сплайнам (B-сплайнам), которые не зависят от исходных данных. Получены формулы в матричном виде для построения соответствующего B-сплайна. Подробно показано, как следует заполнять такие матрицы. Приведен пример использования математического метода восстановления функции по данным редких событий и получения прогноза будущих событий.
В статье представлен метод определения неизвестных параметров процесса, формирующего редкие события в экономике. Редкие события рассматриваются не со статистической точки зрения, а с точки зрения процессов, которые образуют эти события. Причем процесс образования редких событий может быть задан произвольным алгоритмом. Такой процесс также будет использовать неизвестные параметры, которые могут быть не только статическими, но и динамическими. Например, если рассматривать процесс потребления, в результате которого образуются дискретные покупки неподконтрольными нам покупателями, то такими параметрами могут быть максимальный запас и динамически изменяющаяся скорость потребления. В общем виде процесс может быть произвольным и его могут описывать различные параметры. Задача состоит в нахождении этих неизвестных параметров процесса, ориентируясь только на выборку редких событий. Идея метода — минимизация функции потерь, которая определяется на основе различий между событиями, образованными в результате функционирования модели процесса, и событиями из исходной выборки наблюдений. Каждое событие, помимо времени появления, характеризуется еще и дополнительной информацией, например объемом покупки. Необходимо найти такие значения параметров процесса, которые позволяли бы получить очень похожую выборку событий. Динамические параметры процесса задаются в виде кубических сплайнов особой структуры. Для однозначного описания каждого динамического параметра в целевую функцию вносится штраф за чрезмерную гладкость (шероховатость) соответствующих сплайнов. Приведен пример процесса и структура его параметров, подлежащая определению. Оптимизация происходит численными методами, за основу берется алгоритм Нелдера–Мида, который запускается на сетке, чтобы найти глобальный оптимум. Параметры процесса определяются по шагам, в начале только чтобы получить несколько событий, необходимых для продолжения расчетов, потом следующая группа событий и т.д., это позволяет большую оптимизационную задачу разбить на последовательность простых задач, что существенно снижает общую трудоемкость. Описано предположение, которое должно соблюдаться, чтобы такой прием был справедлив. Рассмотрен пример выявления неизвестных параметров на примере процесса потребления. Определив параметры процесса, можно переходить к экстраполяции и осуществлять прогноз будущих событий.
Scopus
Crossref
Высшая аттестационная комиссия
При Министерстве образования и науки Российской Федерации
Научная электронная библиотека