ОБЪЕДИНЕНИЕ ПОДХОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ И ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ ДОХОДОВ БЮДЖЕТА

Рассмотрено проведение статистического анализа параметров бюджетного процесса для прогнозирования доходов бюджета и модернизации мультиагентной имитационной модели муниципального образования г. Екатеринбурга.

Введение.

Существует множество путей прогнозирования социально-экономического развития (СЭР). Рассмотрим следующие: имитационное моделирование; анализ временных рядов; регрессионный анализ.

Логика функционирования базовых моделей агентов имитационной модели СЭР муниципального образования (МО) может определяться изнутри (на уровне отдельного объекта) (локальная модель) и извне (на уровне множества объектов, объединенных на основании определенного признака) (например, модели системной динамики) (глобальная модель).

При обоих подходах используются регрессионные зависимости, для получения которых необходимы соответствующие статистические данные. Для получения локальных моделей (подход изнутри) требуются статистические данные по всем видам экономических агентов, являющихся источниками доходов бюджета. Эти данные неполные, например отсутствуют статистические данные по имуществу физических лиц. В таких случаях применяется подход «извне».

Источниками регрессионных зависимостей могут быть научные публикации, мнения экспертов и интеллектуальный анализ статистических данных.
Сравним пути прогнозирования доходов бюджета: анализ временных рядов с регрессионным анализом.

При анализе временных рядов исследуется изменение величин во времени. Этот подход основывается на предположении о сохранении динамики, заданной историческими данными.

При регрессионном анализе исследуются показатели системы в различных временных точках без учета их порядка во времени (хотя время может быть одной из переменных). Этот подход полагается на то, что система будет вести себя так же, как и в проанализированных точках.

Иными словами, при анализе временных рядов расчет делается на планомерное развитие системы. При регрессионном анализе учитывается возможность существенного изменения показателей системы (например, резкий спад производства при экономическом кризисе), но при сохранении законов, действующих в системе.

Результатом анализа временных рядов являются значения прогнозируемой величины в будущих моментах времени:
на11
где d — прогнозируемая величина; t — текущий момент времени; (t + 1) — следующий момент времени.
При регрессионном анализе выявляется устойчивая зависимость прогнозируемой величины от других показателей системы:
на12
где P — значения показателей системы.

Прогнозирование доходов бюджета
Рис. 1. Процесс прогнозирования доходов бюджета

Регрессионные зависимости могут использоваться для прогнозирования доходов городского бюджета, однако основным недостатком такого подхода прогнозирования в условиях кризисной ситуации может быть невозможность учёта скрытых факторов взаимного влияния объектов промышленности, городской инфраструктуры, населения МО и внешней среды. Это может быть успешно решено с использованием средств имитационного моделирования данных объектов.

Чтобы использовать зависимость для прогноза доходов бюджета, она интегрируется в имитационную модель СЭР МО (рис. 1) [1, 2]. Имитационная модель является поставщиком изменяющихся во времени значений показателей системы для регрессионной зависимости.

Статьи доходов бюджета.

Часть статей доходов бюджета вычисляется в имитационной модели напрямую из текущих показателей агентов (людей, предприятий). Для некоторых статей это невозможно: для них на основе статистических данных выявляется устойчивая зависимость от показателей СЭР. Безвозмездные перечисления не прогнозируются, так как для каждого года они определяются на основе договорённостей.

Таким образом, статьи доходов бюджета можно разбить на три группы:
1)    налоги с предприятий вычисляются в имитационной модели из показателей агентов-предприятий. На основании данных из системы таблиц «Выпуск—затраты России» существует возможность определить налоговую нагрузку на каждую из отраслей. Таким образом, для предприятий каждой отрасли вычисляется суммарный налог как процент от объёма производства этой отрасли. Объём отчислений в городской бюджет определяется на основании задаваемого экспертом процента отчислений от общей суммы налогов с предприятий, вычисляемой как сумма собираемых налогов с отраслей;

2)  налог на доходы физических лиц вычисляется в имитационной модели (13 % от суммарной заработной платы жителей города);
3) неналоговые доходы и налог на имущество физических лиц (для суммы этих статей доходов бюджета на основе статистических данных выявляется устойчива зависимость от показателей СЭР, и затем она интегрируется в модель).

После получения прогнозируемых значений перечисленных групп доходов бюджета они суммируются. Результатом является прогноз суммарного дохода бюджета, за исключением безвозмездных перечислений.

Интеллектуальный анализ данных.

Временной аспект охватывает статистические данные за период с 1999 по 2007 г. (за 1998 и 2008 гг. данные неполные). В качестве факторов, влияющих на сумму неналоговых доходов и налога на имущество физических лиц на душу населения (y), рассматриваются следующие показатели (xi, где
i    — 1.10 ):
y — сумма неналоговых доходов и налога на имущество физических лиц на душу населения, руб.;
x1 — сопоставимый оборот общественного питания на душу населения, тыс. руб.;
Х2 — число безработных на 1000 человек населения;
x3 — сопоставимые инвестиции в основной капитал на душу населения, тыс. руб.;
Х4 — сопоставимый объём платных услуг на душу населения, тыс. руб.;

х5 — сопоставимая дебиторская задолженность на одну организацию, млн руб.;
Х6 — сопоставимая кредиторская задолженность на одну организацию, млн руб.;
х7 — сопоставимый оборот розничной торговли на душу населения, тыс. руб.;
х8 — вводимое жилье на 1000 человек населения, тыс. м ;
х9 — сопоставимый объем производства на душу населения, тыс. руб.;
Х10 — сопоставимая средняя заработная плата, руб.

При выполнении интеллектуального анализа данных СЭР использовалась версия StatSoft STA- TISTICA 6.1.

С помощью многофакторного анализа выявлены зависимые переменные. В результате отобрана одна независимая значимая переменная, наиболее влияющая на сумму неналоговых доходов и налога на имущество физических лиц на душу населения:   сопоставимая средняя заработная плата, руб.

Регрессионные модели строились с помощью пошаговых алгоритмов включения и исключения переменных. Получена устойчивая нелинейная регрессионная модель:
на14

Уравнение регрессии значимо, так как  Fнабл = 861,59 больше критического значения при уровне значимости p < 0,00001. Указанные в скобках под уравнением регрессии значения больше критического, поэтому все коэффициенты регрессии значимы. Множественный коэффициент детерминации R2 = 0,99079 означает, что 99,079 % вариации у объясняются включенными в модель показателями.

Проверка адекватности модели и прогноз доходов бюджета при стабильном развитии.

Эксперимент включает в себя:
проверку адекватности модели;
прогнозирование доходов бюджета.

В качестве исходных использовались данные статистики за 2006 г. Для отраслей были введены примерные соотношения товаров, производимых на экспорт и для внутреннего рынка, для всех отраслей в качестве экспертной оценки был задан максимальный объем экспорта (спрос внешней среды). Период моделирования составил 10 лет (120 шагов модели).

На рис. 2—5 отображены результаты моделирования (линия «модель»), фактические (линия «факт») и спрогнозированные Министерством экономического развития РФ [3] (линия «прогноз министерства»). Охвачен период с 2006 по 2011 г.

Таким образом, разработанная имитационная модель показывает высокую степень соответствия прогнозируемых показателей и данных статистики.
Заключение. Объединение подходов интеллектуального анализа данных и мультиагентного имитационного моделирования для прогнозирования доходов бюджета позволило учесть скрытые факторы взаимного влияния объектов промышленности, городской инфраструктуры, населения МО и внешней среды и решить проблему недостатка статистических данных по экономическим агентам МО. Разработанный инструмент прогнозирования доходов бюджета позволяет оценивать комплексное влияние внешних и внутренних факторов на развитие социально-экономической ситуации в городе.

Налог на доходы физических лиц

Рис. 2. Налог на доходы физических лиц:
среднее отклонение от факта 1,9 %, среднее отклонение от прогноза 7,5 %

Налоги с предприятий
Рис. 3. Налоги с предприятий:
среднее отклонение от факта 0,7 %

Неналоговые доходы и налог на имущество физических лиц
Рис. 4. Неналоговые доходы и налог на имущество физических лиц:
среднее отклонение от факта 0,9 %

Доходы бюджета, за исключением безвозмездных перечислений

Рис. 5. Доходы бюджета, за исключением безвозмездных перечислений:
среднее отклонение от факта 0,3 %
Библиографические ссылки

1. Прогнозирование развития муниципального образования с использованием имитационной модели. Муниципальные информационные системы: достижения, проблемы, перспективы: Материалы VI Всерос. науч.- практ. конф. Екатеринбург, 25—26 октября 2008 г. Екатеринбург: Изд-во Урал. ун-та, 2009. С. 135—146.

2. Использование результатов Data Mining в мультиагентных имитационных моделях. Науч. тр. между- нар. науч.-практ. конф. «СВЯЗЬ-ПРОМ 2009» в рамках 6-го Междунар. форума «СВЯЗЬ-ПРОМЭКСПО 2009», посвящённого 150- летию со дня рождения изобретателя радио А.С. Попова. Екатеринбург: УрТИСИ ГОУ ВПО «СибГУТИ», 2009. С. 38—40.

3. Министерство экономического развития РФ. Прогноз социально-экономического развития муниципального образования «город Екатеринбург» на 2009 г. и основные параметры прогноза на период до 2011 г. С. 9—28.

________________________

Н.А. Бегунов, Б.И. Клебанов, канд. техн. наук., И.А. Рапопорт
(Уральский государственный технический университет, г. Екатеринбург)

Ключевые слова: интеллектуальный анализ данных, агентная технология, модель знаний, мультиагентные системы, бизнес-аналитика, имитационная модель.

Добавить комментарий

Ваш e-mail не будет опубликован.

*

code