4 Банк данных Цифрового Двойника

4.1 Назначение

Банк данных ЦД содержит наборы данных с показателями и параметрами города, позволяющими решать задачи мониторинга, анализа и оценки, прогнозирования и планирования развития территорий.

Аналитически-выверенные наборы данных по социально-экономическому и пространственному развитию предназначены для повышения достоверности аналитических материалов и оценки результативности проектов государственных решений.

4.2 Описание банка данных

Регулярно-актуализируемые аналитически-выверенные наборы машиночитаемых данных «Банк данных Цифровой Двойник города» включают в себя 174 млн. значений показателей и параметров социально-экономического развития (23 Гб).

Банк данных включает в себя следующие разделы:

  • Справочные данные
  • Показатели социально-экономического развития (СЭР) территорий
  • Матрицы социально-экономических связей (структурные данные)
  • Банк инвестиционных проектов, с технико-экономическими показателями и социально-экономическими эффектами инвестиционных проектов (управленческих решений), портфелей и программ

Показатели представлены в следующих аналитических измерениях:

  • Территории: страна, федеральный округ, регион, агломерация, муниципальное образование, муниципалитет, адресный объект
  • Временные периоды (годы, в том числе начала и окончания проектов)
  • Показатели (демографические, экономические, социальные и пр.; базовые, относительные и обобщающие; накопительные, мгновенные и приросты)
    • для экономических показателей: отрасли и бюджетные статьи
    • для демографических показателей: половозрастная структура
  • Сценарии (фактические, восстановленные, расчетные, целевые, медианные)
  • Версии: указывающие на дату загрузки и расчета
  • Источники и получатели данных

Фактические и восстановленные показатели социально-экономического развития служат основой для расчета (калибровки) следующих матриц социально-экономических связей:

  • мультипликаторов (межотраслевые балансы),
  • напряженности (межтерриториальные балансы),
  • корреляционных (чувствительности),
  • обращения показателей в собственные вектора и главные компоненты, обеспечивающих связность и непротиворечивость показателей.

Подготовленные матрицы используются для построения прогнозов, проведения анализа «что, если» и «что надо, чтобы», оценки влияния, формирования согласованных параметров планов развития.

Наборы данных собираются из открытых источников и содержат наборы фактических значений показателей СЭР с 2000 года (для регионов), с 2009 года (для муниципалитетов), с 2012 года (для отраслевых покзаталей) и сценарии прогнозных показателе по 2050 годы * Российской Федерации в целом
* 85 регионам (субъектам РФ)
* 2300 муниципальным образованиям
* 1200 городов
* 22000 поселений
* 128 отраслям

4.3 Состав наборов данных

4.3.1 Модель данных

Хранение данных в Банке данных ЦД организовано по следующей логической модели, реализованной в СУБД PostgreDB и используется при работе Конвеера по подготовке и актуализации Цифровых Двойников территорий.

Хранение эталонных значений (блоки синего цвета - фактографические таблицы), включают набор ключей из справочных таблиц (блоки зеленого цвета) и значений. Хранение разбито на 3 блока:

  • демографические факты,
  • экономические факты,
  • социальные и прочие факты (в том. числе факты по инфраструктурному обеспечению).

Хранение исходных, промежуточных и результирующих наборов данных (поддерживаемых в Конвеере) реализуюет принципы хранения эталонных значений (составной ключ - значение).

Модель данных Банка данных ЦД

4.3.2 Справочные данные

Хранение справочных данных реализовано в СУБД PostgreDB и

Справочные таблицы содержат атрибутивный состав отдельных ключей и включают в себя следующие каталоги:

  1. Показателей (indicator)
  2. Территорий (location)
  3. Отраслей (okved)
  4. Возрастов (age)
  5. Пола (sex)
  6. Cценариев (scenario)
  7. Временных периодов (time)
  8. Признака принадлежности к экономике малых и средних предприятий (msp)
  9. Едениц измерения (unit)

Справочник показателей содержит информацию о базовых, относительных и обобщающих показателях социально-эконономическог развития и природно-антропогенного состояния.

Справочник территорий базируется на общероссийских классификаторах административно-территориального деления и муниципальных образований.

Справочник отраслей базируется на общероссийском классификаторе видов экономической деятельности.

Количественный состав справочных данных:
Справочник Записей Атрибуты
1 Индикаторы 1271 id, long_name, description, short_name, fact_type, code, unit_id, indicator_type_id, boo_code, en_long_name, hide, short_name2, esg, sd_model, rg_model, id_rosstat
2 Территории 120885 id, long_name, description, oktmo, okato, long_name_eng, stage, type, agglomeration, hide, region, actual, join_city, latitude, longitude, 100city, tz2022, parent, iso_country, sys_nuts, osm_level, complex_id, synonyms, currency, country3code
3 Отраслей 860 id, okved, industry_geoveb, lvl1, lvl2, mob_61, mob_210, short_name, description, long_name, description_eng, industry_name_geoveb, gui_group, target2021, mob2021, short_name2
4 Возрастные группы 130 id, long_name, description, unique_name

4.3.3 Базовые показатели СЭР

4.3.3.1 Региональные показатели

Региональные показатели социально-экономического и отраслевого развития, основанные на данных Росстата (федеральная и региональная статистика), Федеральная налоговая служба (Бухгалтерские балансы), Федеральная таможенная служба (экспорт-импорт), в том числе:

  • Фактические значения (74 тыс. макроэкономических, 1,3 млн. отраслевых) по следующим группам показателей:
    • демографических (показателей - 8 шт.)
    • экономических (показателей - 63 шт.)
    • социальных и прочих (показателей - 19 шт.)
Регион Показатель Год Значение ОТКМО Код показателя
Республика Бурятия Число умерших 2008 12948 81000000 C035
Чукотский автономный округ Общая площадь жилых помещений 2010 1530518.4 77000000 C149
Калининградская область Расходы городского бюджета, в том числе: Дорожное хозяйство (дорожные фонды) 2019 15718 27000000 C074
Республика Ингушетия Нематериальные активы (На отчетную дату отчетного периода) 2018 44.31 26000000 C401
Республика Коми Затраты на охрану окружающей среды 2008 2653.47 87000000 C106
Тамбовская область Денежные доходы населения на 1 жителя 2018 200044.5 68000000 C712
Сахалинская область Инвестиции в осн. капитал осуществляемые организациями (без мал. бизнеса) 2012 164027.79 64000000 C087
  • Расчетные показатели (21,4 млн. штук) социально-экономического развития (удельные, обобщающие, комплексные), национальных целей и целей национальных проектов (показателей – 143 шт.)
Регион Показатель Год Значение ОТКМО Код показателя
  • Временной аналитический срез 2000-2021 годы (факт), 2020-2050 годы (инерционный и инвестиционный прогнозы)
  • Половозрастная структура и оценка миграционных потоков (включая маятниковую миграцию) для демографических показателей
  • Отраслевой аналитический срез - 85 ОКВЭД (1 уровня), 128 ОКВЭД (2 уровня)
Регион Отрасль Показатель Год Значение ОТКМО ОКВЭД КодПоказателя
Республика Саха (Якутия) Деятельность по предоставлению продуктов питания и напитков Затраты организаций 2030 1497.88 98000000 56 C994
Рязанская область Производство прочих пищевых продуктов Конечное потребление 2025 9044.64 61000000 10.8 C952
Ленинградская область Переработка и консервирование рыбы, ракообразных и моллюсков Конечное потребление, обеспеченное выпуском согласно данных бухбалансов 2024 1000.15 41000000 10.2 C1047
Саратовская область Добыча металлических руд Промежуточный спрос 2030 1908.37 63000000 07 C774
Республика Алтай Производство красок, лаков и аналогичных материалов для нанесения покрытий, полиграфических красок и мастик Валовое накопление капитала 2025 0 84000000 20.3 C809
Алтайский край Строительство инженерных сооружений Полная себестоимость 2028 22187.06 01000000 42 C711
  • Муниципальный аналитический срез – 2300 муниципальных образований
  • Сценарный аналитический срез – инерционный сценарий, инвестиционный сценарий (с учетом влияния инвестиционных проектов и программ, доступных в банке инвестиционных проектов) социально-экономического развития территорий
    scenario indicator_name region year value location indicator
    invest Growth of household earnings Region 1 2023 0.04 77000000 C003

4.3.3.2 Муниципальные показатели

Муниципальные показатели (291 шт), агрегируемые до регионального уровня из базы муниципальной статистики Росстата и бухгалтерских балансов ФНС, в том числе:

  • Фактические значения (16 млн. макроэкономических и 24,4 млн. отраслевых) по следующим группам показателей:
    • демографических (показателей - 33 шт.)
    • экономических (показателей - 142 шт.)
    • социальным и прочим (показателей - 69 шт.)

Пример муниципальных показателей * Расчетные показатели (21,4 млн. штук) социально-экономического развития (удельные, обобщающие, комплексные), национальных целей и целей национальных проектов (показателей – 143 шт.) * Временной аналитический срез 2009-2021 годы (факт), 2020-2050 годы (инерционный и инвестиционный прогнозы)

Прогнозные значения муниципальных показателей * Половозрастная структура и оценка миграционных потоков (включая маятниковую миграцию) для демографических показателей

Структурные значения * Отраслевой аналитический срез - 85 ОКВЭД (1 уровня), 128 ОКВЭД (2 уровня) * Муниципальный аналитический срез – 24221 поселений * Сценарный аналитический срез – инерционный сценарий, инвестиционный сценарий (с учетом влияния инвестиционных проектов и программ, доступных в банке инвестиционных проектов)

4.3.4 Матрицы социально-экономических связей

Матрицы социально-экономических связей предназначены для формирования анализа и оценки, прогноза, сценарного планирования.

Матрицы позволяют оперативно просчитывать множество сценариев, оценивать межотраслевое, межтерриториальное влияние управленческих решений (инвестиционных проектов и регуляторных решений) на социально-экономическое развитие

  • Региональные (85 шт) и муниципальные (128 шт) матрицы межотраслевого баланса по 128 ОКВЭД 2го уровня за фактические (2016-2021 годы) и на прогнозный период (2022-2040) для расчета межотраслевых и межтерриториальных эффектов, включая таблицы:
    • Ресурсов товаров и услуг
    • Использования товаров и услуг в ценах покупателей
    • Использования товаров и услуг в основных ценах
    • Использования отечественной продукции в основных ценах
    • Использования импортной продукции
    • Торгово-транспортных наценок
    • Налогов (за вычетом субсидий) на продукты
    • Матрица мультипликаторов (производственно-технологических коэффициентов)
  • Межтерриториальные балансы, включающие оценки направлений пассажиропотока, грузопотока, экспорта и импорта.
  • Корреляционные матрицы (матрицы чувствительности) для проведения сценарных расчетов влияния управленческих решений на динамику показателей социально-экономического развития – включают оценку влияния базовых показателей (30 шт. х 30 шт), характеризующих социально-экономическое развитие на 2020-2050 годы.
  • Матрицы обращения (взаимовлияния через главные компоненты и/или собственные вектора) показателей (291 шт х 7 шт х 291 шт), позволяющие оценивать влияние сценарного изменения любого показателя (с учетом аналитического разреза) из банка данных на изменение всех показателей на среднесрочном (3-5 лет) и долгосрочном (5-30 лет) периодах.

4.3.5 Банк управленческих решений

В перечень управленческих решений, по котором на сегодня возможно проведение оценки влияния на инерционное развитие территорий, с помощью его цифрового двойника являются:

  • Изменение параметров денежно-кредитной политики, в том числе (индекс потребительских цен, ставка рефинансирования, величина налогов)
  • Параметры стратегий и прогнозов социально-экономического и отраслевого развития
  • Планы и программы развития территорий и отраслей
  • Отраслевые схемы
  • Инвестиционные проекты, портфели и программы

На текущий момен собран и оценен портфель инвестиционных проектов, включающий в себя сведения о инвестиционных проектах (46 тыс.), проводимых с 2002 по 2025 годы, преимуществено с использованием средств федерального бюджета.

Источниками данных является:

  • ФАИП,
  • Электронный бюджет,
  • Инвестиционные решения,
  • Инвестиционные проекты финансовых институтов

Исходные данные по инвестиционному проекту инвестиционных решений могут содержать следующие характеристики:

  • объемы и источники финансирования,
  • расположение объектов финансирования,
  • тип объекта капитального строительства,
  • адрес,
  • годы начала и окончания проекта.

Расчетные показатели (146 шт.) инвестиционных проектов включают оценку показателей финансового потока проекта (базируясь на медианных значениях целевого региона), оценку влияния на динамику показателей социально-экономического развития.

4.4 Услуга по подписке на наборы данных

Услуга по подписке включает в себя выполнение следующих регулярных (ежеквартальных) работ:

  • Подготовка данных
    • Получение программного доступа к внешним источникам данных с показателями социально-экономического и пространственного развития
    • Профилирование источников первичных данных
    • Скачивание и распознавание исходных данных
    • Подтверждение полноты первичных данных из источников
    • Ведение справочников (показателей, аналитических измерений, сценариев, версий, стадий обработки), моделей данных источников и получателей, а также таблиц соответствия, с учетом изменений во времени.
    • Документирование изменений в составе и структуре источников и получателей данных
    • Документирование изменений в методе учета показателей
  • Обработка данных
    • Устранение технических ошибок в форматах первичных данных, в том числе именовании полей, форматах значений, сдвигов рядов данных, пропусков в аналитических срезах данных
    • Агрегация скачанных первичных данных и приведение к эталонной структуре
    • Выявление изменений в первичных данных, в том числе задним числом, в том числе в структуре данных, справочниках и фактических значениях
    • Восстановление пропусков, устранение дублирования данных
    • Валидация и предложений по корректировке значений показателей эконометрическими методами по набору правил, в том числе
    • удовлетворению балансовым соотношениям,
    • нахождению в коридоре допустимых интервалов,
    • удовлетворению соотношениям главным компонентам (собственным векторам)
  • Предоставление данных
    • Создание и поддержка программного интерфейса (REST API) к справочникам, наборам первичных и аналитически-выверенных данных
    • Выгрузка наборов значений и справочных данных в форматах данных csv, xlsx, parquet, qs, fst
  • Документирование процессов сбора, обработки и предоставления
    • Проставление сценариев (факт, оценка, прогноз, план, сценарий, цель), стадий (исходный, исправленный, откорректированный, номер стадии), версий и методов учета значений показателей – необходимой для правильной интерпретации и трассировки значений показателей
    • Ведение библиотеки методов проверки, правил верификации и валидации значений показателей
    • Подготовка интерактивного отчета по объему, полноте и выявленных ошибках.

Вопросы и предложения

Все права принадлежат ООО “Цифровой Двойник”
All rights reserved Digital twin LLC