4 Банк данных Цифрового Двойника
4.1 Назначение
Банк данных ЦД содержит наборы данных с показателями и параметрами города, позволяющими решать задачи мониторинга, анализа и оценки, прогнозирования и планирования развития территорий.
Аналитически-выверенные наборы данных по социально-экономическому и пространственному развитию предназначены для повышения достоверности аналитических материалов и оценки результативности проектов государственных решений.
4.2 Описание банка данных
Регулярно-актуализируемые аналитически-выверенные наборы машиночитаемых данных «Банк данных Цифровой Двойник города» включают в себя 174 млн. значений показателей и параметров социально-экономического развития (23 Гб).
Банк данных включает в себя следующие разделы:
- Справочные данные
- Показатели социально-экономического развития (СЭР) территорий
- Матрицы социально-экономических связей (структурные данные)
- Банк инвестиционных проектов, с технико-экономическими показателями и социально-экономическими эффектами инвестиционных проектов (управленческих решений), портфелей и программ
Показатели представлены в следующих аналитических измерениях:
- Территории: страна, федеральный округ, регион, агломерация, муниципальное образование, муниципалитет, адресный объект
- Временные периоды (годы, в том числе начала и окончания проектов)
- Показатели (демографические, экономические, социальные и пр.; базовые, относительные и обобщающие; накопительные, мгновенные и приросты)
- для экономических показателей: отрасли и бюджетные статьи
- для демографических показателей: половозрастная структура
- Сценарии (фактические, восстановленные, расчетные, целевые, медианные)
- Версии: указывающие на дату загрузки и расчета
- Источники и получатели данных
Фактические и восстановленные показатели социально-экономического развития служат основой для расчета (калибровки) следующих матриц социально-экономических связей:
- мультипликаторов (межотраслевые балансы),
- напряженности (межтерриториальные балансы),
- корреляционных (чувствительности),
- обращения показателей в собственные вектора и главные компоненты, обеспечивающих связность и непротиворечивость показателей.
Подготовленные матрицы используются для построения прогнозов, проведения анализа «что, если» и «что надо, чтобы», оценки влияния, формирования согласованных параметров планов развития.
Наборы данных собираются из открытых источников и содержат наборы фактических значений показателей СЭР с 2000 года (для регионов), с 2009 года (для муниципалитетов), с 2012 года (для отраслевых покзаталей) и сценарии прогнозных показателе по 2050 годы
* Российской Федерации в целом
* 85 регионам (субъектам РФ)
* 2300 муниципальным образованиям
* 1200 городов
* 22000 поселений
* 128 отраслям
4.3 Состав наборов данных
4.3.1 Модель данных
Хранение данных в Банке данных ЦД организовано по следующей логической модели, реализованной в СУБД PostgreDB и используется при работе Конвеера по подготовке и актуализации Цифровых Двойников территорий.
Хранение эталонных значений (блоки синего цвета - фактографические таблицы), включают набор ключей из справочных таблиц (блоки зеленого цвета) и значений. Хранение разбито на 3 блока:
- демографические факты,
- экономические факты,
- социальные и прочие факты (в том. числе факты по инфраструктурному обеспечению).
Хранение исходных, промежуточных и результирующих наборов данных (поддерживаемых в Конвеере) реализуюет принципы хранения эталонных значений (составной ключ - значение).
4.3.2 Справочные данные
Хранение справочных данных реализовано в СУБД PostgreDB и
Справочные таблицы содержат атрибутивный состав отдельных ключей и включают в себя следующие каталоги:
- Показателей (indicator)
- Территорий (location)
- Отраслей (okved)
- Возрастов (age)
- Пола (sex)
- Cценариев (scenario)
- Временных периодов (time)
- Признака принадлежности к экономике малых и средних предприятий (msp)
- Едениц измерения (unit)
Справочник показателей содержит информацию о базовых, относительных и обобщающих показателях социально-эконономическог развития и природно-антропогенного состояния.
Справочник территорий базируется на общероссийских классификаторах административно-территориального деления и муниципальных образований.
Справочник отраслей базируется на общероссийском классификаторе видов экономической деятельности.
Количественный состав справочных данных:№ | Справочник | Записей | Атрибуты |
---|---|---|---|
1 | Индикаторы | 1271 | id, long_name, description, short_name, fact_type, code, unit_id, indicator_type_id, boo_code, en_long_name, hide, short_name2, esg, sd_model, rg_model, id_rosstat |
2 | Территории | 120885 | id, long_name, description, oktmo, okato, long_name_eng, stage, type, agglomeration, hide, region, actual, join_city, latitude, longitude, 100city, tz2022, parent, iso_country, sys_nuts, osm_level, complex_id, synonyms, currency, country3code |
3 | Отраслей | 860 | id, okved, industry_geoveb, lvl1, lvl2, mob_61, mob_210, short_name, description, long_name, description_eng, industry_name_geoveb, gui_group, target2021, mob2021, short_name2 |
4 | Возрастные группы | 130 | id, long_name, description, unique_name |
4.3.3 Базовые показатели СЭР
4.3.3.1 Региональные показатели
Региональные показатели социально-экономического и отраслевого развития, основанные на данных Росстата (федеральная и региональная статистика), Федеральная налоговая служба (Бухгалтерские балансы), Федеральная таможенная служба (экспорт-импорт), в том числе:
- Фактические значения (74 тыс. макроэкономических, 1,3 млн. отраслевых) по следующим группам показателей:
- демографических (показателей - 8 шт.)
- экономических (показателей - 63 шт.)
- социальных и прочих (показателей - 19 шт.)
Регион | Показатель | Год | Значение | ОТКМО | Код показателя |
---|---|---|---|---|---|
Республика Бурятия | Число умерших | 2008 | 12948 | 81000000 | C035 |
Чукотский автономный округ | Общая площадь жилых помещений | 2010 | 1530518.4 | 77000000 | C149 |
Калининградская область | Расходы городского бюджета, в том числе: Дорожное хозяйство (дорожные фонды) | 2019 | 15718 | 27000000 | C074 |
Республика Ингушетия | Нематериальные активы (На отчетную дату отчетного периода) | 2018 | 44.31 | 26000000 | C401 |
Республика Коми | Затраты на охрану окружающей среды | 2008 | 2653.47 | 87000000 | C106 |
Тамбовская область | Денежные доходы населения на 1 жителя | 2018 | 200044.5 | 68000000 | C712 |
Сахалинская область | Инвестиции в осн. капитал осуществляемые организациями (без мал. бизнеса) | 2012 | 164027.79 | 64000000 | C087 |
- Расчетные показатели (21,4 млн. штук) социально-экономического развития (удельные, обобщающие, комплексные), национальных целей и целей национальных проектов (показателей – 143 шт.)
Регион | Показатель | Год | Значение | ОТКМО | Код показателя |
---|
- Временной аналитический срез 2000-2021 годы (факт), 2020-2050 годы (инерционный и инвестиционный прогнозы)
- Половозрастная структура и оценка миграционных потоков (включая маятниковую миграцию) для демографических показателей
- Отраслевой аналитический срез - 85 ОКВЭД (1 уровня), 128 ОКВЭД (2 уровня)
Регион | Отрасль | Показатель | Год | Значение | ОТКМО | ОКВЭД | КодПоказателя |
---|---|---|---|---|---|---|---|
Республика Саха (Якутия) | Деятельность по предоставлению продуктов питания и напитков | Затраты организаций | 2030 | 1497.88 | 98000000 | 56 | C994 |
Рязанская область | Производство прочих пищевых продуктов | Конечное потребление | 2025 | 9044.64 | 61000000 | 10.8 | C952 |
Ленинградская область | Переработка и консервирование рыбы, ракообразных и моллюсков | Конечное потребление, обеспеченное выпуском согласно данных бухбалансов | 2024 | 1000.15 | 41000000 | 10.2 | C1047 |
Саратовская область | Добыча металлических руд | Промежуточный спрос | 2030 | 1908.37 | 63000000 | 07 | C774 |
Республика Алтай | Производство красок, лаков и аналогичных материалов для нанесения покрытий, полиграфических красок и мастик | Валовое накопление капитала | 2025 | 0 | 84000000 | 20.3 | C809 |
Алтайский край | Строительство инженерных сооружений | Полная себестоимость | 2028 | 22187.06 | 01000000 | 42 | C711 |
- Муниципальный аналитический срез – 2300 муниципальных образований
- Сценарный аналитический срез – инерционный сценарий, инвестиционный сценарий (с учетом влияния инвестиционных проектов и программ, доступных в банке инвестиционных проектов) социально-экономического развития территорий
scenario indicator_name region year value location indicator invest Growth of household earnings Region 1 2023 0.04 77000000 C003
4.3.3.2 Муниципальные показатели
Муниципальные показатели (291 шт), агрегируемые до регионального уровня из базы муниципальной статистики Росстата и бухгалтерских балансов ФНС, в том числе:
- Фактические значения (16 млн. макроэкономических и 24,4 млн. отраслевых) по следующим группам показателей:
- демографических (показателей - 33 шт.)
- экономических (показателей - 142 шт.)
- социальным и прочим (показателей - 69 шт.)
* Расчетные показатели (21,4 млн. штук) социально-экономического развития (удельные, обобщающие, комплексные), национальных целей и целей национальных проектов (показателей – 143 шт.) * Временной аналитический срез 2009-2021 годы (факт), 2020-2050 годы (инерционный и инвестиционный прогнозы)
* Половозрастная структура и оценка миграционных потоков (включая маятниковую миграцию) для демографических показателей
* Отраслевой аналитический срез - 85 ОКВЭД (1 уровня), 128 ОКВЭД (2 уровня) * Муниципальный аналитический срез – 24221 поселений * Сценарный аналитический срез – инерционный сценарий, инвестиционный сценарий (с учетом влияния инвестиционных проектов и программ, доступных в банке инвестиционных проектов)
4.3.4 Матрицы социально-экономических связей
Матрицы социально-экономических связей предназначены для формирования анализа и оценки, прогноза, сценарного планирования.
Матрицы позволяют оперативно просчитывать множество сценариев, оценивать межотраслевое, межтерриториальное влияние управленческих решений (инвестиционных проектов и регуляторных решений) на социально-экономическое развитие
- Региональные (85 шт) и муниципальные (128 шт) матрицы межотраслевого баланса по 128 ОКВЭД 2го уровня за фактические (2016-2021 годы) и на прогнозный период (2022-2040) для расчета межотраслевых и межтерриториальных эффектов, включая таблицы:
- Ресурсов товаров и услуг
- Использования товаров и услуг в ценах покупателей
- Использования товаров и услуг в основных ценах
- Использования отечественной продукции в основных ценах
- Использования импортной продукции
- Торгово-транспортных наценок
- Налогов (за вычетом субсидий) на продукты
- Матрица мультипликаторов (производственно-технологических коэффициентов)
- Межтерриториальные балансы, включающие оценки направлений пассажиропотока, грузопотока, экспорта и импорта.
- Корреляционные матрицы (матрицы чувствительности) для проведения сценарных расчетов влияния управленческих решений на динамику показателей социально-экономического развития – включают оценку влияния базовых показателей (30 шт. х 30 шт), характеризующих социально-экономическое развитие на 2020-2050 годы.
- Матрицы обращения (взаимовлияния через главные компоненты и/или собственные вектора) показателей (291 шт х 7 шт х 291 шт), позволяющие оценивать влияние сценарного изменения любого показателя (с учетом аналитического разреза) из банка данных на изменение всех показателей на среднесрочном (3-5 лет) и долгосрочном (5-30 лет) периодах.
4.3.5 Банк управленческих решений
В перечень управленческих решений, по котором на сегодня возможно проведение оценки влияния на инерционное развитие территорий, с помощью его цифрового двойника являются:
- Изменение параметров денежно-кредитной политики, в том числе (индекс потребительских цен, ставка рефинансирования, величина налогов)
- Параметры стратегий и прогнозов социально-экономического и отраслевого развития
- Планы и программы развития территорий и отраслей
- Отраслевые схемы
- Инвестиционные проекты, портфели и программы
На текущий момен собран и оценен портфель инвестиционных проектов, включающий в себя сведения о инвестиционных проектах (46 тыс.), проводимых с 2002 по 2025 годы, преимуществено с использованием средств федерального бюджета.
Источниками данных является:
- ФАИП,
- Электронный бюджет,
- Инвестиционные решения,
- Инвестиционные проекты финансовых институтов
Исходные данные по инвестиционному проекту инвестиционных решений могут содержать следующие характеристики:
- объемы и источники финансирования,
- расположение объектов финансирования,
- тип объекта капитального строительства,
- адрес,
- годы начала и окончания проекта.
Расчетные показатели (146 шт.) инвестиционных проектов включают оценку показателей финансового потока проекта (базируясь на медианных значениях целевого региона), оценку влияния на динамику показателей социально-экономического развития.
4.4 Услуга по подписке на наборы данных
Услуга по подписке включает в себя выполнение следующих регулярных (ежеквартальных) работ:
- Подготовка данных
- Получение программного доступа к внешним источникам данных с показателями социально-экономического и пространственного развития
- Профилирование источников первичных данных
- Скачивание и распознавание исходных данных
- Подтверждение полноты первичных данных из источников
- Ведение справочников (показателей, аналитических измерений, сценариев, версий, стадий обработки), моделей данных источников и получателей, а также таблиц соответствия, с учетом изменений во времени.
- Документирование изменений в составе и структуре источников и получателей данных
- Документирование изменений в методе учета показателей
- Обработка данных
- Устранение технических ошибок в форматах первичных данных, в том числе именовании полей, форматах значений, сдвигов рядов данных, пропусков в аналитических срезах данных
- Агрегация скачанных первичных данных и приведение к эталонной структуре
- Выявление изменений в первичных данных, в том числе задним числом, в том числе в структуре данных, справочниках и фактических значениях
- Восстановление пропусков, устранение дублирования данных
- Валидация и предложений по корректировке значений показателей эконометрическими методами по набору правил, в том числе
- удовлетворению балансовым соотношениям,
- нахождению в коридоре допустимых интервалов,
- удовлетворению соотношениям главным компонентам (собственным векторам)
- Предоставление данных
- Создание и поддержка программного интерфейса (REST API) к справочникам, наборам первичных и аналитически-выверенных данных
- Выгрузка наборов значений и справочных данных в форматах данных csv, xlsx, parquet, qs, fst
- Документирование процессов сбора, обработки и предоставления
- Проставление сценариев (факт, оценка, прогноз, план, сценарий, цель), стадий (исходный, исправленный, откорректированный, номер стадии), версий и методов учета значений показателей – необходимой для правильной интерпретации и трассировки значений показателей
- Ведение библиотеки методов проверки, правил верификации и валидации значений показателей
- Подготовка интерактивного отчета по объему, полноте и выявленных ошибках.
Все права принадлежат ООО “Цифровой Двойник”
All rights reserved Digital twin LLC