Создание цифровых двойников на основе семантических моделей
Цифровой двойник – это компьютерная модель реального объекта, которая в существенных аспектах воспроизводит внутренние процессы и поведение объекта во взаимодействии с окружающей средой.
Такие модели имеют свою специфику, которая состоит в:
- моделировании объектов с разных точек зрения – функциональной структуры, структурной схемы (конструкции), эксплуатационных параметров (режим работы, показания датчиков), экономических параметров (расход ресурсов, износ и др.);
- необходимости расширять модель по ходу эксплуатации системы;
- необходимости обрабатывать большой объем поступающих данных о текущем состоянии объекта;
- необходимость хранить историю состояния объекта для анализа.
Из этой специфики вытекают особые требования к информационным моделям, предназначенным для создания цифровых двойников. Эти требования можно разбить на несколько групп:
1. Построить модель и управлять ей
- Моделировать разные аспекты объекта, с разных точек зрения
- Управлять моделью по ходу работы системы
- Обеспечить интероперабельность моделей, опираться на стандарты
2. Собрать данные и привести в соответствие с моделью
- Интегрировать данные из разных источников, подключать новые источники, используя правила соответствия структуры данных модели и источников
- По возможности избежать материализации данных, получать их «на лету»
- Данные, которые нужно материализовать – хранить в хранилищах, соответствующих специфике данных (временные ряды, схемы связей)
- Хранить всю историю состояний модели
3. Реализовать алгоритмы моделирования
- Управлять алгоритмами моделирования по мере появления новых данных, расширения знаний о моделируемом объекте
- Валидировать поступающие данные
- Обеспечить верифицируемость данных (provenance).
Для выполнения этих требований мы предлагаем использовать несколько ключевых технологий и архитектурных принципов:
- Онтологическое моделирование
- Логическая витрина данных
- Виртуализация данных
- Правила логического вывода и функции
Принципиальные преимущества онтологий для реализации перечисленных требований состоят в следующем:
- Онтологии позволяют справиться с описанием структуры данных любой сложности и менять структуру данных по ходу работы системы;
- Строить структуру данных на основе концептуальных представлений бизнес-пользователей, не учитывая специфику физических схем хранения данных в тех или иных БД;
- Обеспечить выполнение правил логической обработки данных для форматно-логического контроля и обогащения данных.
Примером использования онтологий для создания средств обработки промышленных данных в реальном времени (в том числе мониторинга состояния турбин электростанций) может служить европейский проект Optique. Проект выполнялся в 2012-2017 годах партнерами из индустрии (включая Siemens и Statoil) и научными центрами. Прирост данных в пилотном проекте составлял 30 Гб в день, весь массив данных для анализа – 1000 Тб, размещенных в 2000 таблиц в СУБД.
"Родным" способом хранения данных в соответствии с онтологиями являются графовые СУБД. Они очень мощны с функциональной точки зрения, но не подходят для хранения данных реального времени, а следовательно – не пригодны для использования в реализации цифровых двойников. Мы создали платформу АрхиГраф для того, чтобы объединить мощь онтологических/графовых средств работы с данными с надежностью и масштабируемостью традиционных типов хранилищ информации. АрхиГраф содержит инструменты работы с данными, структура которых соответствует онтологии. При этом хранение данных может осуществляться практически в любом noSQL-хранилище или реляционной СУБД.
Платформа АрхиГраф может использоваться как основа для создания цифровых двойников физических и нематериальных объектов и систем, выполняя все перечисленные выше функциональные требования.