Создание цифровых двойников на основе семантических моделей

Цифровой двойник – это компьютерная модель реального объекта, которая в существенных аспектах воспроизводит внутренние процессы и поведение объекта во взаимодействии с окружающей средой.

Такие модели имеют свою специфику, которая состоит в:

  • моделировании объектов с разных точек зрения – функциональной структуры, структурной схемы (конструкции), эксплуатационных параметров (режим работы, показания датчиков), экономических параметров (расход ресурсов, износ и др.);
  • необходимости расширять модель по ходу эксплуатации системы;
  • необходимости обрабатывать большой объем поступающих данных о текущем состоянии объекта;
  • необходимость хранить историю состояния объекта для анализа.

Из этой специфики вытекают особые требования к информационным моделям, предназначенным для создания цифровых двойников. Эти требования можно разбить на несколько групп:

1. Построить модель и управлять ей

  • Моделировать разные аспекты объекта, с разных точек зрения
  • Управлять моделью по ходу работы системы
  • Обеспечить интероперабельность моделей, опираться на стандарты

2. Собрать данные и привести в соответствие с моделью

  • Интегрировать данные из разных источников, подключать новые источники, используя правила соответствия структуры данных модели и источников
  • По возможности избежать материализации данных, получать их «на лету»
  • Данные, которые нужно материализовать – хранить в хранилищах, соответствующих специфике данных (временные ряды, схемы связей)
  • Хранить всю историю состояний модели

3. Реализовать алгоритмы моделирования

  • Управлять алгоритмами моделирования по мере появления новых данных, расширения знаний о моделируемом объекте
  • Валидировать поступающие данные
  • Обеспечить верифицируемость данных (provenance).

Для выполнения этих требований мы предлагаем использовать несколько ключевых технологий и архитектурных принципов:

Принципиальные преимущества онтологий для реализации перечисленных требований состоят в следующем:

  • Онтологии позволяют справиться с описанием структуры данных любой сложности и менять структуру данных по ходу работы системы;
  • Строить структуру данных на основе концептуальных представлений бизнес-пользователей, не учитывая специфику физических схем хранения данных в тех или иных БД;
  • Обеспечить выполнение правил логической обработки данных для форматно-логического контроля и обогащения данных.

Примером использования онтологий для создания средств обработки промышленных данных в реальном времени (в том числе мониторинга состояния турбин электростанций) может служить европейский проект Optique. Проект выполнялся в 2012-2017 годах партнерами из индустрии (включая Siemens и Statoil) и научными центрами. Прирост данных в пилотном проекте составлял 30 Гб в день, весь массив данных для анализа – 1000 Тб, размещенных в 2000 таблиц в СУБД.

"Родным" способом хранения данных в соответствии с онтологиями являются графовые СУБД. Они очень мощны с функциональной точки зрения, но не подходят для хранения данных реального времени, а следовательно – не пригодны для использования в реализации цифровых двойников. Мы создали платформу АрхиГраф для того, чтобы объединить мощь онтологических/графовых средств работы с данными с надежностью и масштабируемостью традиционных типов хранилищ информации. АрхиГраф содержит инструменты работы с данными, структура которых соответствует онтологии. При этом хранение данных может осуществляться практически в любом noSQL-хранилище или реляционной СУБД.

Платформа АрхиГраф может использоваться как основа для создания цифровых двойников физических и нематериальных объектов и систем, выполняя все перечисленные выше функциональные требования.