Участие в конференции «Управление данными — 2024»
29 сентября 2024
26 сентября эксперты компании ТриниДата приняли участие в конференции «Управление данными — 2024», организованной издательством «Открытые системы». Если сказать кратко, то по сравнению с прошлым годом стало больше отсылок к методологии управления данными и больше упоминаний про онтологии. Теперь подробнее.
В докладах спикерами выделяются основные сферы управления данными, которые необходимы для качественного их использования:
- Управление данными (Data Management): в этой связи говорят про методологии управления данными (чаще всего — DMBOK), возможности формирования отчётности и обеспечения инфраструктуры для работы с данными.
- Контроль данных (Data Governance): то, что обеспечивает возможность доверия к данным, в частности контроль качества, метаданные, происхождение и владельцы данных.
- Доступность данных (Data Accessibility): возможность использования данных, куда входит как поиск, архивирование и приобретение данных, так и модель для управления данными.
Как отмечали коллеги, MDM-системы помогают контролировать данные и делать их доступными. Актуальные для спикеров аспекты функционирования MDM-систем можно представить в такой таблице:
| Аспект | Функция MDM | Технологии |
| Управление метаданными | Версионирование | Git |
| История данных | Lineage graph | |
| Метаданные | Теории и схемы метаданных | |
| Контроль качества | Заявки на изменения | Маршруты согласования |
| Дедубликация | Rule-based, ML-based | |
| Нормализация | ||
| Поддержка актуальности данных | Наполнение | Rule-based, ML-based, LLM-based, адаптеры |
| Архивирование | Регламентное | |
| Доступ к данным | Поиск | Полнотекстовый, нечёткий, сквозной |
| Права пользователей | Реестр пользователей | |
| Управление моделью данных | Целостность | Авто- и ручные проверки |
| Согласованность | Автопроверки |
Применительно к платформе АрхиГраф можно говорить о следующем распределении функциональных блоков:
Большая часть этих блоков так или иначе представлена в платформе АрхиГраф каким-либо исполняемым кодом: адаптерами, сервисами, ядром платформы. При этом мы стремимся, чтобы функционированием всех блоков управляли онтологические модели: ими мы обеспечиваем и модели данных и метаданных, и часть настроек информационных систем, и — в перспективе — функционирование адаптеров для извлечения данных.