АрхиГраф.Логос

АрхиГраф.Логос - компонент платформы АрхиГраф, преобразующий текст на естественном языке в набор фактов или в запрос к графу знаний. Он может применяться в составе Систем управления знаниями как для извлечения фактов из текста документов, так и для преобразования вопросов пользователей системы, заданных на обычном языке, в структурированные запросы к базе знаний.

Обработка текста выполняется при помощи методик NLU (Natural language understanding). Для того, чтобы преобразовать текст в факты или запрос, граф знаний должен включать такие компоненты:

  • Онтологическую модель предметной области, которая описывает концепты, с помощью которых будут выражены факты. Например, чтобы выразить утверждение о том, что некий человек является работником компании, необходимы определения классов "Персона", "Компания" и предиката (свойства-связи) "Работает в". Это - обычная онтология предметной области, которая применяется и для решения любых других задач с помощью онтологического инструментария.
  • Модель лексических единиц, описывающую слова, которыми в языке обозначаются концепты. Например, концепт "Персона" может быть выражен словами "Человек", "Персона", "Физическое лицо" и др. Часто одно и то же слово может иметь разные значения в различных контекстах - для выражения таких особенностей используется понятие "лексического поля". АрхиГраф.Логос использует онтологию LEMON/Ontolex для описания лексического слоя модели.
  • Фактографическую модель, содержащую описание конкретных объектов и явлений - персон, компаний и других сущностей, о которых пользователи могут формулировать высказывания или задавать вопросы.

Для распознавания смысла текстов на естественном языке широко используется как онтологический инструментарий, так и технологии машинного обучения, в том числе нейросети.

С помощью технологий обработки текста на естественном языке можно вывести Системы управления знаниями на новый уровень функциональности: пользователям не нужно конструировать формализованный запрос к базе знаний, достаточно задать вопрос на обычном языке. Извлечение фактов из текстов документов, индексируемых Системой управления знаниями, позволяет значительно расширить содержание самого графа знаний.

Распознавание смысла текстов полезно и при решении задач ситуационных центров, где необходимо извлекать факты из сообщений заявителей, переданных на обычном языке, и связывать их с другими фактами, характеризующими ситуацию.

Следующим шагом в применении подобных технологий является создание чат-ботов, способных поддерживать с пользователем осмысленный диалог на основе сведений, содержащихся в графе знаний.

Одно из применений АрхиГраф.Логос - нормализация нормативно-справочной информации (НСИ), хранящейся под управлением АрхиГраф.MDM. АрхиГраф.Логос может преобразовывать текстовые названия элементов НСИ в формализованные описания, к которым легко применить средства логической обработки (правила) или инструменты машинного обучения для дедупликации, автоматизированной классификации, связывания элементов данных.

Больше информации об АрхиГраф.Логос можно получить в презентации продукта, в статьях Диалоговые помощники для работы со структурированными данными и Онтологии: от текста к фактам.