ЕЯ-интерфейс доступа к базам данных | MetodPro.ru

Реклама на сайте

ЕЯ-интерфейс доступа к базам данных


В настоящее время успешное применение технологии обработки естественного языка ограничивается узко-специальными областями с хорошо определенной семантикой, к которым относятся базы данных.

Рассмотрим построение ЕЯ-интерфейса базы данных на основе рационального подхода, в ходе которого выполняется анализ и интерпретация входных ЕЯ-запросов средствами традиционных грамматик. Основная задача такого интерфейса – преобразование ЕЯ-запросов в запрос на внутреннем языке БД, например SQL. Применение ЕЯ-интерфейса доступа к БД характеризуется следующими свойствами:

1)      пользователю не требуется изучать сложные искусственные языки доступа к БД.

2)      Простота формулировки сложных запросов, содержащих отрицание и кванторы общности, которые трудно сформулировать при использовании традиционных интерфейсов доступа к БД.

3)      Возможность обработки запросов с учетом дискурса.

 

Существующие ЕЯ-интерфейсы баз данных используют различные подходы: метод сопоставления с образцом, синтаксические грамматики, семантические грамматики, некоторый внутренний язык.

Интерфейсы, основанные на методе сопоставления с образцом, являются наиболее простыми. Уточним особенности анализа ЕЯ-запросов на основе процедуры сопоставления с образцом. Рассмотрим таблицу реляционной базы данных, содержащую сведения о странах.

 

 

 

 

 

 

Страна

Страна

Столица

Язык

Франция

Париж

Французский

Германия

Берлин

Немецкий

Италия

Рим

Итальянский

 

В этом случае при ответе на запрос могут использоваться следующие правила.

 

образец:… «столица &»…?S

действие: вывести значение поля «столица» для строки  таблицы удовлетворяющей условию «Страна = S»

 

образец: … «столиц&» … «стран&»

действие: вывести значение полей «страна» и «столица» для каждой строки таблицы.

 

В соответствии с первым правилом, если в запросе пользователя после слова «столиц&» будет следовать название страны, то необходимо найти строку таблицы, для которой значение поля «страна» сопоставимо со значением переменной образца S и сообщить пользователю соответствующее значение поля «столица».

Втрое правило активизируется, если в запросе пользователя после слова «столиц&» следует слово «стран&». Например, список столиц всех стран. В этом случае пользователю сообщается весь список стран и их столиц. ЕЯ-интерфейсы базы данных, построенные на основе метода сопоставления с образцом, могут приводить к ошибочным ответам, так как не учитывают семантических отношений между элементами запросов.

Более гибкими являются ЕЯ-интерфейсы, реализующие синтаксический разбор запросов к БД. Строящееся при этом дерево грамматического разбора преобразуется в выражение на языке запроса к БД. ЕЯ-интерфейс, реализующий преобразование дерева синтаксического разбора в конструкции языка запросов конкретной БД оказывается узко-специальным. Создание универсального множества правил, преобразующих дерево синтаксического разбора в конструкции полноценного языка запросов, например SQL, проблематично. Иная возможность построение ЕЯ-интерфейсов доступа к базам данных основана на использовании семантических грамматик, в которых нетерминальные элементы представляются семантическими категориями. В этом случае так же строится дерево грамматического разбора, которое затем преобразуется в выражение на языке запросов к БД.

Недостатком ЕЯ-интерфейсов, реализующих метод семантической грамматики, является их непереносимость на другую предметную область, так как это требует разработки новой грамматики. Во многих случаях, существующие ЕЯ-интерфейсы, обеспечивающие доступ к БД, первоначально преобразуют запрос в некоторую внутреннюю логическую форму. Такая промежуточная логическая форма отражает смысл вопроса пользователя в терминах, независящих от структуры БД. Затем логический запрос преобразуется в выражение языка запросов БД и обрабатывается СУБД.



Методические пособия

  • Системы автоматизированного проектирования
  • Социология молодёжи
  • Общая социология
  • Криптография
  • Проектирование трансляторов
  • Компьютерная графика
  • Моделирование систем
  • Информационная безопасность
  • Теория вычислительных процессов
  • Логические основы искусственного интелекта
  • Проектирование распределённых информационных систем