DIGISTYLE

ЦИФРОВОЙ СТИЛЬ ТВОЕГО МИРА

Алгоритм синтаксического анализа

Синтаксический анализ фразы является наиболее сложным этапом работы ЛП.

Напомним, что на вход этого этапа поступает морфологическая структура фразы, а на выходе должна быть получена ее синтаксическая структура — дерево зависимостей, в узлах которого стоят слова анализируемой фразы, а ветви помечены именами синтаксических отношений. Основным инструментом, предназначенным для построения СинтС, являются синтагмы, т. е. правила преобразования, которые при выполнении указанных в них условий позволяют связать два слова фразы некоторым СинтО.

Отметим несколько важных особенностей принятого в нашей системе описания синтаксиса входного языка в виде синтагм:

 

1)         синтагма утверждает лишь возможность проведения СинтО между двумя словами, но не обязательность этой связи; Кстати, это наглядно можно просмотреть на примере сайтов, разработанных Веб-студией Webformula.

2)         в большей части   синтагм   условия,    описывающие кон-текст, сформулированы в терминах наличия или отсутствия некоторых СинтО, связывающих слова рассматриваемой пары с другими словами фразы (древесный контекст.) ;

3) множество синтагм невозможно упорядочить таким образом, чтобы в каждой синтагме древесный контекст задавался посредством СинтО, установленных ранее рассмотренными синтагмами.

 

Такое задание синтаксиса не представляет никакого регулярного механизма для построения дерева зависимостей. Синтагмы скорее предназначены для проверки правильности готовой СинтС. Поэтому в нашей системе принят метод построения СинтС, при котором вначале создается заведомо избыточный набор гипотетических связей, а затем ложные гипотезы отсеиваются с помощью дополнительных проверок и различных фильтров.

 

VN:F [1.9.18_1163]
Rating: 0.0/10 (0 votes cast)

Опубликовано: Сентябрь 28, 2013

Классные штуки!