DIGISTYLE

ЦИФРОВОЙ СТИЛЬ ТВОЕГО МИРА

Вход словарной статьи и описание многозначных слов

Словарная статья КС описывает ровно одну лексему (одно значение слова). Она открывается строкой заголовка, которая содержит номер словарной статьи и имя данной лексемы — слово в орфографической записи или безусловный оборот.

Напомним, что безусловным оборотом называется цепочка слов, выражающих единое понятие, имеющих неизменную грамматическую форму и следующих друг за другом в фиксированном порядке; ср. КАК БЫ ТО НИ БЫЛО, ВО ЧТО БЫ ТО НИ СТАЛО, ПО КРАЙНЕЙ МЕРЕ, ТЕМ НЕ МЕНЕЕ, КАК ЕСЛИ БЫ и т. п. Безусловным оборотам в КС присваивается метка определенной части речи.

 

Кстати, безусловные обороты речи очень часто встречаются в словарях современных гаджетов. Например, Экран HTC Sensation XL White может отображать более тысячи слов и словооборотов на нескольких языках.

 

Если слово имеет лексико-грамматические омонимы, то в имя каждой лексемы входит цифровой индекс, ср. ЧТ01 (союз) и ЧТ02 (союзное слово — что, чего, чему и т.п.). Если при этом надо различить еще и лексическую полисемию или омонимию, лексема получает двойной индекс вида i.j.

Отдельно необходимо сказать о том, как описываются в КС многозначные слова. Вообще говоря, лексическая многозначность, как и лексическая омонимия, создает серьезные технические затруднения для синтаксического анализа. Каждое значение слова и каждый омоним необходимо учитывать отдельно в качестве кандидата на положение хозяина или слуги в той или иной синтаксической конструкции, что приводит к резкому росту числа гипотетических связей между словами фразы. Более точно: число гипотетических связей возрастает пропорционально квадрату числа омонимов во фразе.

 

Поэтому даже в предложениях средней длины при наличии омонимов в достаточном числе позиций возникает такой комбинаторный взрыв, с которым машина технически может не справиться.

Из этого вытекает необходимость всеми возможными средствами, в том числе и искусственно, сокращать лексическую полисемию и омонимию. Естественный способ состоит в том, чтобы учитывать в КС не все возможные значения и лексические омонимы слова, а лишь те, которые релевантны для  предметной области.

VN:F [1.9.18_1163]
Rating: 0.0/10 (0 votes cast)

Опубликовано: Октябрь 28, 2013

Классные штуки!