Егоров И. М., Мольков Г. А. Проблемы формализации структуры словарной статьи «Словаря русского языка XVIII века» при подготовке электронного издания // Terra Linguistica. 2023. Т. 14, № 3. С. 19–27.

В статье рассмотрены результаты ручной обработки и классификации структурных элементов «Словаря русского языка XVIII века» на материале выпущенных на сегодняшний день 22 выпусков. Цель этой работы – адаптация к нормальной структуре данных всего разнообразия приемов и особенностей оформления статей данного словаря и в дальнейшем – подготовка электронной версии словаря, основанной на базе данных. Основной сложностью, выявленной в ходе анализа структурных особенностей словаря, стал вопрос о допустимой степени отклонений от бумажного канона при адаптации к электронному формату данных. При классификации было выделено два типа структур – типовые и единичные. Предлагается их формализация с помощью трехуровневой системы компонентов: базовых, подчиненных базовому и простых элементов двух типов – сложной типовой структуры (блоки компонентов) и первичных. Типовые структуры передаются при такой системе полностью, а относительно единичных принимается дополнительное решение. Сохраняются особенности бумажной версии словаря, которые не влияют на структуру данных – в тех случаях, когда определенный элемент меняет (сужает или расширяет) сферу применения в пределах одного блока компонентов. Если же нетипичное (редкое) использование элемента выходит за пределы блока, в структуру базы данных необходимо добавлять новый компонент, который в перспективе не будет востребован. В такой ситуации невостребованный элемент словарных статей предполагается устранять из оригинального текста и приводить его в соответствие с общим для словаря метаязыковым узусом.
Документ
09.27.2023