Онлайн-ресурсы

BivalTyp (“Typological database of bivalent verbs and their encoding frames”)

BivalTyp is a typological database of bivalent verbs and their encoding frames. As of 2023, the database presents data for 92 languages, mainly spoken in Northern Eurasia. The database is based on a questionnaire containing 130 predicates given in context. Language-particular encoding frames are identified based on the devices (such as cases, adpositions, and verbal indices) involved in encoding two predefined arguments of each predicate (e.g. ‘Peter’ and ‘the dog’ in ‘Peter is afraid of the dog’). In each language, one class of verbs is identified as transitive. The goal of the project is to explore the ways in which bivalent verbs can be split between the transitive and different intransitive valency classes.

Corpus latino-rossicum

Параллельный корпус латинско-русских текстов. Корпус основан на лучших и вошедших в отечественную культуру переводах, снабжён разметкой, позволяющей использовать гибкие алгоритмы поиска и анализа, открывая доступ к богатейшему лингвистическому материалу с перспективой исследования в области рецепции античной литературы и её влияния на отечественную культуру.

NoCaCoDa: Nominal Causal Constructions Database

NoCaCoDa is a typological database of nominal causal constructions. Nominal causal constructions are constructions where the causing event is syntactically represented by a noun phrase, as in The woman woke up from [the noise] or The woman can’t fall asleep because of [the mosquitoes]. The database makes it possible to explore the ways in which different nominal causal markers, such as English from and because of in the examples above, are distributed over various causal contexts. As of 2023, the database covers 35 languages, primarily from Northern Eurasia. The data have been collected using a questionnaire containing 54 stimulus sentences. These stimulus sentences capture various semantic subtypes of nominal causal constructions.

PhytoLex. Этноботаническая база данных (XI-XVIII вв.)

База данных «PhytoLex. Этноботаническая база данных (XI-XVIII вв.)» содержит названия растений, зафиксированные в русской книжности XI-XVIII вв. В базу включены названия растений с контекстами употребления из оригинальных и переводных литературных произведений, лексикографических сочинений, естественнонаучной и исторической литературы, памятников деловой письменности, а также исторических словарей русского языка исследуемого периода и исследований по теме проекта. Представлены как исконно русские, так и заимствованные фитонимы, в том числе иноязычные транслитерированные лексемы, не получившие дальнейшего распространения в русском языке.

Tsakonian Digital

Проект по созданию онлайн-словаря цаконского диалекта. Проект реализуется совместно с Марцелем Новаковским и Хайме Гарсия Чапарро

Yiddish corpus. Корпус языка идиш

Корпус языка идиш — это информационно-справочная система, основанная на собрании текстов на идише в электронной форме. Корпус предназначен для всех, кто интересуется самыми разными вопросами, связанными с языком идиш: профессиональных лингвистов, преподавателей языка, школьников и студентов, иностранцев, изучающих идиш. Объем корпуса около 4 миллионов словоупотреблений.

Аффиксоиды русского языка. Словарь-справочник

Информационно-поисковый ресурс «Аффиксоиды. Словарь-справочник» Института лингвистических исследований РАН содержит более 900 начальных и финальных частей сложных слов русского языка (аффиксоидов), а также их описание (этимологию, толкование значений, иллюстративный материал разного типа, функционально-стилистические характеристики, орфографические особенности, дополнительную семантическую и словообразовательную информацию). Информационно-поисковой ресурс предназначен как для лингвистов, специалистов в области русской лексикологии, лексикографии, словообразования и морфемики, так и для самой широкой аудитории. Научный потенциал ресурса и его главная задача — обобщить в лексикографической форме сведения о промежуточном словообразовательном и морфологическом явлении русского языка — аффиксоидах, а также унифицировать их семантическое описание. Ресурс постоянно пополняется материалами неологической базы данных группы «Словарей новых слов».

История слов русского языка. Библиографические материалы

Проект нацелен на создание единой библиографической базы данных – указателя литературы по истории слов русского языка. Электронный библиографический указатель содержит в себе информацию о существующей литературе по исторической лексикологии русского языка, собранной из разнообразных источников. Он позволяет ускорить поиск научной литературы и облегчить тем самым ориентацию в ней ученого-исследователя – как филолога широкого профиля, интересующегося русским языком, так и лексиколога и лексикографа, для которых разработка истории конкретных слов и выражений является одной из главных задач профессиональной деятельности.

Корпус греческого языка

Корпус представляет собой коллекцию текстов, дополненных разметкой разного вида и поисковым механизмом. Объём корпуса в настоящий момент составляет 35,7 млн словоупотреблений. Большинство текстов составляют выпуски греческих газет начала XXI века (Η Καθημερινή, Μακεδονία, Το Βήμα, Ελευθεροτυπία), но имеются также художественная литература, поэзия, официальная, научная и религиозная литература и переводные тексты, созданные в XX и XIX веках. Все тексты обладают морфологической разметкой, т. е. при каждом слове указана его лемма (начальная форма) и набор выраженных в слове грамматических значений (падеж, число и т. п.); все эти параметры можно использовать в поисковых запросах. Морфологическая разметка проводилась с помощью электронного грамматического словаря, составленного М. Л. Кисилиером и Т. А. Архангельским, и морфологического анализатора UniParser.

Новое в русской лексике. Словарные материалы

Информационно-поисковый лексикографический ресурс «Новое в русской лексике» Института лингвистических исследований РАН (г. Санкт-Петербург) представляет собой базу данных с системой поиска по опубликованным словарям новых слов, а также по некоторым неопубликованным материалам всего неологического направления лексикографии Российской академии наук. Лексическая база ресурса содержит около 7000 слов, выражений и значений, которые являлись лексическими и семантическими новациями определенного периода, некоторые из них не были ранее зафиксированы в толковых словарях русского языка. Информационно-поисковый ресурс «Новое в русской лексике» предназначен для лингвистов, специалистов в области русской лексикологии и лексикографии, а также для самой широкой аудитории. Главная научная задача ресурса — предоставление для исследовательской деятельности огромного пласта новой лексики, которая может быть отобрана по различным параметрам. Ресурс постоянно пополняется неологическими материалами группы «Словарей новых слов» ИЛИ РАН.

Оцифровка греческих изданий советского периода из коллекции РНБ

В рамках проекта предпринимается оцифровка греческих изданий, хранящихся в РНБ

Понтийский проект

Проект посвящен понтийскому диалекту и ставит себе целью показать, как с помощью современных технологий можно по-новому изучать и исследовать уникальное языковое и культурное наследие. Для создания словаря использована программа TLex Suite 2019.

Русский язык в медиапространстве XIX века. Cправочно-информационный историко-лексикологический ресурс

На сайте представлены результаты коллективного труда сотрудников Института лингвистических исследований РАН, выполненного в рамках научно-исследовательского проекта «Русский язык в медиапространстве 19 века» при финансовой поддержке Российского фонда фундаментальных исследований (грант № 20-012-00413А).

Словарь обиходного русского языка Московской Руси XVI-XVII веков

Словарь представляет лексику и фразеологию обиходного русского языка XVI-XVII вв. по материалам группы памятников литературно-письменного языка этой эпохи на народно-разговорной основе. Исследовано свыше 400 источников, написанных в Москве и других областях Московской Руси. В корпус словаря включены данные региональных исторических словарей русского языка XVI-XVII вв.

Словарь русского языка XIX века

Основная задача Словаря — показать динамику словоупотребления, эволюцию словарного состава русского литературного языка, его интенсивное пополнение лексикой и фразеологией, утверждение единых норм словоупотребления, а также выход из употребления устарелых слов и значений. Материалы Словаря дают возможность оценить изменения в лексической системе литературного языка как отражение глубинных перемен в духовной и материальной жизни русского общества. Замысел «Словаря русского языка XIX века» принадлежит выдающимся русским лексикографам Ю. С. Сорокину и Л. Л. Кутиной.

Словарь русского языка XVIII века

«Словарь русского языка XVIII в.», разрабатываемый группой исторической лексикологии XVIII века, представляет собой описание русской лексики на протяжении века, составляющего очень важный этап в развитии русского языка. Этот этап завершился в пушкинскую пору созданием современного литературного языка на национальной основе. «Словарь русского языка XVIII в.» является посредствующим звеном между «Словарем русского языка XI-XVII вв.», где описывается древнерусская и старорусская лексика, и «Словарем современного русского литературного языка» (в 17-ти томах). История русской лексики в XVIII в. - это процесс постепенного складывания единой национальной нормы русского словоупотребления на основе формирующегося нового национального литературного языка.