МОСКВА, 16 сентября – РИА Новости. Мультимедийная лекция "Русский язык и новые технологии: корпуса и корпусная лингвистика" состоялась в среду, 16 сентября, в Москве и продолжила цикл лекций, организованных МИА "Россия сегодня" и Министерством образования и науки РФ.
В ходе лекции известные лингвисты рассказали о Национальном корпусе русского языка (НКРЯ) — информационно-справочной системе, основанной на огромных собраниях реальных текстов в электронном виде.
"Благодаря техническому прогрессу лингвисты получили возможность иметь дело с огромным объемом текстов, в результате чего мы можем видеть изменения, которые происходят в языке", — отметила профессор НИУ ВШЭ Екатерина Рахилина, пояснив, что речь идет об изменениях значения слова и его формы. Например, можно проследить, как некогда новое для русского языка слово "кофе" искало свой род.
По мнению экспертов, НКРЯ – репрезентативный и сбалансированный ресурс: 20% составляют художественные тексты, все остальное – газетные тексты, записи устных разговоров, тексты смс и пр. Система имеет разметку и систему поиска.
Сейчас в основной Национальный корпус русского языка входит 230 млн словоупотреблений (включая, газетный корпус — 170 млн слов, устный корпус – 10 млн, поэтический корпус – 10 млн и др.).
Профессор НИУ ВШЭ Нина Добрушина привела пример со словом "позитив", которое изначально казалось ей "свежим и молодым". Обратившись к корпусу, лингвист обнаружила, что первое появление этого слова в письменных текстах датируется 1910 годом, однако тогда его употребляли в качестве технического термина, связанного с фотосъемкой. Оценочное же значение слова "позитив" (как нечто хорошее) появилось только в 1978 году.
"Корпус позволяет всем желающим посмотреть примеры употребления слов и словосочетаний с начала 18 века, тем самым, удовлетворить свое любопытство, проверить факты", — отметила лингвист.
Она также рассказала о том, что на базе корпуса есть частотный словарь. Оказалось, что наиболее частотное слово русского языка – союз "и", предлог "в" и частица "не". Частотный словарь, по мнению лингвистов, позволяет решить многие грамматические и стилистические проблемы. Так, например, в слове "баннер" наиболее частотный вариант написания с удвоенной "нн", а вот слово "блоггер/блогер" до сих пор допускает двоякое написание, поскольку частота употребления обоих вариантов примерно одинаковая.
Мультимедийная лекция проходила в формате видеомоста "Москва – Кишинев – Ереван – Астана".