Abstract:
|
В настоящей статье рассмотрены проблемы обращения к размещенным в свободном
доступе корпусам для проведения исследований в русле сопоставительной корпусной
лингвистики и предложено их решение. Корпусы разных языков, представленные в сети
Интернет, существенно различаются по целям и принципам создания, объему, структуре,
содержанию, типам разметки, хронологическим рамкам и другим характеристикам, что не
может обеспечить объективность полученных при их анализе данных в сопоставительном
исследовании. На первом этапе исследования мы проводим анализ работ, в которых
обсуждается наполнение и принципы формирования сопоставительного корпуса, уточняем это
понятие и определяем место сопоставительного корпуса в типологии многоязычных корпусов.
На следующем этапе, ставя перед собой цель создания собственного сопоставительного корпуса
для исследования парцелляции как когнитивно-дискурсивного феномена, мы вводим понятие
сопоставительного объектно-ориентированного корпуса, понимая под ним специализированный
двуязычный или многоязычный корпус, предназначенный для изучения конкретного
лингвистического объекта. Далее формулируются принципы создания корпуса с учетом его
специфики: принципы репрезентативности, сбалансированности и сопоставимости. Последний
принцип опирается на соблюдение ряда квантитативных и квалитативных критериев сборки
сопоставительного корпуса. Только последовательная реализация данных принципов позволит
обеспечить достоверность получаемых в ходе корпусного анализа данных об исследуемом
объекте. Для сборки сопоставительного объектно-ориентированного корпуса и его обработки
используется компьютерная программа Linguistica, специально разработанная для решения
задач исследования. |