УДК 81.42
ИСПОЛЬЗОВАНИЕ ЯЗЫКОВЫХ КОРПУСОВ В ФОРМИРОВАНИИ ПРОФЕССИОНАЛЬНЫХ КОМПЕТЕНЦИЙ БУДУЩИХ ПЕРЕВОДЧИКОВ
Сёмина О.Ю.
В статье описываются возможности использования национальных языковых корпусов в обучении будущих переводчиков; подчеркивается значимость корпусов как дополнительного по отношению к традиционным словарям источника лингвистической информации
Ключевые слова: национальный языковой корпус, перевод, профессиональные компетенции
В настоящее время без использования языковых корпусов не обходится ни одно из направлений деятельности, связанной с изучением языков – как исследовательской, так и учебно-методической. Говоря о роли языковых корпусов в изучении иностранных языков, М. Маккарти подчеркивает, что с появлением корпусов изменился не только наш взгляд на язык и на роль устной и письменной речи, но и сама технология создания учебных материалов, ресурсов и программ для преподавания языка, и ход самих занятий. [8]. Корпусные данные используются в качестве материала в лингвистической педагогике, в исследовательской работе студентов, а также в совершенствовании методики преподавания иностранных языков (см., например, [4]).
Вместе с тем, по-прежнему часто приходится сталкиваться с полным непониманием того, что такое языковой корпус и как он может применяться в реальной переводческой и учебной деятельности. Очевидно, что особенно актуальной задача освоения этого типа информационных ресурсов является для студентов, изучающих иностранные языки, и работающих с ними преподавателей: доступ к столь обширной базе данных о современном состоянии языка при правильном использовании может оказать значительную помощь при формировании профессиональных компетенций будущих переводчиков.
Под корпусом текстов в узком смысле понимают унифицированный, структурированный и размеченный массив языковых (речевых) данных в электронном виде [1]. Принятое в корпусной лингвистике определение корпуса основывается на четырех основных признаках: расположение корпуса на машинном носителе, стандартизованное представление материала на этом носителе, конечный размер, репрезентативность как результат особого отбора [9]. В. Рыков подчеркивает, что надежные результаты может дать только универсальный, или эталонный корпус текстов [3], каковым и является национальный корпус – собрание текстов в электронной форме, представляющих данный язык на определенном этапе его существования [2]. На данный момент созданы корпуса большинства европейских языков, в 2004 г. в открытом доступе в сети Интернет появился Национальный корпус русского языка (НКРЯ). Важно отметить, что многие современные корпусы (например, Corpus of Contemporary American, далее – COCA) размечены в соответствии с жанровыми характеристиками текста; таким образом, запрос для интересующего пользователя слова может быть ограничен тем или иным типом дискурса. Рассмотрим некоторые примеры того, как корпусные данные могут использоваться при обучении переводу.
Несомненно, ценным будет обращение к корпусному материалу, если требуется прояснить значение слова или словосочетания, не обнаруженного в словарях. Так, выражение Generation O не зарегистрировано в словарях, но в COCA оно встречается, причем только в источниках последнего десятилетия. Еще более существенно, однако, что данные языковых корпусов могут использоваться для уточнения значения и закономерностей функционирования единиц языка, зафиксированных в словарях. Практика показывает, что даже при наличии хороших словарей у начинающих переводчиков нередко возникают сложности, связанные с выбором правильного переводного эквивалента из ряда представленных в словарной статье. Например, для перевода слова «общежитие» в словаре ABBYY Lingvo 12 (а на сегодняшний день это один из наиболее полных и широко используемых при переводе текстов общей тематики словарей) предлагаются варианты residence hall; hostel брит.; dormitory амер. (Lingvo 12). Сделав запрос на каждый из трех вариантов в BNC и COCA, получаем следующие результаты по употребительности: dormitory - BNC 153, COCA 978; hostel – BNC 530, COCA 464; residence hall BNC 0, COCA 161.
Анализируя расхождения в частотности каждой единицы в двух корпусах, сразу отметим, что 1) объем корпуса COCA в 4,5 раза превышает объем BNC; 2) входящие в состав COCA тексты датируются последним временем, вплоть до 2011 г., в то время как BNC до сих пор ограничен текстами периода начала 1990-х гг. (http://corpus.byu.edu/coca). Оба этих факта, безусловно, сказываются на достоверности данных BNC с точки зрения современного состояния языка, однако не умаляют достоинств корпуса в целом как эталонного и тщательно сбалансированного с точки зрения жанрового состава. Учитывая это, для получения наиболее точного представления о положении дел в современном английском языке, данные обоих корпусов рекомендуется использовать в сочетании (при условии отсутствия заинтересованности конкретно в том или ином варианте английского языка).
Как видно из приведенных данных, в британском варианте английского языка наиболее частотной из трех единиц является hostel, в американском – dormitory, что вполне соотносится с пометами в словаре. Но так как конкордансы слова dormitory в английском варианте и слов hostel и residence hall в американском варианте английского языка также оказались довольно объемными, необходимо выяснить, есть ли различия в контекстах употребления. Для этого воспользуемся функцией создания списка слов, сочетающихся с данным словом в найденных контекстах (опция collocates в строке поиска). Согласно результатам поиска в BNC, наиболее часто со словом dormitory в британском варианте английского языка используются следующие лексемы: suburb (10), bed (7), town (7), accommodation, rooms, boys, girls, village (по 4). В то же время, более популярное слово hostel наиболее часто используется в сочетании со словами youth (73), bail (16), homeless (14), salvation (14), accommodation (14). Как показывает анализ контекстов, в которых встречаются эти слова в BNC, для обозначения студенческого общежития больше подойдет все же dormitory, в то время как hostel более часто используется для обозначения чего-то вроде недорогой гостиницы (ср. одно из наиболее распространенных сочетаний – bail hostel). Примерно такая же ситуация наблюдается и в COCA – слово hostel чаще всего комбинируется со словами youth, dwellers, township, workers, residents, elder, а в списке наиболее частотных коллокатов для слова dormitory (и для образованного от него dorm) первые места занимают room, college, university, living, girls, campus, freshman. Весьма показателен в этом отношении один из контекстов, обнаруженных в этом корпусе: " Where do you stay? " she asked him. // " At the Olympic Village. " // " Ha-ha. " // " They were here in' 60. " // " I knew that. " // " And now one of the dorms is a hostel. " // " Really? " // " It even has a bar. Just beer and wine, but what the hey. " // She said she'd never heard of a hostel with a bar, but then she'd never actually stayed in one. Что касается варианта residence hall, он используется исключительно в американском варианте английского языка; более того, 161 употребление в СOCA объясняется повторяемостью этой единицы в пределах того или иного текста.
Неплохим подспорьем в выборе эквивалента при переводе является и параллельный корпус, например, корпус текстов на английском языке с параллельным переводом, размещенный в свободном доступе на сайте проекта Национальный корпус русского языка (http://ruscorpora.ru/search-para-en.html). Такой подкорпус дает возможность обратиться к опыту профессиональных переводчиков и позволяет расширить ряд потенциальных переводческих эквивалентов. Сделав в параллельный корпус запрос на слово «общежитие», мы получим целый ряд контекстов, в которых та или иная единица была передана этим словом; среди них будут не только hostel и residence, но и rooming house, и student (nurses’) residence.
Внимания заслуживает и тот факт, что многие из обнаруженных в словаре частичных переводных эквивалентов употребляются не намного реже, чем более точно соответствующий по объему значения вариант перевода. Например, лексема blackbird (наименование одного из наиболее распространенных на территории Англии видов птиц, черного дрозда) в корпусе встречается в 296 контекстах, в то время как полный эквивалент родового названия дрозд – thrush – встречается в 350 контекстах. Подобные количественные соотношения могут оказаться полезными при обучении переводу: как показывает практика, начинающие переводчики зачастую склонны выбирать из словарной статьи наиболее общий, родовой термин, не уделяя должного внимания контексту.
Один из наиболее очевидных аспектов применения языковых корпусов при переводе – это прояснение сочетаемости слов в языке перевода на его современном этапе. Даже очень авторитетные словари сочетаемости не могут включать в себя а) всех лексем языка б) всех возможных коллокатов той или иной лексемы, они дают лишь общие рекомендации по ее комбинированию; кроме того, всегда содержат достаточно полную и соответствующую современному состоянию языка информацию. В море контекстов, составляющих национальный корпус, есть гораздо больше шансов обнаружить реальные употребления того или иного сочетания слов, если таковое является нормальным для языка на современном этапе его существования. Например, при переводе словосочетания «огромная жертва» студентами предлагаются варианты «heavy sacrifice», «big sacrifice». Чтобы ответить на вопрос, какой из вариантов перевода наиболее приемлем, сделаем запрос на существительное sacrifice в сочетании с именем прилагательным по сочетаемости в Британском национальном корпусе. Результаты поиска показывают, что в BNC интересующее нас слово не употреблено в сочетании с прилагательным heavy ни в одном контексте, в COCA – в пяти; в сочетании с big в BNC – в 1 контексте, в COCA – в 25 контекстах. Сделав запрос на сочетаемость этого слова с прилагательным в препозиции, видим, что гораздо более частотным, чем предложенные студентами сочетания, является сочетание great sacrifice (6 раз встречается в BNC, 44 в COCA).
Разделение современных языковых корпусов на подкорпусы, ограниченные жанром текста (в COCA тексты разделяются на следующие жанры: SPOKEN, FICTION, MAGAZINE, NEWSPAPER, ACADEMIC), в сочетании с возможностью анализировать употребительность слова или фразы в разных жанрах позволяет получить более полное представление о стилистических характеристиках языковых единиц. Это также может оказать неоценимую помощь начинающему переводчику в тех случаях, когда словари не отражают стилистическую заряженность той или иной единицы. (Например, лексема well-nigh не имеет стилистических помет в словарях Collins, Collins Cobuild, Oxford; в англо-русских словарях (БАРС, Lingvo Universal) переводится как «почти, приблизительно», также без указания на стилистические ограничения. Вместе с тем, запрос в подкорпусы разных жанров показывает следующие результаты: SPOKEN – 1 контекст, FICTION - 21, MAGAZINE – 13, NEWSPAPER – 5, ACADEMIC – 24, что свидетельствует о явной принадлежности лексемы к числу слов высокого, книжного стиля и неприемлемости для разговорного языка).
Итак, при умелом использовании корпусные данные могут использоваться переводчиком для уточнения значения слова и его комбинаторики, для выбора наиболее адекватного варианта перевода в данном контексте. Формирование навыка пользования этим источником информации, таким образом, играет важнейшую роль в повышении уровня профессиональной компетентности будущих переводчиков.
Список литературы
1. Захаров В.П. Веб-пространство как языковой корпус. URL: http://www.dialog-21.ru/Archive/2005/Za ... harovV.htm (дата обращения 16.10.2012).
2. Подлесская, В.И. Современные компьютерные методы в изучении и преподавании лингвистических дисциплин: корпусная лингвистика. – Электрон. изд. – Режим доступа к изд.: http://www.rsuh.ru/article.html?id=398 (дата обращения - 20.01.2014).
3. Рыков, В.В Корпусная лингвистика и лексикография – проблема репре-зентативности // Труды конференции по лексикографии. – Гродно, 2002 – Электрон. изд. – URL: http://rykov-cl.narod.ru/t32.html (дата обращения - 20.01.2014).
4. Соснина Е.П. Корпусная лингвистика и корпусный подход в обучении иностранному языку – Электрон. изд. – URL: http://ling.ulstu.ru/linguistics/resour ... _teaching/(дата обращения 02.02.2014)
5. ABBYY Lingvo 12.0: Многоязычный электронный словарь – М.: ABBYY Software House, 2007. – 1 эл. опт. диск (CD-ROM). – Загл. с экрана.
6. Davies, Mark. (2004-) BYU-BNC. (Based on the British National Corpus from Oxford University Press). Available online at http://corpus.byu.edu/bnc/ (дата обращения 2.02.2014).
7. Davies, Mark. (2008-) The Corpus of Contemporary American English: 450 million words, 1990-present. Available online at http://corpus.byu.edu/coca/ (дата обращения 2.02.2014).
8. McCarthy, Michael. Accessing and interpreting corpus information in the teacher education context. - Language Teaching. Cambridge University Press. 41, 2008
9. McEnery, T.; Wilson, A. Corpus Linguistics / T. McEnery, A. Wilson. – Edinburgh: Edinburgh University Press, 1999. – Электрон. изд. – Режим доступа к изд.: http://bowland-files.lancs.ac.uk/monkey ... ntents.htm.
Сёмина Ольга Юрьевна, кандидат филологических наук, доцент кафедры лингвистики и перевода, Тульский государственный университет, Тула, Россия
USING LANGUAGE CORPORA TO FORM PROFESSIONAL COMPETENCES OF FUTURE TRANSLATORS
О.Yu. Syomina
Abstract
The article describes the possibilities of using national language corpora in teaching future translators. The author points out the significance and reliability of corpora as a source of linguistic information complementary to traditional dictionaries.
Key words: national language corpora, translation, professional competences, translation equivalent, frequency, lexical combinability
Olga Yurievna Syomina, PhD. in Philology, associate professor, Department of Linguistics and Translation Studies, Tula State University, Tula
Доклад О.Ю. Сёминой (г. Тула) / O.Yu. Syomina (Russia)
Moderator: Irina Tivyaeva
-
- Posts: 167
- Joined: 01 Dec 2011, 12:53