Доклад А.М. Пуляевской, Е.А. Соловьевой (Иркутск / Russia)

4-я научно-практическая Интернет-конференция с международным участием

Moderators: Elena Zelenina, Irina Tivyaeva

Locked
Irina Tivyaeva
Posts: 167
Joined: 01 Dec 2011, 12:53

Доклад А.М. Пуляевской, Е.А. Соловьевой (Иркутск / Russia)

Post by Irina Tivyaeva »

УДК 811
А.М Пуляевская, доцент кафедры информатики и математики
kinf_pam@mail.ru (Россия, Иркутск, САПЭУ)
Е.А. Соловьева, ст. преп. кафедры информационных технологий
elena_s2002@rambler.ru (Россия, Иркутск, ЕАЛИ МГЛУ)

ФОРМИРОВАНИЕ ПРОФЕССИОНАЛЬНЫХ КОМПЕТЕНЦИЙ ЛИНГВИСТА-ПЕРЕВОДЧИКА В ОБЛАСТИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

С вступлением в силу Федеральных государственных образова-тельных стандартов, реализация любого направления подготовки бакалавров возможна при формировании некоторого набора компетенций. В соответствии с требованиями к результатам освоения основной образовательной программы 45.03.02 Лингвистика, студент должен обладать следующими общепрофессиональными компетенциями [6]:
 владением навыками работы с компьютером как средством получения, обработки и управления информацией (ОПК-11)
 способностью работать с различными носителями информа-ции, распределенными базами данных и знаний, с глобальными компью-терными сетями (ОПК-12)
 способностью работать с электронными словарями и другими электронными ресурсами для решения лингвистических задач (ОПК-13)
Профессиональные компетенции студента-лингвиста, связанные с информационными технологиями, можно условно разделить на три группы:
1 группа. Инструменты анализа письменной речи
способностью работать с основными информационно-поисковыми и экспертными системами, системами представления знаний, синтаксического и морфологического анализа, автоматического синтеза и распознавания речи, обработки лексикографической информации и автоматизированного перевода, автоматизированными системами идентификации и верификации личности (ПК-19);
2 группа. Инструменты создания вторичного текста
способностью оформлять текст перевода в компьютерном тексто-вом редакторе (ПК-11)
3 группа. Инструменты изучения языковых конструкций
владением основами современных методов научного исследования, информационной и библиографической культурой (ПК-25)
владением стандартными методиками поиска, анализа и обработки материала исследования (ПК-26)
способностью оценить качество исследования в данной предметной области, соотнести новую информацию с уже имеющейся, логично и последовательно представить результаты собственного исследования (ПК-27).
Совместно с дисциплинами учебного плана направления 45.03.02 Лингвистика, частично или полностью перечисленные выше общепрофессиональные и профессиональные компетенции могут быть сформированы у студентов-переводчиков в рамках курса «Информационные технологии в лингвистике». Представим основное содержание практической части дисциплины и основные инструменты (сервисы и программные среды) в соответствии с тремя группами профессиональных компетенций.
Первый модуль. Инструменты анализа письменной речи.
Решение практически любой задачи автоматической обработки текста (АОТ) включает в себя проведение анализа текста на следующих уровнях представления.
Фонетический и ассоциативный анализ текста: http://www.seosin.ru/page/5/.
Морфологический анализ — выделение грамматической основы слова, определение частей речи, приведение слова к словарной форме Goldlit (http://goldlit.ru/component/slog), 5-EGE (http://5-ege.ru/morf/), AOT (http://www.aot.ru/demo/morph.html) [2].
Синтаксический анализ — выявление синтаксических связей между словами в предложении, построение синтаксической структуры предложения: http://sz.ru/parser/ — поддерживает русский, получение синтаксической разметки предложения русского языка. Разметка включает дерево зависимостей, информацию о типе связей, морфологических значениях слов и ролях знаков препинания.
На сайте Vnutrislova.net можно провести морфологический, фоне-тический и морфемный (по составу) разбор слова.
Voyeurtools — инструмент, создающий облако слов на основе ча-стоты употребления слов в тексте. Чем крупнее изображено слово, тем чаще оно встречается в тексте. http://voyeurtools.org/tool/Cirrus/. При наведении курсора на слово, появляется информация о количестве употреблений этого слова в тексте. Для более детальной информации, нужно кликнуть на слово. При этом появляется график частоты употребления слова в частях текста, контекст в котором это слово встречается (конкорданс) и частотный словарь.
В рамках самостоятельной работы студенты выполняют сравни-тельно-сопоставительный анализ возможностей сервисов и программных продуктов для анализа письменной речи, подготавливают обзоры наиболее полезных средств обработки текста с последующим выступлением на семинарах. Лучшие обзоры публикуются в разделе «Лингвистика» на сайте http://nit-for-you.wikispaces.com/.
Второй модуль. Инструменты создания вторичного текста
Сайт «Freesummarizer» (http://freesummarizer.com/) является абсо-лютно бесплатным, но исключительно англоязычным сервером. Размер текста определяется длиной предложений, и готовый реферат можно получить как моментально на сайте, так и по электронной почте. Достаточно простой англоязычный сайт «Autosummarizer» (http://autosummarizer.com/).
Сайт «Smmry» (http://smmry.com/) англоязычный сервис, который предлагает ряд настроек: убрать вопросительные предложения, убрать восклицательные предложения, убрать цитаты и прямую речь, распределение важности предложений по цветам (красный — наиболее важный, желтый — наименее важные), определить тему, запомнить настройки.
Качество любого письменного текста во многом зависит от доступности восприятия его читателями. Основное предназначение текста – передача информации. Для достижения этой цели он должен быть удобочитаемым, т. е. читатель должен быть способным прочитать его без особых усилий. Провести анализ на удобочитаемость текста студентам предлагается средствами «Статистика удобочитаемости» тестового редактора MS Word и онлайн-калькуляторами сайта «http://www.readabilityformulas.com/» [9].
Третий модуль. Инструменты изучения языковых конструкций
Конкордансы позволяют анализировать большие массивы текста на предмет обнаружения закономерностей использования в языке тех или иных слов или выражений. На практических занятиях студенты знакомятся со следующими свободно распространяемыми программами: ArtConc, Catma, A Simple Concordance Program.
AntConc (http://www.softpedia.com/get/Science-CAD/AntConc.shtml) содержит семь инструментов, с помощью которых можно просмотреть контекст запрашиваемых слов в различных ключах, положение их в тексте или базе данных, частотность и связи слов и словосочетаний в текстах, а также ключевые слова. Имеет расширенную поисковую систему.
Catma (http://www.catma.de)— это практичный и интуитивно понятный инструмент, Одно из преимуществ которой является внутренняя цветовая разметка.
Simple Concordance Program (http://simple-concordance-program.softw ... r.com/4.0/) — простая в использования и предо-ставляемой функциональности программа, с помощью которой можно извлекать термины и словосочетания, задавая число слов в словосочетании. Поддерживаются алфавиты: английский, французский, немецкий, польский, греческий, русский. Можно подключить так называемый "stop list" — список из слов, которые не относятся к терминологии. К примеру, артикли, предлоги, общие слова (little, large).
Программный продукт «Tropes» (http://www.semantic-knowledge.com/tropes.htm) для семантической классификации, выделения ключевых слов, лингвистического и качественного анализа. Поддерживаемые языки: английский, французский, испанский, португальский, немецкий и итальянский. Основные функциональные возможности:
 разбивка текста на эпизоды посредством хронологического анализа;
 определение основной мысли текста;
 поиск ответов на вопросы: «кто что кому говорит?», «кто что делает?», «где и когда было совершено, то или иное действие?», «с какой целью было совершено то или иное действие?»;
 выявление стиля анализируемого текста (в программе пред-ставлено 4 различных стиля текста).
При изучении дисциплины «Информационные технологии в линг-вистике» студенты выполняют не только практические задания по работе с перечисленными инструментами, но и проводят лингвистические мини-исследования.
В качестве примеров приведем фрагменты студенческих работ, вы-полненных под руководством преподавателя.
Пуляевская 1.jpg
Пуляевская 1.jpg (90.24 KiB) Viewed 4606 times
Рис 1. Визуализированный частотный словарь (http://www.voyant-tools.org/)

Пример 1. Анализ художественного произведения Александра Ивановича Куприна «Гранатовый браслет». Общий объем текста составляет 13900 слов; произведение доступно для понимания выпускнику средней общеобразовательной школы. Составление частотного словаря является одним из основных методов исследования письменной речи. При его составлении для повести Куприна, с помощью интернет-сервиса Hermeneutica, было выявлено пять наиболее встречаемых слов несущих смысловую нагрузку текста: время, любовь, письмо, руки и глаза (рис.1).
Слово «любовь» является ключевым компонентом текста, на частоте встречаемости которого основаны композиция и ритм повести.
Пуляевская 2.jpg
Пуляевская 2.jpg (55.18 KiB) Viewed 4606 times
По сочетанию ключевого слова с другими лексемами в определенном тексте возможно определение главной мысли текста без его прочтения. В завязке повести ключевой компонент любовь вступает в синтаксическую связь с такими словами, как «прежняя страстная (любовь) переросла в чувство верной дружбы…». Во фрагменте, представляющем развитие действия, слово любовь имеет следующие сочетания: «…пересекла такая (любовь), о которой грезят…», «(любовь) бескорыстная, самоотверженная…». Преобладание ключевого слова отмечается в кульминации повести. В данном фрагменте слово любовь представлено в следующих контекстах: «…что это было: (любовь) или сумасшествие?», «…громадное счастье, (любовь) к вам», «…не маниакальная идея – это (любовь), которой Богу было угодно меня вознаградить…». Сочетания со словом любовь в развязке произведения подводят итог всему произведению: «…та (любовь) прошла мимо нее», «…прошла большая (любовь), которая повторяется только один раз в тысячу лет…». По сочетанию данного ключевого слова главную мысль повести можно оформить следующим образом: «Настоящая, неземная любовь, о которой мечтает каждый, иногда незаметно проходит мимо нас» (рис.2).
Работа с национальным корпусом того или иного языка и другие лингвистические методы позволяют провести подробный анализ текстов различных функциональных стилей. Особого внимания заслуживает понятие валентности глагола. Этот термин принадлежит французскому лингвисту Люсьену Теньеру. В центре предложения – действие, обозначаемое обычно глаголом. От него прямо или косвенно зависят все остальные члены предложения. В непосредственной зависимости от глагола находятся актанты и сирконстанты. Актанты (дословно «действователи») соответствуют подлежащему и дополнениям в традиционной грамматике, сирконстанты – обстоятельствам.
Для накопления и систематизации примеров из корпусов студентам рекомендуется использовать программу HelpNdoc (http://www.helpndoc.com/).
Пример 2. Исследование валентности глагола «бить». Анализируя примеры употребления этого слова с помощью Национального корпуса русского языка, пришли к выводу: актанты заполняют две валентности глагола «бить», т.е. бить (Кого? Что?), бьет (Кто? Что?). Так же были найдены фразеологизмы, в состав которых входит глагол «бить»: бить баклуши, бить челом, бить рублём, бить в набат. Аналогичные исследования проводятся в корпусах других языков [1, 3, 4, 5, 7].
Студенты оформляют результаты исследования в форме статьи и готовят сообщения для обсуждения внутри группы. Лучшие доклады готовятся студентами для выступления на студенческой конференции в рамках недели науки ЕАЛИ МГЛУ. Статьи (тезисы) рекомендуются преподавателем к публикации в очередном сборнике тезисов докладов Всероссийской интернет-конференции «Информационные технологии и их применение» [1, 2, 4, 5].
Описанное выше содержание практической части дисциплины «Информационные технологии в лингвистике» для направления подготовки 45.03.02 Лингвистика, позволяет реализовать не только компетентностный подход, который определяет, требования к результатам освоения основной образовательной программы, но и дает большой задел к вовлечению студентов к научной и исследовательской работе [3, 7, 8].

Список литературы

1. Буртыль Е.А. Валентность глагола «любить» в трёх языках: русском, английском, немецком. / Е.А. Буртыль //Информационные технологии и их применение [Электронный ресурс]: сб. тезисов докладов III Всероссийской интернет-конференции – Иркутск: МГЛУ ЕАЛИ, 2015. С. 186-191.
2. Вислова К. В. Морфологический анализ. Программное обеспечение и онлайн возможности. /К. В. Вислова //Информационные технологии и их применение [Электронный ресурс]: сб. тезисов докладов III Всероссийской интернет-конференции – Иркутск : МГЛУ ЕАЛИ, 2015. с.192-197.
3. Кочерыгин В.В. Корпусное исследование особенностей падежного склонения экономических терминов в русском языке на примере лексемы «экономика» /В.В. Кочерыгин // Молодые ученые — инициаторы новых подходов в образовании и науке: взаимодействие языков и культур в свете инновационных образовательных технологий: Материалы 1-ой Всероссийской научно-практической конференции. Махачкала, ДГУ, 2015 г. С. 83-89.
4. Кочерыгин В.В. Корпусное исследование частотности падежей экономических терминов русского языка. /В.В. Кочерыгин //Информационные технологии и их применение [Электронный ресурс]: сб. тезисов докладов III Всероссийской интернет-конференции – Иркутск : МГЛУ ЕАЛИ, 2015. С. 201-203.
5. Меслер Ю.И. Изучение валентности слова «производство» на примере статей журнала «Экономика и предпринимательство». /Ю.И. Меслер //Информационные технологии и их применение [Электронный ресурс]: сб. тезисов докладов III Всероссийской интернет-конференции – Иркутск : МГЛУ ЕАЛИ, 2015. – С. 208-212.
6. Приказ Минобрнауки России от 07.08.2014 N 940 "Об утверждении федерального государственного образовательного стандарта высшего образования по направлению подготовки 45.03.02 Лингвистика (уровень бакалавриата)" (Зарегистрировано в Минюсте России 25.08.2014 N 33786) URL: http://fgosvo.ru/uploadfiles/fgosvob/45 ... istika.pdf (дата обра-щения 30.03.2016)
7. Пуляевская А.М. Кочерыгин В.В., Корпусное исследование ва-лентности экономических терминов русского языка. / А.М. Пуляевская, В.В. Кочерыгин // Россия и страны Азии: диалог культур: материалы преп. Науч.- практ. Конф. (23.03.2015) и международ. Студ. Конф. (25.03.2015), г. Иркутск, – Иркутск: Изд-во БГУ, 2015 – с. 33-37
8. Пуляевская А.М. Современные программные средства для разработки мультимедийных корпусов./ А.М. Пуляевская Д.В. Гончарова // «Научное сообщество студентов XXI столетия», Новосибирск: Изд. «Сибирская ассоциация консультантов», 2011. с.143-147.
9. Соловьева Е.А. Удобочитаемость текста/ Е.А. Соловьева // Сборник материалов всероссийской Интернет-конференции «Информационные технологии и их применение» [Электронный ресурс] – Иркутск: Изд-во ИГЛУ, 2013 с. 241-246.
Locked

Return to “Актуальные проблемы лингвистики и лингводидактические аспекты профессиональной подготовки переводчиков/4th International Virtual Linguistics and Translators Training Conference”