- •I. Пояснительная записка
- •1.1. Цели и задачи дисциплины
- •1.2. Требования к уровню освоения содержания дисциплины
- •1.3. Объем дисциплины и виды учебной работы
- •II. Содержание дисциплины
- •2.1. Учебные модули и разделы дисциплины. Виды занятий
- •2.2. Содержание разделов дисциплины
- •I модуль. Элементы прикладной лингвистики
- •Математика и гуманитарные науки. Математическая (комбинаторная и квантитативная) лингвистика.
- •Прикладная лингвистика. Сравнение методов описательной, теоретической и прикладной лингвистики.
- •II модуль. Вероятностно-статистическое изучения языка и речи
- •Основные области приложения структурно-вероятностной модели языка.
- •Статистический подход к исследованию языковых структур. Основания и условия вероятностно-статистического изучения языка и речи.
- •Методика статистического эксперимента. Методика создания выборочной лингвистической совокупности (выборки).
- •Корпусная лингвистика. Электронные корпуса текстов.
- •Методика фоносемантического анализа текста.
- •Методика, сущность, этапы подготовки и проведения контент-анализа.
- •2.2. Практические и семинарские занятия
- •Математика и гуманитарные науки. Математическая лингвистика. Вопросы для обсуждения
- •Литература
- •Вероятностно-статистическое изучение языка и речи. Вопросы для обсуждения
- •Литература
- •Контент-анализ. Вопросы для обсуждения
- •Литература
- •2.4. Глоссарий
- •2.5. Задания для самостоятельной работы
- •Задание № 6. Выполнить лабораторную работу по контент-анализу литературного текста.
- •III. Формы контроля и требования к зачёту по дисциплине
- •3.1. Текущий и итоговый контроль усвоения знаний
- •3.2. Вопросы к зачёту
- •IV. Учебно-методическое обеспечение дисциплины
- •4.1. Рекомендуемая литература а) основная литература
- •Б) дополнительная
- •5.1. Общие рекомендации
- •5.2. Рекомендации по выполнению заданий самостоятельной работы Задание № 1. Классификация местоимений русского языка.
- •Задание № 2. Лабораторная работа «Статистический анализ публицистических и рекламных текстов из нкря»
- •Задание № 3. Лабораторная работа «Статистический анализ газетного текста»
- •Требования к оформлению и содержанию лабораторной работы
- •Задание № 5. Лабораторная работа по фоносемантическому (звукоцветовому) исследованию литературного текста
- •I вариант – Франческо Петрарка. Сонеты
- •Франческо Петрарка. На смерть мадонны Лауры
- •II вариант – в. Шекспир «Ромео и Джульетта» (перевод б. Пастернака).
- •Для каждого из текстов заполнить 2 таблицы:
- •Теоретические основы исследования.
- •Требования к оформлению и содержанию лабораторной работы
- •Задание № 6. Контент-анализ литературного текста а.С. Пушкина «Евгений Онегин» (концептуальная переменная – «свой–чужой»)
- •I. Заполните таблицы
- •II. Провести анализ личностных качеств героев
- •Требования к оформлению работы (контент-анализ)
Литература
1. Баранов А.Н. Введение в прикладную лингвистику: Учебное пособие. -М.: Эдиториал УРСС, 2001.
2. www.vaal.ru - сайт разработчиков компьютерной версии контент-анализа.
2.4. Глоссарий
Сложный объект - любой предмет, явление, ситуация, в которых можно выделить составные части (элементы).
Субстанция - материальное воплощение элементов сложного объекта.
Структура - схема связей или отношений между элементами сложного объекта.
Система - сложный объект с определенной структурой.
Модель - сложный объект, определенным элементам которого можно поставить в соответствие элементы другого сложного объекта - оригинала; при этом взаимосвязям и отношениям между элементами оригинала соответствуют некоторые взаимосвязи или отношения между определенными элементами модели.
Структурная модель – модель только структуры (схемы отношений между элементами системы) без свойств субстанции
Математическая модель - приближенное описание какого-либо класса явлений внешнего мира, выраженное с помощью математической символики.
Статистическому (вероятностному) закону подчиняются в своем функционировании и развитии все сложные и очень сложные системы. Действие статистического закона выражается в сохранении определенной вероятности, изменение вероятности будет говорить и об изменении статистического закона.
Генеральная лингвистическая совокупность (ГЛС) – статистическая совокупность, объединяющая все однородные лингвистические объекты, обладающие данным качественным или количественным признаком (признаками). Генеральная совокупность может содержать как конечное, так и бесконечное количество единиц.
Выборочная лингвистическая совокупность (ВЛС) – некоторая обозримая часть генеральной совокупности.
Частотой какого-либо явления (факта, «события») называют число его появлений в наблюдаемом отрезке действительности. Этим отрезком может быть любая совокупность считаемых единиц и любая среда, в которой появляются или находятся факты, поддающиеся счету. Таким отрезком может быть текст различного объема.
Выборочные частоты - частоты, показанные отдельными выборками.
Математической экспликацией лингвистического объекта называется замена диффузной, интуитивно сформулированной и не имеющей полного решения лингвистической задачи одной или несколькими более простыми, логически сформулированными и имеющими алгоритмическое решение математическими задачами.
Репрезентативность – способность ВЛС отражать исследуемые свойства ГЛС.
Рациональный объем выборки – объем ВЛС, достаточный для того, чтобы выборка была репрезентативна.
Относительная ошибка (δ) – величина, характеризующая ширину доверительного интервала, в который попадает относительная частота исследуемого свойства лингвистического объекта.
Надежность (ρ)– измеряется в % или в виде десятичной дроби. Пусть мы провели исследование на выборке А и получили частоту исследуемого свойства f c относительной ошибкой δ. Тогда надежность (ρ) означает, что если мы возьмем 100 аналогичных А выборок, то в ρ из них f будет находится в пределах: от (f – δ*f) до (f + δ*f), а в остальных случаях может выходить за их пределы. Для лингвистических исследований чаще всего достаточно определять ρ=95%.
Формальное определение слова (определение Г. Глисона) – отрезок текста, заключенного между двумя пробелами.
Словоупотребление – единица счета текста, т.е. последовательность букв, ограниченная двумя пробелами.
Словоформа – полностью совпадающие словоупотребления. Они выступают в качестве единицы частотного словаря.
Лемма (словарная словоформа) – слово в основной, исходной форме, в качестве которой в русском языке выступает обычно именительный падеж единственного числа – для именных форм и инфинитив – для глагольных форм.
Словоупотребление является единицей текста (речь), слово – единицей словаря (язык), словоформа обычно используется в качестве единицы частотного словаря.