
- •Компьютерный анализ данных
- •Введение
- •1. Способы измерения информации и представления данных.
- •1.1. Многомерные статистические данные. Наблюдения, объекты и признаки. Математическое и табличное представление многомерных данных
- •1.2. Виды измерительных шкал
- •2. Простейшие способы моделирования данных
- •2.1. Зачем нужно моделировать данные
- •2.2. Моделирование данных с помощью функции слчис()
- •2.3. Моделирование данных равномерного распределения
- •2.4. Простейший способ моделирования нормальной случайной величины
- •2.5. Моделирование законов распределения случайных величин средствами excel
- •3. Предварительный анализ данных одномерных признаков
- •3.1. Расчет средних значений и дисперсии одномерного признака
- •3.2. Диапазон значений признака
- •3.3. Расчет частотного ряда признака
- •3.4. Графическое представление данных. Гистограмма.
- •3.5. Предварительный анализ многомерных данных. Диаграмма рассеивания
- •4. Моделирование данных в более сложных случаях
- •4.1. Метод неравномерной рулетки
- •4.2. Метод отбраковки
- •4.3. Моделирование многомерного нормального распределения.
- •5. Методы преобразования данных
- •5.1. Нормировка значений признака
- •5.2. Преобразование измерительных шкал
- •6. Проверка статистических гипотез
- •6.1. Принцип решения задач проверки статистических гипотез
- •6.2. Сглаживание эмпирических данных теоретической функцией плотности ()
- •6.3. Непараметрический критерий оценки зависимости признаков ()
- •6.4. Проверка гипотезы равенства средних двух выборок (t - критерий)
- •6.5. Дисперсионный анализ –классификация по одному признаку (f - критерий)
- •6.6. Проверка гипотезы однородности двух выборок (критерий Вилксона)
- •Задания к практическим занятиям Практическое № 1 Анкетный опрос
- •Практическое № 2 Предварительный анализ - одномерных признаков
- •Практическое № 3 Предварительный анализ - многомерных данных
- •Практическое № 4 Метод неравномерной рулетки
- •Практическое № 5 Метод отбраковки
- •Практическое № 6
- •Практическое № 7 Методы преобразования данных
- •Практическое № 8 Проверка гипотезы о согласии эмпирических данных теоретическому закону распределения.
- •Практическое № 9 Непараметрический критерий оценки зависимости признаков
- •Практическое № 10 Проверка гипотезы равенства средних двух выборок (t - критерий)
- •Практическое № 11 Дисперсионный анализ – классификация по одному признаку (f - критерий)
- •Практическое № 12 Проверка гипотезы однородности двух выборок (критерий Вилксона)
- •Список рекомендуемой литературы
- •Содержание
Практическое № 5 Метод отбраковки
1. Смоделировать данные методом отбраковки по данным, приведенным в таблице.
Параметры частотного ряда |
Номер интервала | |||||
0 |
1 |
2 |
3 |
4 |
5 | |
Границы интервалов |
1,5 |
1,62 |
1,74 |
1,86 |
1,98 |
2,1 |
Относительные частоты |
|
0,3 |
0,35 |
0,27 |
0,06 |
0,02 |
Середины интервалов |
|
1,56 |
1,68 |
1,8 |
1,92 |
2,04 |
Границы интервалов (текст) |
|
1,50÷1,62 |
1,62÷1,74 |
1,74÷1,86 |
1,86÷1,98 |
1,98÷2,1 |
3. Построить диаграмму рассеивания случайных точек в прямоугольной области.
4. Построить гистограмму по модельным данным.
Практическое № 6
Моделирование двухмерного нормального распределения
1. По данным, указанным в таблицах 1-3, смоделировать 3-и выборки, подчиняющихся многомерному нормальному закону распределения.
2. Построить диаграмму рассеивания классифицированной выборки.
3. Провести эксперимент, изменяя параметры, описывающие выборки. Оценить влияние изменений параметров по диаграмме рассеивания.
4. Смоделировать несколько нормальных выборок с тремя признаками. Данные скопировать в таблицу данных пакета Statistica. Построить трехмерные графики диаграмм рассеивания.
Практическое № 7 Методы преобразования данных
1.
Смоделировать нормальное распределение
двух признаков (X,Y) с параметрами:
или скопировать из таблицы данных
практического занятия №6.
2. Преобразовать признаки X и Y к ранговому представлению (операция дискретизации).
3. Преобразовать признаки X и Y к бинарному представлению.
4. Произвести нормировки признаков X и Y:
- стандартную;
- по максимальным значениям;
- по минимальным значениям;
- по средним значениям.
5. Построить диаграммы рассеивания по нормированным данным и сравнить графики.
Практическое № 8 Проверка гипотезы о согласии эмпирических данных теоретическому закону распределения.
1. Скопировать таблицу данных, результаты расчетов и графики подготовленные при выполнении практических занятий 2-3.
2. Рассчитать частоты теоретических законов распределения для всех восьми частотных ряда.
Для признаков X1-X3 принять гипотезу о равномерном законе распределения.
Для признаков X4-X8 принять гипотезу о нормальном законе распределения.
3. Рассчитать выборочные значения критерия ХИ-квадрат.
4. Рассчитать критические значения критерия ХИ-квадрат.
5. Проверить гипотезу согласия выборочных данных теоретическим законам распределения.
Практическое № 9 Непараметрический критерий оценки зависимости признаков
1. Сформировать таблицу данных
- скопировать в столбцы X1 И Y1 данные столбцов X1 И Y1 (второй класс) таблицы данных практического занятия №6
- скопировать в столбцы X2 И Y2 данные столбцов F(X1) И F(X2) таблицы данных практического занятия №2
2. Использовать данные столбцов X1 И Y1 для моделирования номинальных признаков "Пол" "Кандидат"
3. Проверить статистические гипотезы зависимости пар признаков (X2,Y2) и (Пол, Кандидат)