- •Предисловие
- •Элементы теории вероятностей
- •1.1. Случайные величины. Вероятность случайного события
- •1.2. Закон распределения дискретной случайной величины
- •1.3. Интегральная функция распределения
- •1.4. Дифференциальная функция распределения
- •1.5. Равномерное распределение непрерывной случайной величины
- •1.6. Числовые характеристики случайных величин
- •1.7. Нормальный закон распределения вероятностей непрерывной случайной величины
- •2. Элементы математической статистики
- •2.1. Предмет и задачи математической статистики
- •2.2. Генеральная и выборочная совокупности
- •2.3. Графическое представление статистических рядов
- •2.4. Выборочные характеристики
- •2.4.1. Средние величины
- •2.4.2. Выборочные центральные моменты. Асимметртя и эксцесс
- •2.4.4. Степень свободы.
- •2.5. Статистические оценки параметров распределения.
- •2.6. Функции распределения в математической статистике.
- •2.6.1. Распределение хи-квадрат ( )
- •2.6.2. Статистические гипотезы. Критерии согласия.
- •2.6.3. Критерий согласия Пирсона.
- •2.6.4. Распределение Стьюдента.
- •2.6.5. Распределение Фишера.
- •2.7. Доверительные интервалы
- •Доверительный интервал для неизвестного математического ожидания a нормально распределенного признака с известным средним квадратическим отклонением находят по формуле
- •2. При определении доверительного интервала в случае нормального распределения при неизвестном σ признака X в генеральной совокупности применяют случайную величину
- •2.8. Элементы линейного регрессионного и корреляционного анализа
- •2.8.1. Элементы корреляционной зависимости. Коэффициент корреляции
- •2.8.2. Линейная регрессия. Коэффициенты регрессии.
- •2.9. Критерии достоверности выборочных показателей
- •2.10. Элементы дисперсионного анализа.
- •2.10.1. Однофакторный дисперсионный анализ.
- •2.10.2 Двухфакторный дисперсионный анализ
- •3. Ms Excel в статистике
- •3.1. Интервальный и дискретный вариационный ряд. Графическое представление статистических рядов.
- •3.2. Описательная статистика
- •Сервис Анализ данных Описательная статистика ок;
- •Группирование По столбцам;
- •3.3. Корреляционный анализ
- •Сервис Анализ данных Корреляция ок;
- •3.4. Дисперсионный анализ
- •Сервис Анализ данных Дфухфакторный дисперсионный анализ с повторениями ок;
- •Приложения
- •Продолжение приложения 3
- •Критические точки распределения
3. Ms Excel в статистике
Широкое внедрение методов анализа данных в повседневную практику стимулировано распространением персональных компьютеров. Однако для осмысленной работы пользователь должен обладать определенной подготовкой: понимать, в каких ситуациях применимы различные статистические методы, знать их возможности и ограничения, уметь корректно интерпретировать результаты.
В настоящее время наиболее широко используемым программным обеспечением является программное обеспечение, работающее в среде Windows. Одним из составляющих программного обеспечения среды Windows, является программа Microsoft Excel, которая является мощным средством для работы с таблицами статистических данных. Она позволяет упорядочивать, обрабатывать определенным образом, графически представлять и анализировать различные виды статистической информации.
С помощью пакета анализа можно проводить следующие действия:
- генерировать случайные числа, подчиняющиеся различным законам распределения;
- проводить формирование выборки из генеральной совокупности;
- по выборке строить интервальный вариационный ряд, гистограмму, кумулятивную кривую и диаграмму Парето;
- вычислять точечные и интервальные оценки статистической совокупности;
- проводить сглаживание временных рядов;
- оценивать зависимость системы двух случайных величин;
- проверять статистические гипотезы с использованием различных критериев;
- проводить однофакторный и двухфакторный дисперсионный анализ;
- строить множественное уравнение регрессии;
- ранжировать статистические данные.
3.1. Интервальный и дискретный вариационный ряд. Графическое представление статистических рядов.
Пусть имеется выборка значений некоторого признака X объёмом n = 50:
9,19 11,5 10,7 12,6 13,0 12,3 7,46 8,92 8,80 11,6 11,9 10,9 5,82 8,89 9,19 11,5 10,7 12,6 13,0 12,3 7,46 8,92 8,80 11,6 11,9 10,9 5,82 8,89 9,32 8,30 8,76 8,01 15,5 12,3 9,46 9,11 12,1 12,5 9,33 11,0 10,1 9,61 13,7 15,0 12,2 13,1 11,7 10,4 11,5 9,02 9,23 7,16 12,0 10,6 6,39 6,97 9,03 6,84 8,29 10,5 11,7 7,05 12,1 9,53
Требуется, разбивая её на k = 6 групп, составить:
интервальный вариационный ряд и построить гистограмму частот;
дискретный вариационный ряд и построить полигон частот.
Поступаем следующим образом.
Вводим данные в диапазон А1:А50, выделяем его и щелчком ЛКМ по кнопке
располагаем варианты в порядке
возрастания.из полученного ряда находим значения minX = a1 = 5,82; maxX = a50 = 15,5. Их можно получить также встроенными функциями МИН и МАКС соответственно, диалоговое окно МИН показано на рис. 1:
Рис. 1
По формуле =a50-a1 находим размах выборки ΔX = 9,68
Оценивая шаг
,
получаем 1,613333. Округляем (только в
большую сторону) и принимаем h
= 1,7По формуле
Оцениваем крайнее левое значение первого интервала, что даёт 5,56. округляем до 5,6 и убеждаемся, что так округлить можно: 5,6+6*1,7 = 15,8>15,5.
В диапазоне B1:B7 задаём арифметическую прогрессию, с первым членом 5,6 разностью (шагом) 1,7 предельным значением 15,8:
Рис. 2
С помощью встроенной функции СЧЕТЕСЛИ подсчитываем число вариантов, принадлежащих промежутку (5,6 7,3) и записываем результат в ячейку C1:
Рис. 3
Двойные кавычки в поле «Критерий» обязательны.
Аналогично подсчитываем и записываем в ячейку C2 число вариантов принадлежащих промежутку (5,6, 9]:
Рис. 4
Продолжая вычисления, приходим к последовательности (рис 5.)
Рис. 5
Вводим в ячейку D1 формулу =(B1+B2)/2 и, копированием её, задаём в диапазоне D1:D6 середины интервалов. В ячейку E1 вводим 6, а в ячейку E2 – формулу =C2-C1. Копируя её в ячейки E3:E6, получаем последовательность частот:
Рис. 6
Таким образом, интервальный вариационный ряд выборки записывается в виде
(5,6 7,3) |
(7,3 9) |
(9, 10,7) |
(10,7 12,4) |
(12,4 14,1) |
(14,1 15,8) |
6 |
8 |
15 |
14 |
5 |
2 |
Граничное значение 10,7 отнесено к левому интервалу. Дискретный вариационный ряд задан в диапазоне D1:E6.
Графическим редактором «Мастер диаграмм» проводим построение гистограммы частот диапазона E1:E6
Рис. 7
Интервалы указываются на вкладке Ряд (подписи оси X):
Рис.8
Полигон частот строим командами Диаграмма Нестандартные Гистограмма | область:
Рис. 9
В командах Диаграмма Нестандартные Графики (2 оси) он имеет классический вид:
Рис. 10
Имеются и другие возможности геометрических представлений статистических распределений, включая построение в одной системе координат и полигона, и гистограммы, но на них останавливаться не будем.
