- •I программа курса
- •II общие методические указания
- •III основные понятия курса
- •1. Элементы комбинаторики
- •2. Виды событий
- •3. Различные определения вероятности
- •Классическое определение вероятности
- •Статистическое определение вероятности
- •Геометрическое определение вероятности
- •4. Основные теоремы и формулы
- •Д) Исходя из того, что сумма событий состоит в появлении хотя бы одного из событий – слагаемых, в случае большого числа событий имеет смысл пользоваться другой формулой:
- •Формула полной вероятности
- •Формула Бейеса
- •IV. Повторные испытания
- •Формула Пуассона
- •Локальная теорема Лапласа
- •V. Случайные величины и их характеристики
- •1. Понятие о случайных величинах
- •2. Функции распределения
- •Свойства интегральной функции
- •Свойства дифференциальной функции
- •3. Числовые характеристики случайных величин
- •4. Конкретные законы распределения
- •5. Закон больших чисел
- •VI. Элементы математической статистики
- •1. Характеристики распределения опытных данных
- •2. Построение законов распределения по опытным данным
- •Построение нормального закона по эмпирическому вариационному ряду Пусть в результате испытания получен интервальный вариационный ряд признака
- •Вычисление теоретического ряда частот нормального распределения
- •Построение закона Пуассона по эмпирическому материалу
- •Пусть получен эмпирический вариационный ряд признака
- •Вычисление теоретического ряда частот распределения Пуассона
- •3. Критерии согласия. Основные понятия
- •Критерий согласия Пирсона
- •Критерий согласия Колмогорова
- •Критерии согласия Ястремского
- •Критерий согласия Романовского
- •4. Линейная корреляция и уравнение линейной регрессии
- •IV применение компьютерных средств для решения некоторых задач статистики
- •Ввод данных
- •Графическое представление данных
- •Статистический анализ данных в Excel
- •VIII. Задания для контрольной работы
- •I. Решить задачи
- •IV. Решить задачи
- •V. Для дискретной случайной величины х, заданной рядом распределения, найти:
- •VI. Непрерывная случайная величина х задана интегральной функцией
- •IX. В предположении о распределении признака по признаку Пуассона вычислить теоретические частоты, проверить согласованность теоретических и фактических частот на основе критерия Ястремского.
- •Приложение 1
- •Приложение 2
- •Продолжение приложения 2
- •Критические точки распределения
- •Значения (распределение Пуассона)
- •Критерий Колмогорова
- •Критерий Колмогорова
Графическое представление данных
Для построения диаграммы дискретного вариационного ряда нужно выделить область ячеек А1:В7 (ячейки, в которых находятся данные). После этого можно вызвать Мастер диаграмм или выбрать команду падающего меню Вставка-Диаграмма. На втором шаге выбирают тип диаграммы Точечная (можно с соединенными точками, можно отдельно стоящие точки) и область построения диаграммы на этом листе или на новом листе. Для описания диаграммы можно заполнить легенду (например, Объем товарооборота, тыс.грн.), название осей (ось Х – Временные периоды, ось Y –Величина товарооборота).
Рисунок 3
Гистограмма. Вычисляет выборочные и накопленные частоты попадания ряда данных в интервалы, а также может выводить соответствующие графики (модуль 3). Границы интервалов (карманы) можно указать (обычно задают верхние границы интервалов). Если не задать границы, то Excel сам разобьет анализируемый ряд на интервале с шагом :
,
где – наибольший вариант,
– наименьший вариант,
-ряда (количество членов).
Гистограмму можно построить автоматически, для этого достаточно выделить необходимый диапазон и нажать F11.
Рисунок 4
Одним из основных плюсов Excel является возможность создания формул и использования готовых функций для обработки массивов чисел (а так же текстов и символов).
Для ввода формулы необходимо набрать в пустой ячейке “=”, а затем с помощью операций ^, *, /, + связать исходные данные в ячейках, результат расчета с которыми мы хотим получить.
При вводе формул удобно использовать встроенные функции (существует несколько сотен встроенных функций, позволяющих обрабатывать численную, текстовую и символьную информацию), используя так называемые диалоговые окна, предписывающие последовательность ввода данных и уменьшающие возможности допущения ошибки.
При решении различных задач в Excel можно использовать, как в формулах, так и независимо, встроенные функции. На панели Стандартные с помощью кнопки Вставка функции откроем диалоговое окно мастера функций (желательно после установки в Меню Сервис надстройки Пакет анализа), которое содержит 13 различных категорий функций.
Нахождение суммы данных
Установить курсор мыши в свободную ячейку, выбрать на панели кнопку , выделить данные, записанные в столбец или строку. В выбранную свободную ячейку будет помещен результат суммирования.
Нахождение среднего значения
Предварительно просуммированные данные можно разделить на количество наблюдений, для чего в свободную ячейку вводят формулу , где – ячейка, в которой записана сумма данных, – количество наблюдений.
Статистический анализ данных в Excel
Категория функций Статистические является одной из самых многочисленных. Она содержит 78 статистик (функций обрабатываемых данных): среднее, дисперсию, максимальное и минимальное значения; квантили статистик -Стьюдента, – Фишера-Снедекора, – хи-квадрат Пирсона, нормального закона; частоту попадания в заданные интервалы массива данных (ЧАСТОТА) и многое другое. Кроме того, ряд функций позволяет рассчитать вероятности того, что случайная величина примет значение или случайная величина не превысит значение для часто встречающихся законов распределения случайной величины. Например, функции Гипергеомет и Отрбиномрасп – возвращают для гипергеометрического и отрицательного биномиального законов соответственно; функции Биномрасп, Пуассон, Экспрасп, нормрасп возвращают или (значения интегральных, а в последних двух случаях дифференциальных функций в точке ) для биномиального, пуассоновского, экспоненциального и нормального законов соответственно.
Рассмотрим получение основных параметров распределения на примере урожайности подсолнечника (ц/га).
Описательная статистика. Эта команда генерирует статистический отчет для несгруппированного массива чисел: характеристики положения и вариации, наибольшее и наименьшее значение, коэффициенты асимметрии и эксцесса, сумму, предельную ошибку доверительного интервала (уровень надежности ) для средней при заданном уровне надежности.
Выполним команду Сервис – Анализ данных – Описательная статистика, заполним параметры диалогового окна (при уровне значимости ). В результате получим лист книги Ecxel, изображенный на рисунке 5.
Рисунок 5
Параметры диалогового окна “Описательная статистика”:
-
Входной диапазон: введите ссылку на ячейки, содержащие анализируемые данные. Ссылка должна состоять как минимум из двух смежных диапазонов данных, организованных в виде столбцов или строк.
-
Группирование: установите переключатель в положение По столбцам или По строкам в зависимости от расположения данных во входном диапазоне.
-
Метки в первой строке/Метки в первом столбце: установите переключатель в положение Метки в первой строке, если первая строка во входном диапазоне содержит названия столбцов. Установите переключатель в положение Метки в первом столбце, если названия строк находятся в первом столбце входного диапазона. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.
-
Уровень надежности: установите флажок, если в выходную таблицу необходимо включить строку для уровня надежности. В поле введите требуемое значение. Например, значение 95% вычисляет уровень надежности среднего со значимостью 0.05.
-
К-ый наибольший: установите флажок, если в выходную таблицу необходимо включить строку для k-го наибольшего значения для каждого диапазона данных. В соответствующем окне введите число k. Если k равно 1, эта строка будет содержать максимум из набора данных.
-
К-ый наименьший: установите флажок, если в выходную таблицу необходимо включить строку для k-го наименьшего значения для каждого диапазона данных. В соответствующем окне введите число k. Если k равно 1, эта строка будет содержать минимум из набора данных.
-
Выходной диапазон: введите ссылку на левую верхнюю ячейку выходного диапазона. Этот инструмент анализа выводит два столбца сведений для каждого набора данных. Левый столбец содержит метки статистических данных; правый столбец содержит статистические данные. Состоящий их двух столбцов диапазон статистических данных будет выведен для каждого столбца или для каждой строки входного диапазона в зависимости от положения переключателя Группирование.
-
Новый лист: установите переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
-
Новая книга: установите переключатель, чтобы открыть новую книгу и вставить результаты анализа в ячейку A1 на первом листе в этой книге.
-
Итоговая статистика: установите флажок, если в выходном диапазоне необходимо получить по одному полю для каждого из следующих видов статистических данных: Среднее, Стандартная ошибка (среднего), Медиана, Мода, Стандартное отклонение, Дисперсия выборки, Эксцесс, Асимметричность, Интервал, Минимум, Максимум, Сумма, Счет, Наибольшее (#), Наименьшее (#), Уровень надежности.
В таблице 1 в третьем столбце указаны принятые обозначения и формулы для рассчитываемых статистик.
Таблица 1
Урожайность подсолнечника, ц/га |
|
Принятые обозначения |
Среднее |
24,88235294 |
|
Стандартная ошибка |
0,889118669 |
|
Медиана |
25,9 |
|
Мода |
27,4 |
|
Стандартное отклонение |
3,665930185 |
|
Дисперсия выборки |
13,43904412 |
|
Эксцесс |
1,448056468 |
|
Асимметричность |
-1,165524233 |
|
Интервал |
13,8 |
|
Минимум |
15,3 |
|
Максимум |
29,1 |
|
Сумма |
423 |
|
Счет |
17 |
|
Наибольший |
29,1 |
- |
Наименьший |
15,3 |
- |
Уровень надежности (95,0%) |
1,884846952 |
|