
- •Программные статистические комплексы
- •Учебно-методический комплекс
- •Программные статистические комплексы
- •Учебно-методический комплекс
- •1. Информация о дисциплине
- •1.1. Предисловие
- •1.2. Содержание дисциплины и виды учебной работы
- •1.2.1. Содержание дисциплины по гос
- •1.2.2. Объем дисциплины и виды учебной работы
- •1.2.3. Перечень видов практических занятий и контроля:
- •1.2. Определение статистических показателей
- •4.2. Стандартные статистические функции ms Exsel
- •Раздел 5. Анализ распределения данных в ms Excel (12 часов)
- •5.1. Общее представление анализа данных в ms Excel
- •5.2. Основные инструменты пакета анализа
- •Раздел 6. Математическая система Mathcad (12 часов)
- •6.1. Общая характеристика системы Mathcad
- •6.2. Применение Mathcad для статистического анализа
- •2.2. Тематический план дисциплины для студентов очно-заочной формы обучения
- •2.3. Тематический план дисциплины для студентов заочной формы обучения
- •Программные статистические комплексы
- •Раздел 1.
- •Основные понятия статистики
- •Раздел 3.
- •Наглядное представление статистических данных
- •Раздел 4.
- •Статистические функции
- •Раздел 5.
- •Анализ распределения данных в ms Exsel
- •Раздел 6.
- •Математическая система Mathcad
- •Раздел 2. Общая характеристика программных статистических комплексов
- •2.5. Временной график изучения дисциплины при использовании информационно-коммуникационных технологий
- •2.6. Практический блок
- •3. Информационные ресурсы дисциплины
- •3.1. Библиографический список
- •3.2. Опорный конспект
- •Раздел 1. Основные понятия статистики
- •1.1. Общие сведения о статистике
- •1.2. Определение статистических показателей
- •Раздел 2. Общая характеристика программных статистических комплексов
- •2.1. Общие сведения о программных статистических комплексах
- •2.2. Табличные программные комплексы
- •2.3. Табличный программный комплекс ms Excel
- •Раздел 3. Наглядное представление статистических данных
- •3.1. Статистические таблицы и ряды
- •3.2. Графики и диаграммы
- •Раздел 4. Статистические функции
- •4.1. Использование статистических функций
- •4.2. Стандартные статистические функции ms Excel
- •1. Подсчет количества элементов в диапазоне
- •2. Вычисление средних значений
- •3. Вычисление экстремальных значений
- •4. Вычисление взвешенного среднего
- •5. Вычисление дисперсии
- •6. Регрессия и метод наименьших квадратов
- •Раздел 5. Анализ распределения данных в ms Excel
- •5.1. Общее представление анализа данных в ms Excel
- •5.2. Основные инструменты пакета анализа
- •Инструмент «Описательная статистика»
- •Инструмент «Однофакторный дисперсионный анализ»
- •Инструмент «Двухфакторный дисперсионный анализ»
- •Инструмент «Регрессия»
- •Раздел 6. Математическая система Mathcad
- •6.1. Общая характеристика системы Mathcad
- •6.2. Применение Mathcad для статистического анализа
- •3.3. Глоссарий (краткий словарь основных терминов и положений)
- •3.4. Методические указания к выполнению заданий практических занятий
- •Задания на практические занятия и методические указания по их выполнению
- •4. Блок контроля освоения дисциплины
- •4.3. Текущий контроль
- •4.5. Итоговый контроль
- •Содержание
- •1. Информация о дисциплине
- •Ушаков Иван Елисеевич
- •Щелкунова Надежда Витальевна
- •Программные статистические комплексы
- •Учебно-методический комплекс
- •191186, Санкт-Петербург, ул. Миллионная, д. 5
3. Вычисление экстремальных значений
Выдают информацию о самом большом или самом маленьком из списка значений.
МАКС() и МИН()
МАКС(число1, число 2,…) - только для числовых значений.
МАКСА(число1, число 2,…) - для диапазонов, содержащих текстовые или логические значения.
МИН(число1, число 2,…) - только для числовых значений.
МИНА(число1, число 2,…) - для диапазонов, содержащих текстовые или логические значения.
НАИБОЛЬШИЙ() и НАИМЕНЬШИЙ() - для работы с k-м максимальным или минимальным значением.
НАИБОЛЬШИЙ(массив; k).
НАИМЕНЬШИЙ(массив; k).
K - позиция в массиве (в порядке убывания чисел), которую необходимо получить. Если k=1, то функция возвращает то же значение, что и функция МАКС().
4. Вычисление взвешенного среднего
В некоторых наборах данных одно значение может быть важнее, чем остальные.
Взвешенное среднее значение - это арифметическое среднее значение, где каждое из значений взвешено в соответствии с его важностью в наборе данных.
Процедура, выполняемая для вычисления взвешенного среднего:
Умножить каждое значение на соответствующий ему вес.
Просуммировать полученные в шаге 1 результаты.
Просуммировать веса.
Разделить сумму из шага 2 на сумму из шага 3.
5. Вычисление дисперсии
При вычислении вариации по набору значений можно применить простой подход: вычислить сначала отклонение каждого из значений от среднего, сложить эти разности и разделить полученную сумму на количество значений в выборке, чтобы получить некоторое «среднее отклонение». Однако, этот подход не дает никаких результатов: по определению сумма отклонений значений от среднего дает результат 0. Чтобы решить эту проблему, необходимо сложить абсолютные значения отклонений, после чего разделить их на размер выборки. Этот показатель в статистике называют средним, или линейным отклонением. Но и этот простой подход имеет недостаток - задействованы модули чисел и поэтому выполнять его сложно. Чтобы обойти эту проблему, вместо модуля (абсолютного значения) используется квадрат отклонения от среднего, который всегда равен неотрицательному числу. После этого квадраты отклонений суммируют и делят на количество значений в выборке - результат называют дисперсией. Результат измеряется не в единицах измерения выборки, а в единицах в квадрате. Дисперсия используется для вычисления стандартного отклонения.
ДИСП(число 1, число 2,…) - применяется для наборов данных, представляющих собой выборку из генеральной совокупности.
ДИСПР(число 1, число 2,…) - используется в тех случаях, когда набор данных представляет собой всю генеральную совокупность (например, количество единиц бракованной продукции).
ДИСПА(число 1, число 2,…) - для диапазона данных, включающих текстовые или логические значения.
ДИСПРА(число 1, число 2,…) – для тех случаев, когда набор данных представляет собой всю генеральную совокупность и включает текстовые и логические значения.
6. Регрессия и метод наименьших квадратов
Наиболее часто статистические методы используются для обработки и графического представления данных. Например, на практике часто возможно задание достаточно большого числа узловых точек аппроксимируемой функции. Так, в физических экспериментах для этого достаточно порой повторить цикл измерений несколько раз. Если подвергнуть такие данные хотя бы простейшей статистической обработке, то можно заметно уменьшить стандартное отклонение результата измерения.
Это и реализуется в задачах регрессии. Можно рассмотреть задачу, при которой аппроксимирующая функция подбирается так, чтобы ее график проходил в облаке узловых точек исходной функции, и чтобы суммарная среднеквадратичная погрешность для всех точек была минимальной. Таким образом, реализуется метод наименьших квадратов.
Вопросы для самопроверки по разделу 4
Перечислите основные статистические функции.
Порядок подсчета элементов в диапазоне.
Перечислите типы усредняющих показателей.
Что такое медиана?
Определение медианы статистического массива.
Что такое мода в наборе данных?
Определение моды статистических данных.
Порядок определения экстремальных значений в наборе данных.
Что такое взвешенное среднее значение?
10. Процедура вычисления взвешенного среднего.
11. Порядок вычисления дисперсии.
12. В чем заключается суть метода регрессии?
13. Порядок построения аппроксимирующей функции.
14. В чем заключается метод наименьших квадратов?