Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kurs_lektsy_ITM.doc
Скачиваний:
12
Добавлен:
01.07.2025
Размер:
2.05 Mб
Скачать

Вопрос 6. Технология оценки характеристик генеральной совокупности и выборки (оценка положения, рассеяния и формы распределения).

Статистическая обработка рядов распределения предполагает вычисление как обобщающих показателей, характеризующих типичность (однородность, сходство) варьирующего признака, так и показателей вариации, характеризующих различия индивидуальных значений признака внутри изучаемой совокупности, а также видов и форм распределений.

Для оценки типичности, как правило, используют средние величины. В зависимости от способа расчета, специфики изучаемой совокупности и целей статистического анализа различают несколько видов средних величин (арифметическая, геометрическая, гармоническая, квадратичная, кубическая и т. д., а также структурные средние такие как мода и медиана). средняя величина, рассчитанная по совокупности в целом, называется общей средней, а по каждой отдельной группе – групповой. В качестве характеристик рассеяния наиболее часто используют показатели размаха (как разницы между максимальным и минимальным значениями в выборке), среднего квадратичного отклонения (корень из дисперсии), дисперсии (квадрат отклонений от средней), минимальное и максимальное значения. Показателями формы распределения являются эксцесс и коэффициент ассиметрии.

Эти задачи реализуются табличными редакторами с использованием различных инструментов:

  1. самый простейший был рассмотрен выше – это построение сводных таблиц и подведение промежуточных итогов. Таким же способом можно оценивать некоторые характеристики рассеяния (вариации) генеральной совокупности, например, дисперсию и среднее квадратическое отклонение. Эти значения исчисляются в случае установки типов функции при задании параметров полей данных.

Рисунок. Окно выбора категории и типа конкретной функции в Excel.

  1. другим способом является использование мастера функций, с помощью которого можно вычислить значение любой статистической функции из списка встроенных в Excel или OrgCalc. Алгоритм решения аналогичен алгоритму расчета любой другой функции. Приемы использования функций для всех электронных таблиц идентичны. Некоторые отличия имеются в форме окна.

Вначале подробно рассмотрим технологию создания расчетной функции средствами редактора Excel. Мастер функций состоит из двух шагов: выбор категории и типа конкретной функции, задание параметров и переменных для вычисления значений.

Алгоритм выполнения операции: меню Вставка → Функции fx или соответствующую кнопку на стандартной панели инструментов → открывается окно мастера функций, в котором в поле категория требуется выбрать группу статистические, а в поле выбери функцию – аббревиатуру конкретной функции → ОК → открывается окно для ввода аргументов функции, где использую операцию сворачивания окна в строку, можно выделить диапазон аргументов для расчета функции → ОК

Рисунок. Окно задание параметров и переменных

для вычисления значений.

Замечание: Excel имеет очень широкий спектр статистических функций (более 80), а не только рассмотренные выше. Среди перечня статфункций можно выделить несколько укрупненных групп:

  • функции для вычисления вероятностей и моделирования распределений случайных величин (ВЕРОЯТНОСТЬ, БЕТАРАСП, ПУАСОН),

  • функции статистического оценивания параметров выборки и генеральной совокупности (арифметическая СРЗНАЧ, СРЗНАЧА и УРЕЗСРЕДНЕЕ, геометрическая СРГЕОМ, гармоническая СРГАРМ, квадратическая, кубическая и т. д., а также структурные средние такие как мода МОДА и медиана МЕДИАНА, среднее квадратическое отклонение КВАДРОТКЛ, дисперсия ДИСП, ДИСПА, ДИСПР, ДИСПРА, минимальное МИН, МИНА, максимальное МАКС , МАКСА значения, количество аргументов в списке СЧЕТ),

  • функции для проверки статистических гипотез (FРАСП, ХИ2РАСП)

  • анализа временных рядов (РОСТ, ТЕНДЕНЦИЯ), дисперсионного (стандартное отклонение СТАНДАРТОТКЛ) и регрессионного анализов (КОРРЕЛ, КОВАР), а также расчета статистических моделей выравнивания и прогнозирования (ЛИНЕЙН, ЛГРФПРИБЛР).

Алгоритм вычисления значения для всех функций абсолютно идентичен. Кроме того, возможно вычисление этих и всех других показателей путем создания формулы в явном виде в форме арифметического выражения, с использованием абсолютной или относительной ссылки и промежуточных расчетов. Для автоматической установки абсолютной ссылки используется клавиша F4, она приводит к появлению знака $ перед именем столбца и номером строки.

В редакторе OrgCalc мастер ввода функции одношаговый. Данный мастер может активизироваться аналогично Excel через меню ВставкаФункции fx или соответствующую кнопку на стандартной панели инструментов, или используя специальную область задач. Эта область открывается через меню ВставкаСписок функции. Список встроенных статистических функций меньше, чем в Excel, названия функций представлены в англоязычном варианте, но выделенные группы совпадают.

Окно для ввода функции содержит идентичные поля и организационные структуры, отличающиеся месторасположением. В левой части представлены поля для выбора категории и типа функции, а в правой только после выбора конкретной функции появляются поля для ввода аргументов. Отличительной особенностью OrgCalc является наличие вкладки Структура, которая служит для отображения иерархической структуры текущей функции. Такая вкладка представляет дополнительные удобства при формировании и редактировании сложных функций (встроенных друг в друга) и функций многих аргументов (где в качестве аргументов используются массивы данных).

Рисунок. Мастер функций редактора OrgCalc.

Замечания. а) Для автоматической установки абсолютной ссылки в OrgCalc используется сочетание клавиш SHIFT+F4.

б) На вкладке Структура для контроля ввода функции подсвечиваются её структурные составляющие, голубыми точками отмечаются правильно введенные аргументы, а красными - неправильные типы данных.

в) Окно мастера имеет две кнопки, позволяющие исправлять ошибки при вводе функции. Назад служит для перемещения фокуса на шаг назад (при этом компоненты формулы выделяются) и Далее - для перемещения вперед в окне формулы (эту кнопку можно также использовать для выбора функций, при нажатии этой кнопки выбранная функция будет вставлена в окно формулы).

г) в левой нижней части окна имеется указатель Массив, установка флажка в который определяет, что применяется функция массива. В Excel подобный элемент отсутствует. Однако и тот и другой пакеты могут использовать функцию массива в двух вариантах: если аргументами функции являются массивы (в этом случае они указываются как диапазоны или через запятую), если результат функции выступает как массив, т.е. выводится не в одной клетке, а занимает диапазон. OrgCalc допускает второй вариант обращения к формуле массива идентичный редактору Excel - использование сочетания клавиш SHIFT+CTRL+ENTER вместо клавиши ENTER. Только после этого формула становится формулой массива. Максимальный размер массива - 128 на 128 ячеек.

  1. описательная статистика. Описательная (дескриптивная) статистика – получение статистических показателей, с помощью которых обобщаются характеристики наблюдаемой совокупности. Задача ее заключается в том, чтобы дать наиболее сжатую и концентрированную характеристику изучаемого явления. Методы описательной статистики включают сбор данных по всем единицам изучаемой совокупности, их обработку, получение сводных показателей. Этот инструмент в качестве самостоятельной комплексной конструкции включен в так называемый Пакет анализа. Заметим, что редактор OrgCalc аналогичного инструмента не имеет. Анализ данных представляет собой встроенный в редактор Excel самостоятельный пакет, содержащий функции и интерфейсы для анализа научных и финансовых данных, позволяющий реализовывать различные методы их статистической обработки в т. ч. корреляционно-регрессионный анализ, дисперсионный анализ, операции сглаживания и пр. Первоначально его требуется установить: меню СервисНадстройки → поставить флажок в позиции Пакет анализа → ОК

Рисунок. Окно выбора надстроек в редакторе Excel.

После выполнения данной операции опция Анализ данных появляется в меню Сервис, теперь возможна её активизация.

Рисунок. Окно Описательная статистика редактора Excel.

Рассмотрим возможности и способы функционирования интерфейса Описательная статистика.

Алгоритм выполнения операции: меню СервисАнализ данных Описательная статистика → ОК → открывается окно, в котором требуется задать входной интервал, содержащий анализируемые данные (диапазон должен состоять не менее чем из двух строк или столбцов), → указать способ группировки: По столбцам или По строкам → наличие или отсутствие меток в первой строке или в первом столбце → устанавливаются параметры вывода → ОК. К параметрам вывода относится указание места для вывода результата (новый лист, книга или выделенный интервал на данном), выбор уровня надежности, значимости, достоверности (значение 95% задает уровень надежности вычислений среднего со значимостью 0.05), возможность определения К-ого наибольший или наименьшего элемента совокупности и расчета показателей итоговой статистики: среднего, стандартной ошибки (среднего), медианы (делит совокупность на две части, содержащие равное количество элементов), моды (наиболее часто встречающийся элемент выборки), стандартного отклонения, дисперсии выборки, эксцесса (оценивает остроту пика распределения), асимметричности, интервала (или размах, разница между максимальным и минимальным элементами), минимума, максимума, итоговой суммы, количества элементов в выборке.

В редакторе OrgCalc все эти показатели требуется рассчитывать только с использование мастера функций. В таблице представлены соответствующие функции.

Таблица. Функции для определения характеристик

описательной статистики, используемые в OrgCalc

Название

Вычисляемая величина

SMALL

Возвращает k-ое наименьшее значение в множестве данных.

LARGE

Возвращает k-ое наибольшее значение во множестве данных

AVERAGE

Вычисляет среднее значение аргументов

DEVSQ

Вычисляет сумму квадратов отклонения выборки от среднего значения

MEDIAN

Возвращает медиану множества чисел. Во множестве, которое включает нечетное количество значений, медиана — это число, которое является серединой множества. Во множестве, которое включает четное количество значений, медиана — среднее арифметическое двух чисел в середине множества.

MODE

Вычисляет наиболее общее значение множества данных. Если существует несколько значений с одинаковой частотой, возвращается наименьшее из них. Если повторяющихся значений нет, выдается ошибка.

STDEV

Вычисляет стандартное отклонение на основе выборки

VAR

Вычисляет дисперсию по выборке.

KURT

Вычисляет эксцесс множества данных (по меньшей мере 4 значений).

SKEW

Возвращает асимметрию распределения.

MAX

Возвращает максимальное значение из списка аргументов.

MIN

Возвращает минимальное значение из списка аргументов.

SUMM

Вычисляет сумму аргументов в списке.

COUNT

Служит для подсчета количества чисел в списке аргументов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]