Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
704817.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
315.17 Кб
Скачать

43 Дескриптивные и графические методы анализа данных. Гистограмма: эмпирическая функция распределения. .

Д ескриптивное- это описательные методы анализа данных, а графические методы в виде наглядных диаграмм, графиков, рисунков. Описательное (дескриптивное) исследование в оценке проводится для того, чтобы описать то, как реализовывалась программа, какие мероприятие были проведены, какие ресурсы были затрачены, какие результаты достигнуты и т. п. Данный вид исследования неоценивает конкретно качественные или количественные характеристики программы, оно оптимизирует набор данных характеристик иоценивает программу, как с качественной, так и с количественной стороны. Дескриптивная статистика пытается выявить причину возникновения того или иного явления, касательно программы и эффект, появившийся в связи с этим явлением. Типы вопросов, которые ставятся в ходе оценивания программы, позволяют достаточно точно провести исследование и сделать выводы. Описательное (дескриптивное) исследование может быть как качественным, так и количественным. В данном исследовании могут совмещаться как числовые, так и качественные данные, которые в ходе исследования могу быть объединены, так и разделены, в зависимости, от того какая характеристика программы оценивается. Данные, полученные в ходе описательного исследования, могут группироваться в таблицы, графики, а также интерпретироваться в описательной форме. Дескриптивное исследование позволяет придавать данным более удобные для проведения оценки программ вид. Данный вид исследования оптимизирует коллекцию данных и методы оценки, с помощью нахождения статистических характеристик и взаимосвязей между данными, что позволяет проводить оценивание более эффективными способами. Пример графического анализа данных: Гистограмма висячих столбцов является "наглядным критерием проверки на нормальность распределения", который помогает определить области распределения, где возникают расхождения между наблюдаемыми и ожидаемыми нормальными частотами.  диаграммы рассеяния используются для визуализации взаимосвязей между двумя переменными X и Y (например, весом и ростом). На этих диаграммах отдельные точки данных представлены маркерами на плоскости, где оси соответствуют переменным. Две координаты (X и Y), определяющие положение точки, соответствуют значениям переменных. Если между переменными существует сильная взаимосвязь, то точки на графике образуют упорядоченную структуру (например, прямую линию или характерную кривую). Если переменные не взаимосвязаны, то точки образуют "облако". Одним из наиболее широко используемых типов графического представления данных являются  круговые диаграммы, на которых показаны пропорции или сами значения переменных. Категоризованные графики этого типа состоят из нескольких круговых диаграмм, где данные разделены по группам с помощью одной или несколькихгруппирующих переменных или категоризованы согласно логическим условиям выбора подгрупп.

Эмпирическая функция распределения:

nx-число наблюдений, при которых наблюдалось значение признака варианты меньше, чем х

n-общее число наблюдений (объём выборки)

x<x

-частота события, когда x<x

Эмперической функцией распределения случ.величины x наз.функцию F*ξ(x), определяющую для каждого значения x относительную частоту событий:

Недостатки:

Невысокая наглядность (визуально сложно определить закон распределения сл.величины x)

Гистограмма и полигон относит.частот:

Полигоном частот наз.ломаную, отрезки к-ой соединяют xi и ni.

Площадь гистограммы частот =сумме всех частот, то есть объёму выборки.