Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Международный государственный экологический университет им. А. Д. Сахарова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

otvety_stat_metody.docx

Скачиваний:

Добавлен:

24.09.2019

Размер:

1.8 Mб

Скачать

☆

<<< < Предыдущая 12 / 232 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 > Следующая >>>

Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных

Первое, с чем сталкивается исследователь при обработке данных, это контроль качества данных, который обычно включает следующие процедуры:

Проверку данных с целью выявления тех значений, которые логически несовместимы или противоречат предварительным сведениям о границах изменения отдельных переменных
Выявление резко выделяющихся по своей величине наблюдений
Восстановление пропущенных наблюдений, включая и наблюдения, которые были исключены по причине их чрезвычайно подозрительного характера
Проверка однородности нескольких групп исходных данных
Проверка статистической независимости наблюдений, представляющих исходные данные

Этапы обработки данных

Начальная обработка, т. е. представление исходных данных в подходящей для анализа форме, и проведение проверки качества данных
Предварительный анализ данных, направленный на выяснение общей формы данных и предложение путей более обстоятельного анализа
Итоговый анализ (статистическая обработка), цель которого – дать основу для выводов
Представление выводов в краткой и ясной форме

Вычислительные аспекты обработки данных

В настоящее время существует большое количество программных средств реализующих различные методы обработки данных:

SPSS, STADIA, STATISTICA, STATGRAPHIKS ЭВРИСТА

Тем не менее при использовании пакетов статистических программ принятие решений остается за исследователем. Программа освобождает исследователя только от рутинной вычислительной работы

Разновидности исследований. Шкалы измерений

Разновидности исследований:

Эксперимент (активный эксперимент). В этом случае система, над которой осуществляется наблюдение, построена самим исследователем и контролируется им. При этом, как правило, одно из возможных воздействий применяется к каждому объекту наблюдений (экспериментальной единице) и измеряется результат воздействия (отклик)
Пассивное наблюдение (пассивный эксперимент). В этом случае данные собираются от объектов, входящих в некоторую систему. При этом исследователь не имеет другого контроля над сбором данных, кроме, может быть, некоторого участия в проверке качества данных

Шкалы измерений:

Номинальная шкала (шкала наименований). Эта шкала используется только для того, чтобы отнести объект или индивидуум в определенный класс
Порядковая шкала. Эта шкала в дополнение к функции отнесения объектов в определенный класс также упорядочивает классы по степени выраженности заданного свойства
Интервальная шкала. Эта шкала позволяет не только классифицировать и упорядочивать объекты и индивидуумы, но и количественно оценивать различие между классами
Шкала отношений. Эта шкала отличается от интервальной шкалы лишь тем, что в ней задано абсолютное начало отсчета

Описательная статистика: Закон распределения случайной величины

Полное описание случайной величины дается законом распределения, который устанавливает зависимость между возможными значениями случайной величины и их вероятностями

Закон распределения случайной величины можно задать в виде графика, таблицы или аналитического выражения:

Ф ункцией распределения случайной величины X называется функция F(x), равная вероятности того, что случайная величина примет значение меньшее, чем x :

Вероятность попадания случайной величины в интервал от x₁ до x₂ равна разности функции распределения в точках x₁ и x₂ :

При достаточно широких предположениях о плотностях распределения случайных величин их сумма с ростом числа слагаемых ведет себя асимптотически нормально, что составляет содержание центральной предельной теоремы теории вероятностей

Т. е. если N достаточно велико, значение данных выборки будут иметь распределение, которое близко к нормальному (Гауссовскому) распределению

Нормальное распределение величины x описывается следующей функцией:

Характеристики распределения Гаусса:

оно симметрично относительно m
имеет максимум равный
монотонно убывает при возрастании |x-m|

Если совокупность случайных величин задана в виде набора дискретных значений, то математическое ожидание случайной величины определяется как среднее значение по выборке:

Числовой характеристикой, показывающей степень разброса значений случайной величины относительно математического ожидания, называется дисперсия

П оскольку дисперсия имеет размерность квадрата случайной величины, то для характеристики меры рассеяния значений случайной величины относительно математического ожидания пользуются среднеквадратическим отклонением σ, равным значению квадратного корня из дисперсии

<<< < Предыдущая 12 / 232 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.09.2019289.79 Кб7MVI-pochva.doc
#
16.11.2019971.26 Кб9obrabotka.doc
#
25.09.201996.86 Кб5otvety_k_testam_moya_redaktsia_pochti_vse.docx
#
21.09.201959.42 Кб4Otvety_OOP.docx
#
19.09.2019259.46 Кб62otvety_po_Operatsionnym_sistemam.docx
#
24.09.20191.8 Mб35otvety_stat_metody.docx
#
25.11.201989.6 Кб4Rak_zheludka_3.doc
#
15.02.20162.01 Mб101referat_informatika_Shuriberko.docx
#
23.09.20194.85 Mб7shp1-7_TsEL_E_33.docx
#
23.09.20191.45 Mб15ShPOR1_16_na_1.docx
#
03.08.2019161.19 Кб125shpory_himia.docx

Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных

Разновидности исследований. Шкалы измерений

Описательная статистика: Закон распределения случайной величины