Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекция1_мгупи_obr.docx
Скачиваний:
4
Добавлен:
01.03.2025
Размер:
641.32 Кб
Скачать

Базовые понятия обработки экспериментальных данных

Что такое переменная?

Переменная (английский термин variable) –это то, что можно измерять, контролировать или чем можно манипулировать в исследованиях. Иными словами, переменная –это то, что варьируется, изменяется, а не является постоянным (от английского корня var).

Например, измеряя давление или содержание лейкоцитов в крови, вы получаете различные значения у разных пациентов или значения для одного и того же пациента в разное время суток. Измеряя уровень осадков, получаете различные значения в разные дни недели, а также различные значения в одни и те же дни в разных точках географической карты. Другие примеры переменных из разных областей; анкетные данные, систолическое давление пациентов, количество лейкоцитов в крови, цена

акций, товаров, услуг, потребление, инвестиции, доход, государственные закупки товаров и услуг, инструмент государственного регулирования (в экономике), рейтинг программ, доля зрителей, количество посещений сайта (в рекламе); скорость, температура, объем, масса в (физике) и т. д.

Очевидно, что это очень разные по своим свойствам переменные, и поэтому можно сказать, что переменные отличаются характеристиками, в частности, той ролью, которую они играют в исследованиях, типом измерений и т. д.

Основные статистические характеристики.

Так как значения переменных не постоянны, нужно научиться описывать их изменчивость. Для этого придуманы описательные или дескриптивные статистики:

минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана,

квартили, мода и т.д. Эти элементарные понятия лежат в основе всех процедур анализа данных. Идея этих статистик очень проста: вместо того чтобы рассматривать все

значения переменной, а их может быть очень много (тысячи и миллионы),

вначале стоит просмотреть описательные статистики. Они дают общее представление о значениях, которые принимает переменная. Кратко перечислим основные:

Минимум и максимум –это минимальное и максимальное значения переменной.

Среднее -сумма значений переменной, деленная на n (число значений переменной).

Дисперсия (от английского variance) и стандартное отклонение (от английского standard deviation) –наиболее часто используемые меры изменчивости переменной. Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны.

Стандартное отклонение вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего. Часто стандартное отклонение –более удобная характеристика, так как измерена в тех же единицах, что исходная величина.

Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина –выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например при описании доходов населения, медиана более удобна, чем среднее.

Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам. Таким образом, медиана и квартили делят диапазон значений

переменной на четыре равные части.

Различают верхнюю квартиль, которая больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижнюю квартиль, которая меньше медианы и делит пополам нижнюю часть выборки.

Нижнюю квартиль часто обозначают символом 25%, это означает, что 25% значений переменной меньше нижней квартили.

Верхнюю квартиль часто обозначают символом 75%, это означает, что 75% значений переменной меньше верхней квартили.

Мода представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее модное значение переменной), например популярная передача на телевидении, модный цвет платья или марка автомобиля и т. д.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]