Шкалы измерений признаков.
Измерение – присвоение символов элементам совокупности.
Символы могут быть числовыми или символьными
4 Типа шкал измерений:
Шкала наименований (например: пол [можем сказать, что пол одного индивида отличен от другого])
Порядковая шкала (например: социальное положение [можем сказать, что положения отличны и выше, чем у другого])
Интервальная шкала (например: интервальная шкала [можем сказать, что температура одного отлична от другого, что она выше и на сколько выше])
Шкала отношений (например: рост [можем сказать, что температура одного отлична от другого, что она выше, на сколько выше и во сколько раз выше])
Группировки статистических данных.
Группировка – разделение всей совокупности объектов на однородные группы по какому-либо признаку.
Для проведения группировки следует:
Задать признак
Определить число выделяемых групп. Если признак качественный, то число групп равно числу значений признаков. Если признак количественный, то число групп задается исследователем
Выбрать статистические показатели групп
Понятие средней величины, виды и формы средних величин.
Средняя величина – обобщающая характеристика изучаемого признака в исследуемой совокупности.
Она отражает типичный уровень признака в расчете на единицу совокупности в конкретных условиях места и времени (например: средний доход на 1-го рабочего; число детей на 1-го учителя).
Средняя величина, рассчитанная по совокупности, называют общей средней.
Средняя величина, исчисляемая для каждой группы, называют групповой.
Существует 2 категории средних величин: степенные и структурные средние.
Простые средние: среднее арифметическое X̅1=(1/n)*(ΣXi), если k=1; среднее квадратическое X̅2=((1/n)*(ΣXi2))1/2 если k=2; среднее гармоническое X̅-1=((1/n)*(Σ1/Xi))-1 если k=-1; среднее геометрическое X̅0=(X1…Xn)1/2=(ПХi)1/n если k=0.
Взвешенные средние: среднее взвешенное арифметическое X̅=(ΣXi*fi)/Σfi; среднее взвешенное квадратическое X̅=((ΣXi2*fi)/Σfi)1/2; среднее взвешенное гармоническое; среднее взвешенное геометрическое X̅=(X1f1…Xnfn)1/Σfi
Вариационный ряд и его показатели (мода, медиана, коэффициенты .асимметрии и
эксцесса).
Вариация – различие в значениях признака единиц совокупностей в один и тот же момент времени.
Варианта – значение признака.
Вариационный ряд – упорядоченное распределение единиц совокупности по возрастающим значениям признака.
Мода – это наиболее часто встречающиеся значения признака.
Медиана – это такое значение признака, которое делит вариационный ряд пополам, так что одна половина значений ряда больше медиана, а другая – меньше.
Коэффициент эксцесса - разброс значений нашего распределения относительно нормального. Чем меньше коэффициент эксцесса, тем меньше разброс.
Коэффициент асимметрии - ??? если асимметрия вправо, то она >0; если влево, то <0
Показатели размера и интенсивности вариации.
Размах: R=maxX – minX
Среднее линейное отклонение: d= (Σ|Xi- X̅|*fi)/ Σfi
Среднее квадратическое отклонение: ϭ =((Σ(Xi- X̅)2*fi)/ Σfi)1/2
Дисперсия: ϭ2 =(Σ(Xi- X̅)2*fi)/ Σfi
Коэффициент вариации: V= ϭ/ X̅
Коэффициент осцилляции: ν=R/ X̅
Выборочное наблюдение, повторный и бесповторный отбор, ошибки выборки.
Статистическое наблюдение – научно-организационный способ сбора информации о статистической совокупности.
Выборочное наблюдение – вид статистического наблюдения, при котором обследованию подвергается только часть совокупности.
Повторная выборка – выбор с возвращением [1/N]
Бесповторная выборка – выборка без возвращения [1/(N-1); 1/(N-2)…]
Ошибки выборки: Средняя; предельная; относительная.
Средняя ошибка выборочной средней для повторной выборки: µХ̂=√(ϭ2/n), ϭ2- дисперсия признака Х генеральной совокупности. ϭ2=(1/N) Σ(Xi-X̅), i=1…N
Средняя ошибка доли повторной выборки: µр̂= √(р(р-1)/n)
Средняя ошибка выборочной средней бесповторной выборки: µХ̂=√((ϭ2/n)*(1-n/N))
Средняя ошибка доли бесповторной выборки: µр̂= √((р(р-1)/n )*(1-n/N))
Предельная ошибка выборочной средней для повторной выборки: ΔХ̂=t*µХ̂; P{|X̅ - Х̂|≤t*µХ̂}=ɣ - доверительная вероятность
Предельная ошибка доли бесповторной выборки: Δр̂=t*µр̂
Относительная ошибка выборочной средней для повторной выборки: n=t2ν2/Δ2отн
Относительная ошибка выборочной средней для бесповторной выборки: n=(t2ν2)/(Δ2отн+ t2ν2/N)
Доверительные интервалы для параметров генеральной совокупности.
Необходимый объем наблюдений при заданной точности расчета и уровня доверия.
Вычисление необходимого объема выборки для повторной: ΔХ̂=t*√(ϭ2/n); ϭ при нормальном распределении = 1/6*(Хмакс-Хмин)
Для бесповторной: ΔХ̂=t*√((ϭ2/n) *(1-n/N))
Формы организации выборочного наблюдения.
Статистическая связь, парная корреляция, коэффициент корреляции Пирсона.
Статистическая связь – связь между признаками, проявляющаяся для массовых явлений.
Корреляционная связь – когда среднее значение одной переменной изменится при изменении другой.
Коэффициент корреляции Пирсона: ρ̂(X,Y)=(X̅Y̅ - X̅*Y̅)/((√(X̅2-(X̅)2)* (√(Y̅2-(Y̅)2)))
X̅=1/n*ΣXi ; Y̅=1/n*ΣYi ; X̅Y̅=1/n*ΣXiYi ; X̅2=1/n*ΣXi2 ; Y̅2=1/n*ΣYi2 ; (X̅)2=(1/n*ΣXi)2 ; (Y̅)2=(1/n*ΣYi)2
Коэффициент корреляции – мера линейной связи между переменными X и Y. -1≤ ρ̂≤1; ρ̂-безразмерная величина
Y=a+bX; ρ̂=1, если b>0; ρ̂=-1, если b<0; если ρ̂=0, то X и Y – неколлерируемые; если X и Y независимые, то ρ̂=0, наоборот не действует. F(x;y)=FX(x)*FY(y) – это означает независимость X и Y.
Ранговый коэффициент корреляции Спирмена.
Ранг – номер элемента в вариационном ряде
Xi соответствует Ri ; Yi соответствует Si
Если подставить в коэффициент корреляции Спирмена вместо X и Y, Ri и Si, то после вычислений придём к формуле: r(X;Y)=1-(6*Σ(Ri - Si)2/n(n2-1))
Уравнение парной регрессии. Метод наименьших квадратов.
Парная регрессия - мера связи между переменными X и Y.
МНК: Q(a,b)=Σ(Yi-a-bXi)2- нужно подобрать â и b̂ такие, что бы minQ(a;b)=Q(â;b̂), т.е. что бы ошибка была минимальной.
â=Y̅-b̂X̅
b̂=(X̅Y̅ - X̅*Y̅)/√(X̅2-(X̅)2)
Через эти 2 точки проводим прямую на диаграмме рассеивания (поле корреляции)
Частная корреляция.
Частный коэффициент корреляции - это мера линейной зависимости между двумя переменными, из некоторой совокупности, когда исключено влияние остальных переменных (случайные величины).
Таблица сопряженности двух признаков. Критерий независимости признаков хи-
квадрат. Коэффициенты взаимной сопряженности.
Понятие индекса, виды индексов.
Индекс – показатель сравнения двух состояний одного и того же явления и представляет собой относительную величину. Состояния рассматриваются по времени, в пространстве или в соответствии с планом.
Каждый индекс включает данные за два периода: отчетный (1) и базисный (0)
Рассмотрим следующую систему признаков: q – объем продаж p – цена w=qp – выручка от реализации
Виды индексов:
Индивидуальные – рассчитываются по отдельным единицам совокупности: iq=q1/q0; ip=p1/p0; iw=w1/w0
Обобщенные – отражают изменение обобщенных величин по всей совокупности, позволяет соизмерить разнообразные элементы совокупности: Iw=Σwk1/ Σwk0= Σpk1qk1/ Σpk0/ Σqk0
Простые - признак изучается без учета связи с другими признаками.
Аналитические - признак рассматривается во взаимосвязи с другими; они выполняют аналитическую функцию: позволяют измерять вклад отдельных факторов в совокупное изменение результата.
Агрегатные признаки – содержит признак –вес, который позволяет обобщить разнообразные элементы совокупности.
Индекс объема продаж Ласпейреса: IqЛ= Σpk0qk1/ Σpk0qk0
Индекс цен Ласпейреса: IpЛ= Σpk1qk0/ Σpk0Σqk0
Индекс объема продаж Пааше: IqП= Σpk1qk1/ Σpk1Σqk0
Индекс цен Пааше: IpП= Σpk1qk1/ Σpk0Σqk1
Индекс объема продаж Фишера: IqФ= √( IpЛ* IqП)
Индекс цен Фишера: IpФ= √( IpЛ* IpП)
Агрегатные индексы, абсолютные изменения за счет отдельных факторов
Индексы переменного и постоянного состава, индекс структуры.
Индекс переменного состава служит для изучения динамики средних величин и выявления факторов влияющих на динамику средневзвешенных: Iперем=X̅1/X̅0=ΣXk1dk1/ΣXk0dk0; d=f/Σf
Он характеризует изменение среднего уровня признака (Х), за счет влияния двух факторов:
Изменение значений усредняемого признака (Х) о отдельных элементов совокупности
Структурных изменений (изменения доли отдельных единиц совокупности в общей их численности) –признак d
Индекс постоянного состава показывает средний размер изменения изучаемого признака (Х) у отдельных единиц совокупности, при изоляции действия второго фактора: Iпост= ΣXk1dk1/ΣXk0dk1
Индекс структуры характеризует влияние изменения структуры изучаемой совокупности на динамику среднего уровня признака: Iструкт= ΣXk0dk1/ΣXk0dk0
Iперем= Iпост* Iструкт