Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика (зачёт).docx
Скачиваний:
3
Добавлен:
23.09.2019
Размер:
41.57 Кб
Скачать

Шкалы измерений признаков.

Измерение – присвоение символов элементам совокупности.

Символы могут быть числовыми или символьными

4 Типа шкал измерений:

  • Шкала наименований (например: пол [можем сказать, что пол одного индивида отличен от другого])

  • Порядковая шкала (например: социальное положение [можем сказать, что положения отличны и выше, чем у другого])

  • Интервальная шкала (например: интервальная шкала [можем сказать, что температура одного отлична от другого, что она выше и на сколько выше])

  • Шкала отношений (например: рост [можем сказать, что температура одного отлична от другого, что она выше, на сколько выше и во сколько раз выше])

Группировки статистических данных.

Группировка – разделение всей совокупности объектов на однородные группы по какому-либо признаку.

Для проведения группировки следует:

  • Задать признак

  • Определить число выделяемых групп. Если признак качественный, то число групп равно числу значений признаков. Если признак количественный, то число групп задается исследователем

  • Выбрать статистические показатели групп

Понятие средней величины, виды и формы средних величин.

Средняя величина – обобщающая характеристика изучаемого признака в исследуемой совокупности.

Она отражает типичный уровень признака в расчете на единицу совокупности в конкретных условиях места и времени (например: средний доход на 1-го рабочего; число детей на 1-го учителя).

Средняя величина, рассчитанная по совокупности, называют общей средней.

Средняя величина, исчисляемая для каждой группы, называют групповой.

Существует 2 категории средних величин: степенные и структурные средние.

Простые средние: среднее арифметическое X̅1=(1/n)*(ΣXi), если k=1; среднее квадратическое X̅2=((1/n)*(ΣXi2))1/2 если k=2; среднее гармоническое X̅-1=((1/n)*(Σ1/Xi))-1 если k=-1; среднее геометрическое X̅0=(X1…Xn)1/2=(ПХi)1/n если k=0.

Взвешенные средние: среднее взвешенное арифметическое X̅=(ΣXi*fi)/Σfi; среднее взвешенное квадратическое X̅=((ΣXi2*fi)/Σfi)1/2; среднее взвешенное гармоническое; среднее взвешенное геометрическое X̅=(X1f1…Xnfn)1/Σfi

Вариационный ряд и его показатели (мода, медиана, коэффициенты .асимметрии и

эксцесса).

Вариация – различие в значениях признака единиц совокупностей в один и тот же момент времени.

Варианта – значение признака.

Вариационный ряд – упорядоченное распределение единиц совокупности по возрастающим значениям признака.

Мода – это наиболее часто встречающиеся значения признака.

Медиана – это такое значение признака, которое делит вариационный ряд пополам, так что одна половина значений ряда больше медиана, а другая – меньше.

Коэффициент эксцесса - разброс значений нашего распределения относительно нормального. Чем меньше коэффициент эксцесса, тем меньше разброс.

Коэффициент асимметрии - ??? если асимметрия вправо, то она >0; если влево, то <0

Показатели размера и интенсивности вариации.

Размах: R=maxX – minX

Среднее линейное отклонение: d= (Σ|Xi- X̅|*fi)/ Σfi

Среднее квадратическое отклонение: ϭ =((Σ(Xi- X̅)2*fi)/ Σfi)1/2

Дисперсия: ϭ2 =(Σ(Xi- X̅)2*fi)/ Σfi

Коэффициент вариации: V= ϭ/ X̅

Коэффициент осцилляции: ν=R/ X̅

Выборочное наблюдение, повторный и бесповторный отбор, ошибки выборки.

Статистическое наблюдение – научно-организационный способ сбора информации о статистической совокупности.

Выборочное наблюдение – вид статистического наблюдения, при котором обследованию подвергается только часть совокупности.

Повторная выборка – выбор с возвращением [1/N]

Бесповторная выборка – выборка без возвращения [1/(N-1); 1/(N-2)…]

Ошибки выборки: Средняя; предельная; относительная.

Средняя ошибка выборочной средней для повторной выборки: µХ̂=√(ϭ2/n), ϭ2- дисперсия признака Х генеральной совокупности. ϭ2=(1/N) Σ(Xi-X̅), i=1…N

Средняя ошибка доли повторной выборки: µр̂= √(р(р-1)/n)

Средняя ошибка выборочной средней бесповторной выборки: µХ̂=√((ϭ2/n)*(1-n/N))

Средняя ошибка доли бесповторной выборки: µр̂= √((р(р-1)/n )*(1-n/N))

Предельная ошибка выборочной средней для повторной выборки: ΔХ̂=t*µХ̂; P{|X̅ - Х̂|≤t*µХ̂}=ɣ - доверительная вероятность

Предельная ошибка доли бесповторной выборки: Δр̂=t*µр̂

Относительная ошибка выборочной средней для повторной выборки: n=t2ν22отн

Относительная ошибка выборочной средней для бесповторной выборки: n=(t2ν2)/(Δ2отн+ t2ν2/N)

Доверительные интервалы для параметров генеральной совокупности.

Необходимый объем наблюдений при заданной точности расчета и уровня доверия.

Вычисление необходимого объема выборки для повторной: ΔХ̂=t*√(ϭ2/n); ϭ при нормальном распределении = 1/6*(Хмаксмин)

Для бесповторной: ΔХ̂=t*√((ϭ2/n) *(1-n/N))

Формы организации выборочного наблюдения.

Статистическая связь, парная корреляция, коэффициент корреляции Пирсона.

Статистическая связь – связь между признаками, проявляющаяся для массовых явлений.

Корреляционная связь – когда среднее значение одной переменной изменится при изменении другой.

Коэффициент корреляции Пирсона: ρ̂(X,Y)=(X̅Y̅ - X̅*Y̅)/((√(X̅2-(X̅)2)* (√(Y̅2-(Y̅)2)))

X̅=1/n*ΣXi ; Y̅=1/n*ΣYi ; X̅Y̅=1/n*ΣXiYi ; X̅2=1/n*ΣXi2 ; Y̅2=1/n*ΣYi2 ; (X̅)2=(1/n*ΣXi)2 ; (Y̅)2=(1/n*ΣYi)2

Коэффициент корреляции – мера линейной связи между переменными X и Y. -1≤ ρ̂≤1; ρ̂-безразмерная величина

Y=a+bX; ρ̂=1, если b>0; ρ̂=-1, если b<0; если ρ̂=0, то X и Y – неколлерируемые; если X и Y независимые, то ρ̂=0, наоборот не действует. F(x;y)=FX(x)*FY(y) – это означает независимость X и Y.

Ранговый коэффициент корреляции Спирмена.

Ранг – номер элемента в вариационном ряде

Xi соответствует Ri ; Yi соответствует Si

Если подставить в коэффициент корреляции Спирмена вместо X и Y, Ri и Si, то после вычислений придём к формуле: r(X;Y)=1-(6*Σ(Ri - Si)2/n(n2-1))

Уравнение парной регрессии. Метод наименьших квадратов.

Парная регрессия - мера связи между переменными X и Y.

МНК: Q(a,b)=Σ(Yi-a-bXi)2- нужно подобрать â и b̂ такие, что бы minQ(a;b)=Q(â;b̂), т.е. что бы ошибка была минимальной.

â=Y̅-b̂X̅

b̂=(X̅Y̅ - X̅*Y̅)/√(X̅2-(X̅)2)

Через эти 2 точки проводим прямую на диаграмме рассеивания (поле корреляции)

Частная корреляция.

Частный коэффициент корреляции - это мера линейной зависимости между двумя переменными, из некоторой совокупности, когда исключено влияние остальных переменных (случайные величины).

Таблица сопряженности двух признаков. Критерий независимости признаков хи-

квадрат. Коэффициенты взаимной сопряженности.

Понятие индекса, виды индексов.

Индекс – показатель сравнения двух состояний одного и того же явления и представляет собой относительную величину. Состояния рассматриваются по времени, в пространстве или в соответствии с планом.

Каждый индекс включает данные за два периода: отчетный (1) и базисный (0)

Рассмотрим следующую систему признаков: q – объем продаж p – цена w=qp – выручка от реализации

Виды индексов:

Индивидуальные – рассчитываются по отдельным единицам совокупности: iq=q1/q0; ip=p1/p0; iw=w1/w0

Обобщенные – отражают изменение обобщенных величин по всей совокупности, позволяет соизмерить разнообразные элементы совокупности: Iw=Σwk1/ Σwk0= Σpk1qk1/ Σpk0/ Σqk0

Простые - признак изучается без учета связи с другими признаками.

Аналитические - признак рассматривается во взаимосвязи с другими; они выполняют аналитическую функцию: позволяют измерять вклад отдельных факторов в совокупное изменение результата.

Агрегатные признаки – содержит признак –вес, который позволяет обобщить разнообразные элементы совокупности.

Индекс объема продаж Ласпейреса: IqЛ= Σpk0qk1/ Σpk0qk0

Индекс цен Ласпейреса: IpЛ= Σpk1qk0/ Σpk0Σqk0

Индекс объема продаж Пааше: IqП= Σpk1qk1/ Σpk1Σqk0

Индекс цен Пааше: IpП= Σpk1qk1/ Σpk0Σqk1

Индекс объема продаж Фишера: IqФ= √( IpЛ* IqП)

Индекс цен Фишера: IpФ= √( IpЛ* IpП)

Агрегатные индексы, абсолютные изменения за счет отдельных факторов

Индексы переменного и постоянного состава, индекс структуры.

Индекс переменного состава служит для изучения динамики средних величин и выявления факторов влияющих на динамику средневзвешенных: Iперем=X̅1/X̅0=ΣXk­1dk1/ΣXk0dk0; d=f/Σf

Он характеризует изменение среднего уровня признака (Х), за счет влияния двух факторов:

  • Изменение значений усредняемого признака (Х) о отдельных элементов совокупности

  • Структурных изменений (изменения доли отдельных единиц совокупности в общей их численности) –признак d

Индекс постоянного состава показывает средний размер изменения изучаемого признака (Х) у отдельных единиц совокупности, при изоляции действия второго фактора: Iпост= ΣXk­1dk1/ΣXk0dk1

Индекс структуры характеризует влияние изменения структуры изучаемой совокупности на динамику среднего уровня признака: Iструкт= ΣXk­0dk1/ΣXk0dk0

Iперем= Iпост* Iструкт