Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы по статистике.docx
Скачиваний:
20
Добавлен:
23.11.2019
Размер:
420.5 Кб
Скачать
  1. Показатели вариации, их познавательное значение.

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения – атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит названиевариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум – это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k – число вариантов значений признака. Частоты удобно заменять частостями – wi. Частость – относительный показатель частоты – может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

– абсолютное значение (модуль) отклонения варианта от средней арифметической; f–частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая – в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия (σ2) – средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:

– наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

  1. Свойства дисперсии. Правило сложения (разложения) дисперсии и его использование в статистическом анализе.

Дисперсия любой случайной величины независимо от вида распределения, которому она подчиняется обладает следующими свойствами.

1.дисперсия неслучайной величины равно нулю.

Пусть а - неслучайная величина. Тогда d(a)=m[(a-m(a))2]=m[0]=0.

2. Дисперсия суммы неслучайной и случайной величин равна дисперсии случайной величины (дисперсия инвариантна сдвигу).

Пусть а - неслучайная величина. Тогда d(a+x)=m[(a+x-m(a+x))2]= m[(x-m(x))2]=d(x).

3.дисперсия произведения неслучайной величины на случайную равна произведению случайной величины на квадрат неслучайной величины.

Пусть а - неслучайная величина. Тогда d(a*x)=m[(a*x-m(a*x))2]=m[(a*(x-m(x))2]=

=m[a2*(x-m(x))2]=a2*d(x).

4. Дисперсия суммы двух случайных величин равна сумме дисперсий этих величин и удвоенной ковариации этих величин.

Пусть x и у - случайные величины. Тогда d(x+y)=m[((x+y)-m(x+y))2]= =m[((x-mx)+(y-my))2]=m[(x-mx)2+(y-my)2+2*(x-mx)*(y-my)]=m[(x-mx)2]+ +m[(y-my)]+2*m[(x-mx)*(y-my)]=d(x)+d(y)+2*cov(x,y).

Величина cov(x,y)=m[(x-mx)*(y-my)] называется ковариацией и обладает свойством: для независимых случайных величин ковариация всегда равна нулю. Отсюда, следует: дисперсия суммы двух независимых (и только независимых) случайных величин равна сумме дисперсий этих величин.

. Виды дисперсий, правило сложения дисперсий,

Виды дисперсий:. Общая дисперсия измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значение признака х от общей средней величины и может быть вычислена как простая дисперсия или взвешенная дисперсия . Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней : , где f – числ-ть единиц в группе. Внутригрупповая (частная) дисперсия отражает случайную вариацию неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировка. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы xi (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия . На основании внутригрупповой дисперсии по каждой группе, т.е. На основании можно определить общую среднюю из внутригрупповых дисперсий: . Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:. Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью – неизвестную. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак. Поэтому в статистическом анализе широко используется эмпирический коэф-т детерминации - показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и хар-щий силу влияния группировочного признака на образование общей вариации: . При отсутствии связи эмпирический коэффициент детерминации равен 0, а при функциональной связи – 1. Эмпирическое корреляционное отношение – это корень квадратный из эмпирического коэф-та детерминации: . Он показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно 0, т.е. Все групповые средние будут равны м/у собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно 1. В этом случае дисперсия групповых средних равна общей дисперсии , т.е. Внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]