 
        
        - •Статистическая обработка выборочных данных
- •Перечень основных понятий, определений и расчётных формул
- •Теории вероятности и аналитической статистики
- •Основы теории вероятности
- •Случайное событие
- •Вероятность события
- •Случайная величина
- •Закон распределения
- •Плотность распределения (плотность вероятности)
- •Математическое ожидание (среднее, среднее значение)
- •Дисперсия (рассеяние)
- •Среднеквадратическое отклонение (стандартное отклонение)
- •Нормальное распределение (распределение Гаусса)
- •Двумерное нормальное распределение
- •Коэффициент корреляции
- •Основы аналитической статистики Единица наблюдения
- •Генеральная совокупность
- •Выборка
- •Статистика
- •Ошибка оценки
- •Выборочное среднее
- •Выборочная дисперсия
- •Выборочное среднеквадратическое отклонение
- •Выборочная среднеквадратическая ошибка
- •Выборочный коэффициент корреляции
- •Гистограмма
- •Оценка доли качественного признака и её ошибка
- •Оценка математического ожидания количественного признака и её ошибка
- •Доверительный интервал
- •Необходимый объём выборки при оценке доли качественного признака
- •Необходимый объём выборки при оценке математического ожидания количественного признака
- •Роль нормального распределения в статистике
		 
		
Санкт-Петербургский юридический институт (филиал)
Академии Генеральной прокуратуры Российской Федерации
Сибаров К. Д.
Статистическая обработка выборочных данных
Методические указания
по выполнению самостоятельных и практических работ
по разделу «Аналитическая статистика»
курса «Информационные технологии в юридической деятельности»
Санкт-Петербург
2012
Задания для самостоятельной работы
Задание 1. Вычисление статистических характеристик качественного признака по выборочным данным
Исходные данные.
Имеется выборка объёмом n = … . Каждая единица наблюдения в выборке описывается наличием или отсутствием определённого качественного признака.
Интересующим качественным признаком обладают k единиц наблюдения. k = … .
Заданная
ошибка оценки доли качественного
признака для определения необходимого
объёма выборки составляет 
 = … .
= … .
Вычислить:
- оценку доли качественного признака по выборочным данным; 
- выборочную дисперсию оценки доли качественного признака; 
- среднеквадратическую ошибку оценки доли качественного признака; 
- нижнюю и верхнюю границы доверительного интервала для оценки по двукратной ошибке; 
- объём выборки, необходимый для обеспечения ошибки оценки доли качественного признака не более  . .
Задание 2. Вычисление статистических характеристик количественного признака по выборочным данным
Исходные данные.
Имеются выборочные значения (число вместе с единицей измерения, е.и.):
x1 = … е.и., x2 = … е.и., x3 = … е.и., x4 = … е.и., x5 = … е.и., x6 = … е.и., x7 = … е.и., x8 = … е.и., x9 = … е.и., x10 = … е.и., описывающие определённый количественный признак у отобранных единиц наблюдения.
Заданная относительная ошибка оценки математического ожидания количественного признака для определения необходимого объёма выборки составляет зад =… .
Вычислить:
- оценку математического ожидания количественного признака; 
- оценку дисперсии количественного признака; 
- оценку среднеквадратического отклонения количественного признака; 
- выборочную дисперсию оценки математического ожидания количественного признака; 
- среднеквадратическую ошибку оценки математического ожидания количественного признака; 
- нижнюю и верхнюю границы доверительного интервала для оценки математического ожидания количественного признака при доверительной вероятности 0,90, считая плотность распределения оценки близкой к нормальной; 
- объём выборки, необходимый для обеспечения относительной ошибки оценки математического ожидания признака не более зад . 
Вариант исходных данных для каждого студента содержит:
для
Задания 1 :
 n,
k
 и 
 ;
;
для Задания 2: е.и., x1, x2, x3, x4, x5, x6, x7, x8, x9, x10 и зад .
Требования к оформлению
- К проверке принимаются работы, выполненные рукописным (!) способом на листах формата A4 (можно на разворотах листов тетради в клетку, укороченных до нужной длины). 
- Работа должна иметь стандартный титульный лист, содержащий: название Института, кафедры, работы («Статистическая обработка выборочных данных»), тип работы (самостоятельная работа), Ф.И.О. студента и номер группы, Ф.И.О. преподавателя, город, год. 
- Вверху второй страницы оформленной работы должен быть прикреплён клеем или скобкой листок с вариантом исходных данных, полученный от преподавателя. 
- Перед изложением решения каждого задания должно быть приведено описание исходных данных с вписанными значениями, а в задании 2 и единицами измерения вместо сокращения «е.и.», в соответствии с вариантом (перечень подлежащих вычислению величин приводить не надо). 
- Каждый пункт решения должен быть озаглавлен сообразно тому, что в нём вычисляется. 
- Решение по каждому пункту должно содержать: 
– словесное определение вычисляемой величины;
– запись необходимой формулы;
– запись этой же формулы с подставленными в неё исходными данными;
– далее, для проверяемости, одно-два промежуточных упрощения;
– и окончательное значение (не менее 4 значащих цифр; округлять только при записи ответа ко всему заданию по правилам, приведённым ниже в п. 9).
- Предыдущее указание не относится к 1), 2) и 3) пунктам Задания 2. Для них также записываются определение, расчётные формулы, одно-два промежуточных упрощения, и окончательный результат, а подстановка исходных данных и промежуточные вычисления представляются после пункта 3) в виде таблицы, приведённой ниже. - i - xi - xi –  - ( xi –  )2 )2- 1 - 2 - … - 10 - : 
- В конце каждого из двух заданий должен быть помещён сводный ответ, в котором приводятся главные результаты обработки данных (ответы в пунктах заданий не нужны): 
– значение
оценки с указанием её среднеквадратической
ошибки в виде « 
 »
или «
»
или « 
 е.и.», где вместо букв подставляются
цифры, а в задании 2 и единицы измерения;
е.и.», где вместо букв подставляются
цифры, а в задании 2 и единицы измерения;
– доверительный интервал в виде « : от … до … при …», где вместо многоточий – нижняя и верхняя граница, а также указание или кратности ошибки, или доверительной вероятности (в предположении нормальности распределения оценки);
– необходимый объём выборки в виде «nнеобх = … при зад = …» или «nнеобх = … при зад = …», где вместо вторых многоточий указывается величина заданной ошибки, для которой он определён.
- При записи числовых значений в ответе должны быть учтены общепринятые правила округления, используемые при измерениях и приближённых вычислениях: 
- среднеквадратическая ошибка оценки округляется до единственной значащей цифры (например: 0,00685 округляется до 0,007; 13,4 округляется до 10); 
- значение оценки округляется до того разряда, в котором в округлённой среднеквадратической ошибке оставлена единственная значащая цифра (например: 0,3924 округляется до 0,392 , если ошибка 0,007; 127,2 округляется до 130, если ошибка 10); 
- границы доверительного интервала округляются так же, как и значение оценки; 
- необходимый объём выборки округляется в большую сторону до ближайшего целого. 
