
- •Билет№1
- •1. Значения термина «статистика». Предмет и метод статистики.
- •2. Анализ процессов на основе sqc. Основные понятия и задачи статистического анализа процессов на основе нормального закона распределения.
- •3. Семь простейших инструментов качества. Диаграмма разброса. Этапы построения.
- •Билет №2
- •1. Исторический обзор развития статистики как науки.
- •2. Контрольные карты накопленных сумм. Правила построения. Правила принятия решений при мониторинге и управлении процессом.
- •3. Семь простейших инструментов качества. Гистограмма. Типичные формы гистограмм.
- •Билет №3
- •1. Теория статистики как научная база при изучении курса «смКиУк»
- •2.Линейная регрессия. Гипотезы о значении коэффициентов линейной регрессии.
- •Проверка значимости коэффициентов простой линейной регрессии и адекватности регрессионной модели.
- •3. Семь простейших инструментов качества. Диаграмма Парето. Этапы построения. Принцип Парето.
- •Билет №4
- •1. Этапы статистического наблюдения. Формы организации статистического наблюдения.
- •2. Понятие о контрольных картах. Назначение контрольных карт.
- •3. Семь простейших инструментов качества. Временной ряд.
- •Билет №5
- •Виды статистического наблюдения. Способы статистического наблюдения. Виды статистического наблюдения
- •Способы статистического наблюдения
- •2.Показатели точности и стабильности процессов. Индекс воспроизводимости. Модифицированный индекс воспроизводимости.
- •3. Семь простейших инструментов качества. Диаграмма Парето. Этапы построения. Принцип Парето.
- •Билет №6
- •Организационные вопросы статистического наблюдения
- •2.Приемочные контрольные карты. Элементы приемочной контрольной карты. Построение приемочной контрольной карты и работа с ней.
- •Построение приемочной контрольной карты и работа с ней
- •7.1 Исходные данные и предположения
- •Билет №7
- •1. Ошибки статистического наблюдения и контроль данных наблюдения.
- •2. Кусум-карта. Методика построения шаблона.
- •1 Предварительные шаги при построении кусум-карты
- •3. Семь простейших инструментов качества. Причинно-следственная диаграмма Исикавы. Этапы построения. Мнемонический приём 4м…6м.
- •Билет№8
- •1. Сводка и группировка статистических данных. Виды группировок.
- •2. Возможность (осуществимость) процесса. Основные характеристики точности и стабильности технологической операции.
- •3. Семь простейших инструментов качества. Метод стратификации. Методика практического использования. Мнемонический приём 4м…6м.
- •Билет №9
- •1. Статистические таблицы. Способы статистического наблюдения.
- •2. Проверка гипотезы о независимости признаков и силе линейной связи.
- •3. Семь простейших инструментов качества. Причинно-следственная диаграмма Исикавы. Этапы построения. Мнемонический приём 4м…6м.
- •Билет№10
- •1. Обобщающие статистические показатели. Абсолютные величины. Относительные величины. Средние величины. Характеристики разброса.
- •2. Контрольные карты Шухарта по качественным признакам для управления процессами: np-карта, р-карта, u-карта, c-карта.
- •3. Семь простейших инструментов качества. Диаграмма разброса. Этапы построения. Типичные виды диаграмм разброса.
- •Билет№11
- •Характеристики разброса
- •Билет №12
- •1. Меры рассеивания, или разброс результатов наблюдения. Средние величины.
- •Билет №13
- •Вопрос1.Распределения дискретных случайных величин
- •Вопрос 2
- •Билет№14
- •Вопрос 1. Распределение Пуассона
- •Оценка значимости параметров взаимосвязи
- •8.4. Непараметрические методы оценки связи
- •Билет №15
- •Биноминальное распределение.
- •Методы случайного отбора выборок штучной продукции. Способы представления продукции на контроль.
- •Семь простейших инструментов качества. Временной ряд.
- •Билет№16
- •Гипергеометрическое распределение случайной величины. Гипергеометрическое распределение
- •Методы случайного отбора выборок штучной продукции. Методы отбора единиц продукции в выборку
- •Семь простейших инструментов качества. Диаграмма Парето. Этапы построения. Принцип Парето.
- •Билет №17
- •1. Нормальный закон распределения непрерывной случайной величины. Кривые нормального распределения.
- •2. Корреляция. Ранговые коэффициенты корреляции.
- •3. Семь простейших инструментов качества. Временной ряд.
- •Билет№18
- •1. Функция стандартного нормального распределения. Плотность нормального распределения.
- •2. Правила принятия решений при спк кп при контроле потребителя по методу доверительных границ.
- •Билет №19
- •1. Статистический приемочный контроль качества продукции по альтернативному признаку. Понятие выборочного плана и схемы контроля.
- •2.Статистики числовых характеристик двух измеримых признаков. Ковариация. Корреляция.
- •3. Семь простейших инструментов качества. Метод стратификации. Методика практического использования. Мнемонический приём 4м…6м.
- •Билет№20
- •1. Спк кп. Оперативная характеристика и ее свойства.
- •3. Семь простейших инструментов качества. Причинно-следственная диаграмма Исикавы. Этапы построения. Мнемонический приём 4м…6м.
- •Билет№21
- •1.Концепция спк кп по приемлемому уровню качества aql. Показатели спк качества продукции.
- •2.Кусум-карты. Методика построения шаблона.
- •3. Семь простейших инструментов качества. Гистограмма. Этапы построения. Типичные формы гистограмм.
- •Билет№22
- •Нормативный уровень качества (nql) (несоответствий). Основные понятия.
- •Основные правила и критерии для интерпретации контрольных карт.
- •Семь простейших инструментов качества. Контрольный листок. Назначение. Формы контрольных листков.
- •Билет№23
- •1. Выбор плана контроля качества продукции поставщиком и потребителем.
- •2. Контрольная карта для арифметического среднего с предупреждающими границами. Особенности карты.
- •3. Семь простейших инструментов качества. Диаграмма разброса. Этапы построения. Типичные виды диаграмм разброса.
- •Билет №24
- •Спк кп по количественному признаку (гост р 50779.50-95). Особенности спк по количественному признаку. Оценка объёма выборки.
- •5. Статистический приемочный контроль поставщика.
- •6. Статистический приемочный контроль потребителя.
- •7. Правила принятия решений по результатам статистического приемочного контроля.
- •Примеры интерпретации положения кривой нормального распределения при sqc
- •3.Семь простейших инструментов качества. Метод стратификации. Методика практического использования. Мнемонический приём 4м…6м.
- •Билет №25
- •1. Спк кп поставщика методом толерантных границ. Три возможных случая задания предельных значений показателя качества при контроле.
- •2. Коэффициент конкордации.
- •3. Семь простейших инструментов качества. Причинно-следственная диаграмма Исикавы. Этапы построения. Мнемонический приём 4м…6м.
- •Билет№26
- •1. Условия обеспечения представительности выборок.
- •2. Показатели точности и стабильности процессов. Индекс воспроизводимости. Модифицированный индекс воспроизводимости.
- •Виды индексов воспроизводимости
- •Условия применения индексов воспроизводимости
- •Методика применения
- •3. Семь простейших инструментов качества. Временной ряд.
- •Билет №27
- •Необходимые условия проведения спк.
- •Правила принятия решений по результатам статистического приемочного контроля.
- •2. Контрольные карты средних арифметических и размахов ( - и r-карты)
- •2.1. Сбор данных
- •2.2. Построение контрольных карт (рисунок а.1 приложения а)
- •3. Семь простейших инструментов качества. Контрольный листок. Назначение. Формы контрольных листков.
- •Билет№28
- •2. Управление на основе анализа переменных по картам среднего арифметического и размаха. Методика построения карты.
- •2.1. Сбор данных
- •2.2. Построение контрольных карт (рисунок а.1 приложения а)
- •3. Семь простейших инструментов качества. Диаграмма Парето. Этапы построения. Принцип Парето.
- •Билет№29
- •3. «Мозговая атака», «штурм», «осада», «атака разносом». Назначение. Правила проведения
- •Билет№30
- •1. Кусум-карты. Методика построения шаблона.
- •1 Предварительные шаги при построении кусум-карты
- •2. Правила принятия решений при спк кп при контроле поставщика по методу доверительных границ.
- •3. Семь простейших инструментов качества. Причинно-следственная диаграмма Исикавы. Этапы построения. Мнемонический приём 4м…6м.
Билет№14
Вопрос 1. Распределение Пуассона
Третье широко используемое дискретное распределение – распределение Пуассона. Случайная величина Y имеет распределение Пуассона, если
,
где λ – параметр распределения Пуассона, и P(Y=y)=0 для всех прочих y (при y=0 обозначено 0! =1). Для распределения Пуассона
M(Y) = λ, D(Y) = λ.
Это распределение названо в честь французского математика С.Д.Пуассона (1781-1840), впервые получившего его в 1837 г. Распределение Пуассона является предельным случаем биномиального распределения, когда вероятность р осуществления события мала, но число испытаний n велико, причем np = λ. Точнее, справедливо предельное соотношение
Поэтому распределение Пуассона (в старой терминологии «закон распределения») часто называют также «законом редких событий».
Распределение Пуассона возникает в теории потоков событий (см. выше). Доказано, что для простейшего потока с постоянной интенсивностью Λ число событий (вызовов), происшедших за время t, имеет распределение Пуассона с параметром λ = Λt. Следовательно, вероятность того, что за время t не произойдет ни одного события, равнаe-Λt, т.е. функция распределения длины промежутка между событиями является экспоненциальной.
Распределение Пуассона используется при анализе результатов выборочных маркетинговых обследований потребителей, расчете оперативных характеристик планов статистического приемочного контроля в случае малых значений приемочного уровня дефектности, для описания числа разладок статистически управляемого технологического процесса в единицу времени, числа «требований на обслуживание», поступающих в единицу времени в систему массового обслуживания, статистических закономерностей несчастных случаев и редких заболеваний, и т.д.
Описание иных параметрических семейств дискретных распределений и возможности их практического использования рассматриваются в обширной (более миллиона названий статей и книг на десятках языков) литературе по вероятностно-статистическим методам.
Билет 14 вопрос 2
Таблицы сопряженности
Таблицей сопряженности называется таблица, которая содержит сводную числовую характеристику изучаемой совокупности по двум и более атрибутивным (качественным) признакам или комбинации количественных и атрибутивных признаков.
Таблицы сопряженности получили наибольшее распространение при изучении социальных явлений и процессов: общественного мнения, уровня и образа жизни, общественно-политического строя и т.д.
Наиболее простым видом таблиц сопряженности является таблица частот 2x2
Построение данной таблицы исходит из предположения, что ответы респондентов или анализируемые атрибутивные признаки будут принимать только два значения: А1 и А2, В1 и В2. Внутреннее цифровое наложение таблицы представляют частоты (fij) обладающие одновременно i -м (i = 1, 2) значением одного (А) и j -м (j = 1,2)значением (Вj) другого качественного признака.
Итоговая графа и строка содержат информацию о количественном распределении совокупности соответственно по А и В атрибутивным признакам.
Для более полного описания и анализа явлений и процессов, характеризуемых атрибутивными признаками, используются таблицы сопряженности большей размерности:
где i = 1,2,..., k - число вариантов значений (например, ответов респондентов и т.д.) одного признака (например, признака А), j =1,2,…, n - число вариантов значений другого признака (В) (см. табл. 3.2).
Принцип взаимной сопряженности наиболее эффективен при выявлении и оценке взаимосвязей и взаимозависимостей между социальными явлениями и процессами.
Одним из основных методов разведочного анализа данных является кросстабуляция. результаты представляются в виде многовходовых (многомерных) таблиц частот, то есть в виде таблиц сопряженности с двумя или более факторами.
Логлинейный анализ предлагает более глубокие методы исследования этих таблиц. А именно, он позволяет проверить статистическую значимость различных факторов и взаимодействий, присутствующих в таблице сопряженности Анализ соответствий является описательным/разведочным методом, созданным для анализа сложных таблиц, содержащих некоторые меры соответствий между переменными - столбцами и переменными - строками. Получаемые результаты содержат информацию, похожую по своей природе на результаты Факторного анализа. Они позволяют изучить структуру категориальных переменных, включенных в таблицу.
Двумерные таблицы частот
Обзор методов логлинейного анализа начнем с наиболее простой таблицы сопряженности 2 x 2. Представьте, что вы интересуетесь зависимостью между возрастом людей и сединой волос. Вы имеете выборку из 100 человек и определяете, у кого из них седые волосы. Вы также записываете примерный возраст людей. Результаты этого исследования представлены в таблице следующим образом:
Седые волосы |
Возраст |
Всего |
|
до 40 лет |
от 40 и старше |
||
Нет Да |
40 20 |
5 35 |
45 55 |
Всего |
60 |
40 |
100 |
Это и есть простейшая таблица сопряженности 2 x 2 (название ее понятно: в таблице имеется две строки и два столбца, соответствующие двум сопряженным переменным, каждая из которых принимает два значения). Далее, в процессе интерпретации результатов этого маленького анализа, вы познакомитесь с терминологией, которая будет полезна при анализе более сложных таблицы.
Объясняющие переменные и переменные отклика. В теории множественной регрессии и в дисперсионном анализе обычно различают независимые и зависимые переменные. Зависимые переменные, это те переменные, поведение которых исследователь пытается "объяснить", то есть он предполагает, что эти переменные зависят от независимых переменных и хочет эту зависимость (связь) оценить. Факторы в таблицах 2x2 могут также рассматриваться с этой точки зрения: рассмотрите цвет волос (седой, не седой) как зависимую переменную, а возраст - как независимую. Альтернативные термины, которые используются при анализе таблиц сопряженности (называемых иногда также кросс-таблицами) - это переменные отклика и объясняющие переменные, соответственно. Переменные отклика - это те переменные, которые изменяются в ответ на изменение объясняющих переменных. Поэтому в приведенной выше таблице цвет волос можно рассматривать как переменную отклика, а возраст - как объясняющую (независимую) переменную.
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.
По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.
Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.
Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.
кроме перечисленных различают также непосредственные, косвенные и ложные связи. По силе различаются слабые и сильные связи.
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.
Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.
Простейшим приемом выявления связи между двумя признаками является построениекорреляционной таблицы:
В основу группировки положены два изучаемых во взаимосвязи признака – Х и У. Частоты fij показывают количество соответствующих сочетаний Х и У. Если fijрасположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания fij допустимо утверждать о связи между Х и У. При этом, если fij концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь.
Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.
Практически для количественной оценки тесноты связи широко используют линейныйкоэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных Х и У, то он вычисляется по формуле
Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета.
Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X.
Для характеристики влияния изменений Х на вариацию У служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель
где n – число наблюдений; а0, а1 – неизвестные параметры уравнения; ei – ошибка случайной переменной У.
Уравнение регрессии записывается как
где Уiтеор – рассчитанное выравненное значение результативного признака после подстановки в уравнение X.
Параметры а0 и а1 оцениваются с помощью процедур, наибольшее распространение из которых получил метод наименьших квадратов. Его суть заключается в том, что наилучшие оценки ag и а, получают, когда
т.е. сумма квадратов отклонений эмпирических значений зависимой переменной от вычисленных по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров а0 и а1. Ее минимизация осуществляется решением системы уравнений