Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
инфа экзамен 6,21-24.doc
Скачиваний:
4
Добавлен:
23.09.2019
Размер:
602.62 Кб
Скачать

Вопрос 2.

Статистическая гипотеза – это любое предположение о виде неизвестного закона распределения или о параметрах известных распределений. Гипотезы о значениях параметров распределений или о сравнительной величине параметров двух распределений называются параметрическими гипотезами. Гипотезы о виде распределения называются непараметрическими гипотезами. Проверить статистическую гипотезу – значит проверить, согласуются ли выборочные данные с выдвинутой гипотезой.

Примеры статистических гипотез:

1) генеральная совокупность подчиняется нормальному закону распределения;

2) математические ожидания двух нормальных совокупностей равны между собой.

Первая гипотеза является непараметрической, а вторая - параметрической.

Вместе с выдвигаемой основной гипотезой рассматривают и противоречащую ей гипотезу. В том случае, если выдвинутая гипотеза будет отвергнута, противоречащая гипотеза окажется справедливой.

Нулевая [основная или проверяемая] гипотеза – это выдвинутая гипотеза, которая обозначается 0 H. Конкурирующая [альтернативная] гипотеза – это гипотеза 1 H , которая противоречит нулевой гипотезе.

Простой гипотезой называется гипотеза, которая содержит только одно предположение. Например, гипотеза о том, что параметр распределения Пуассона равен значению 0, является простой. Основная гипотеза о том, что математическое ожидание нормального распределения равно 5 (при известной дисперсии), т.е.

Н0: а=5,

также является простой.

Сложной гипотезой называется гипотеза, которая состоит из нескольких простых гипотез. Например, сложная гипотеза вида:

Н0: >4,

состоит из множества простых гипотез вида:

Н0: >m,

где m – это люблое число, большее четырёх.

Проверка гипотез относительно средних

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ (ЗНАЧИМОСТИ)

Критерий для проверки статистических гипотез.

Пусть на основании выборки проверяется свойство генеральной совокупности. (Целью такой проверки является попытка высказать обобщающее суждение, относящееся ко всем вообще однородным с выборкой значениям исследуемой переменной). Проверяемое свойство сводится к множеству значений параметров h1 = h10, h2 = h20, .... Эти параметры сравниваются с их выборочными оценками этих параметров. Для этого строят такую статистику y = y(x1, x2, ..., xn; h10, h20, ... ) є g(y1, y2,... , yn; h10, h20, ...), значения которой измеряют отклонения или отношения сравниваемых параметров генеральной совокупности и выборки. При этом простая гипотеза H0: {h1 = h10, h2 = h20, ...} отвергается с данным уровнем зна́чимости a («отклонение» значимо), если выборочное значение y попадает вне допустимого промежутка yp1 Ј y Ј yp2, для которого доверительная вероятность P{ yp1 Ј y Ј yp2} = P2 - P1 = 1 - a.

Статистики, определенные таким способом, называют критериями зна́чимости. Здесь yp1, yp2 - кванти́ли распределения статистики y.

Примерами критериев зна́чимости являются t -статистика Стьюдента (двусторонний t -критерий для проверки простой гипотезы, односторонний t -критерий для проверки сложных гипотез относительно средних), F -статистика Фишера (двусторонний F -критерий для проверки простой гипотезы, односторонний F -критерий для проверки сложных гипотез относительно дисперсий).

Базовый принцип интервального анализа формулируется следующим образом: интервал неопределенности результата есть множество всех его возможных значений, получаемых при варьировании переменных и параметров задачи в границах известных интервалов. В частности, если дана функция (или функционал) [y] = f([х]), интервального векторного аргумента [x] = ([x1],…[xi],…[xk]), то границы y-, y+ интервала неопределенности значения функции определяются как решение двух задач на экстремум:

y- = f(х), y+ = f(х). (3) ] X [ x min ] X [ x max

Таким образом, для определения границ необходимо найти наибольшее и наименьшее значение обычной функции векторного аргумента y=f(х), представленной в символьном виде, когда ее аргументы меняются в заданных интервалах [X]. Результат арифметической операции, проведенной по формуле (3), зависит от того, имеем мы дело с одним интервалом или двумя. В частности, результат арифметических операций, проводимых с двумя интервалами [a] и [b] (даже имеющими одинаковые границы) в интервальном анализе совпадает с правилами интервальной арифметики (2). Однако, если рассматривается один интервал, то в интервальном анализе справедливо: [a]-[a]=0, [a] [a]=[(a-)2; (a+)2], [a]/[a]=1. Следовательно, в интервальном анализе существуют обратные элементы и выполняется дистрибутивный закон.

Билет 21. 1. База данных – это организованная совокупность данных, предназначенная для длительного хранения во внешней памяти ЭВМ, постоянного обновления и использования.

Классификация БД. Базы данных классифицируются по:

1) Характеру хранимой информации. По нему БД подразделяются на фактографические и документальные. Первые содержат в себе данные в строго фиксированных форматах и в краткой форме, являясь электронным аналогом каталогов. Вторые БД похожи на архив документов.

2) Способу хранения информации. По нему БД подразделяются на централизованные и распределенные. В централизованных БД вся информация хранится на одном компьютере. Это может быть отдельный компьютер, но чаще – сервер, к которому подключены клиенты-пользователи. Распределенные БД функционируют в локальных и глобальных сетях. В этих случаях фрагменты БД могут храниться на разных компьютерах или серверах.

3) Структуре хранимых данных. По нему БД подразделяются на иерархические, сетевые и реляционные (табличные).

Иерархические БД в графическом изображении часто сравнивают с деревом, перевернутом кроной вниз. На верхнем уровне находится один объект, на втором – несколько (объекты второго уровня), на третьем еще больше (объекты третьего уровня) и т.п. Между объектами есть связи. Объект, находящийся выше по иерархии («предок»), может быть связан с несколькими объектами более низкого уровня («потомками»), а может и не иметь их. Объект ниже по иерархии может иметь только одного «предка». Объекты, имеющие общего «предка», называются «близнецами». Пример – каталог папок Windows. Верхний уровень (Рабочий стол) – «предок», второй уровень (Мои документы, Мой компьютер, Сетевое окружение, Корзина и т.д.) – «потомки».

Сетевые БД являются обобщением иерархических за счет допущения объектов, имеющих более одного «предка». В сетевых моделях на связи между объектами никаких ограничений не накладывается. Пример – Интернет, в которой с помощью гиперссылок многие миллионы документов связаны между собой в распределенную БД.

Реляционные БД состоят из одной или нескольких взаимосвязанных таблиц. Таблицы состоят из записей и полей. Запись БД – это строка таблицы, содержащая информацию об отдельном объекте системы, например, об одном пациенте. Поле БД – это столбец таблицы, содержащий характеристику (свойство, атрибут) объекта, например, пол, возраст, место жительства пациента и т.д. Каждая таблица должна содержать хотя бы одно поле, содержание которого однозначно идентифицирует запись в таблице. Такое поле называется ключем. Возможны составные ключи (фамилия, имя). Для каждого поля задается структура поля, а именно, указывается уникальное имя, тип данных и формат или размер поля. Пример – амбулаторные карты больных и пациентов.

Система управления базами данных (СУБД) – это программное обеспечение, предназначенное для работы с БД (это универсальный комплекс прикладных программ, предназначенный для создания и обслуживания баз данных, а также обеспечения многоаспектного доступа к данным и их обработки). С помощью СУБД пользователь может:

1) Разрабатывать структуру БД;

2) Заполнять БД;

3) Редактировать структуру и содержимое БД;

4) Искать информацию по БД;

5) Осуществлять защиту и проверку целостности БД в ограниченном размере.

СУБД предоставляют специальные средства для разработки БД.

Объекты БД:

  • В Access база данных включает в себя все объекты, связанные с хранимыми данными:

    • таблицы

    • формы

    • отчеты

    • запросы

    • макросы

    • модули.

  • Все объекты Access хранятся в одном файле с расширением .mdb.

Таблицы. Основной элемент баз данных

  • Объект, который определяется и используется для хранения данных

  • Каждая таблица включает информацию об объекте определенного типа, например, о клиентах.

  • Таблица содержит поля (столбцы), в которых хранятся различного рода данные, например, фамилия или адрес клиента, и записи (строки), в которых собрана вся информация о некотором объекте (человеке, образце продукции и т.п.)

Формы представляют собой электронный вариант физических форм документов.

Формы предназначены для:

    • ввода

    • просмотра корректировки данных

Запросы являются средством выборки необходимых данных из одной или нескольких таблиц БД.

Отчеты используются для формирования выходных документов, предназначенных для вывода на экран, принтер или в файл.

  • МАКРОСЫ и МОДУЛИ содержат описания действий, которые должны быть выполнены в ответ на некоторое событие. Каждое действие реализуется макрокомандой.

содержат программы на языке Visual Basic, которые разрабатываются пользователем для реализации нестандартных процедур обработки данных в задачах пользователя.

  • Создание БД. обязательно включает в себя следующие этапы:

    • проектирование базы данных;

    • создание таблиц для хранения данных;

    • ввод данных;

    • разработку других элементов базы, предназначенных для просмотра, редактирования и вывода информации.

  • Проектирование. Разработать структуру таблицы (определить количество полей будущей базы данных, количество таблиц и т.д.)

  • Определить названия для полей таблицы

  • Определить тип данных (текстовый, числовой, дата/время, счетчик, гиперссылка и т.д.)

  • Задать свойства полей

  • Задать название базы данных

Классификации СУБД

По модели данных

Примеры:

  • Иерархические

  • Сетевые

  • Реляционные

  • Объектно-ориентированные

  • Объектно-реляционные

По степени распределённости

  • Локальные СУБД (все части локальной СУБД размещаются на одном компьютере)

  • Распределённые СУБД (части СУБД могут размещаться на двух и более компьютерах).

По способу доступа к БД

  • Файл-серверные

В файл-серверных СУБД файлы данных располагаются централизованно на файл-сервере. СУБД располагается на каждом клиентском компьютере (рабочей станции). Доступ СУБД к данным осуществляется через локальную сеть. Синхронизация чтений и обновлений осуществляется посредством файловых блокировок. Преимуществом этой архитектуры является низкая нагрузка на процессор файлового сервера. Недостатки: потенциально высокая загрузка локальной сети; затруднённость или невозможность централизованного управления; затруднённость или невозможность обеспечения таких важных характеристик как высокая надёжность, высокая доступность и высокая безопасность. Применяются чаще всего в локальных приложениях, которые используют функции управления БД; в системах с низкой интенсивностью обработки данных и низкими пиковыми нагрузками на БД.

На данный момент файл-серверная технология считается устаревшей.

Примеры: Microsoft Access, Paradox, dBase, FoxPro, Visual FoxPro.

  • Клиент-серверные

Клиент-серверная СУБД располагается на сервере вместе с БД и осуществляет доступ к БД непосредственно, в монопольном режиме. Все клиентские запросы на обработку данных обрабатываются клиент-серверной СУБД централизованно. Недостаток клиент-серверных СУБД состоит в повышенных требованиях к серверу. Достоинства: потенциально более низкая загрузка локальной сети; удобство централизованного управления; удобство обеспечения таких важных характеристик как высокая надёжность, высокая доступность и высокая безопасность.

Примеры: Oracle, Firebird, Interbase, IBM DB2, Informix, MS SQL Server, Sybase Adaptive Server Enterprise, PostgreSQL, MySQL, Caché, ЛИНТЕР.

  • Встраиваемые

Встраиваемая СУБД — СУБД, которая может поставляться как составная часть некоторого программного продукта, не требуя процедуры самостоятельной установки. Встраиваемая СУБД предназначена для локального хранения данных своего приложения и не рассчитана на коллективное использование в сети. Физически встраиваемая СУБД чаще всего реализована в виде подключаемой библиотеки. Доступ к данным со стороны приложения может происходить через SQL либо через специальные программные интерфейсы.

Примеры: OpenEdge, SQLite, BerkeleyDB, Firebird Embedded, Microsoft SQL Server Compact, ЛИНТЕР.