
- •Вопросы
- •Информационное общество. Понятие. Основные признаки.
- •Информатизация науки. Основные цели государственных программ.
- •Информатизация науки. Проблемы информатизации.
- •Информационные технологии. Понятие. Цели информационных технологий.
- •Информационные технологии. Виды поддержки информационных технологий.
- •6. Характеристика технологий современных процессоров Intel.
- •7. Характеристика технологий современных процессоров amd.
- •8. Краткая характеристика технологий модулей оперативной памяти современных вычислительных систем.
- •9. Краткая характеристика возможностей видеокарт современных вычислительных систем.
- •10. Краткая характеристика типов и технологий современных мониторов.
- •Типы топологий вычислительных сетей
- •Стандарты вычислительных сетей, определенные Project 802
- •13. Характеристика типов и возможностей проводных локальных вычислительных сетей.
- •Характеристика типов и возможностей беспроводных стационарных локальных вычислительных сетей.
- •Способы организации мобильных сетей
- •Микроволновая система
- •17. Назначение и функции системы доменных имен
- •Модель osi
- •Понятие целостности информации в компьютерных технологиях. Причины нарушения целостности.
- •Понятие конфиденциальности информации. Перечень способов поддержки конфиденциальности информации.
- •Понятие аутентификации и идентификации. Формы аутентификации личности при доступе к информации
- •Формы аутентификации:
- •Понятие уязвимостей и атак в вычислительных системах и сетях. Примеры.
- •Перечень типов уязвимостей и атак в вычислительных системах и сетях.
- •Virus (классический вирус).
- •Средства защиты информации вычислительных систем от внешних и внутренних атак
- •Понятие криптографии, шифра. Типы ключей в криптографии.
- •Алгоритмы шифрации с симметричным ключом. Понятие. Характеристика существующих алгоритмов. Достоинства и недостатки шифрации с симметричным ключом.
- •Алгоритмы шифрации с асимметричным ключом. Понятие. Характеристика существующих алгоритмов. Достоинства и недостатки шифрации с асимметричным ключом.
- •Гибридные алгоритмы шифрации. Понятие. Характеристика существующих алгоритмов. Достоинства и недостатки шифрации по гибридным алгоритмам.
- •Цифровая электронная подпись. Понятие. Опорные алгоритмы.
- •Алгоритмы
- •Краткая характеристика сетевых экранов. Функциональные типы сетевых экранов.
- •Типы операционных систем. Перечень. Краткая сравнительная характеристика.
- •Типы архитектур распределенных систем. Краткая характеристика. Достоинства и недостатки.
- •Понятие технологии com – Component object model. Принцип объявления сом-модели. Принципы обращения к объектам сом-объектной модели.
- •Перечень технологий поддержки распределенных объектных моделей dсом.
- •Краткая характеристика технологии орс. Состав спецификаций. Основные типы стандарта.
- •Электронная библиотека. Понятие. Стандартные возможности.
- •Возможности получения информации в электронной библиотеке eLibrary. Предоставляемые сервисы.
- •Понятие импакт-фактора информационного источника. Алгоритм расчета параметра.
- •Понятие индекса цитируемости Хирша информационного источника.
- •Описательные статистики. Возможности получения описательных статистик в пакете Statistica.
- •42. Использование t-критерия для выборок. Основные параметры. Назначение t -критерий для независимых выборок
- •Краткая характеристика средств пакета Statistica анализа производственных процессов.
- •44. Использование регрессионного анализа для выборок. Основные понятия. Назначение множественная регрессия
- •45. Понятие интегрированной системы автоматизированного проектирования. Классификация подсистем интегрированной системы автоматизированного проектирования.
- •46. Классификация систем автоматизированного проектирования
- •47. Основные термины и определения компьютерных технологий и автоматизированных систем.
- •48. Структура и состав систем автоматизированного проектирования.
- •49. Системные принципы и свойства систем автоматизированного проектирования.
- •50. Структура и состав универсальных моделирующих систем процессов химической технологии.
- •51. Последовательность операций при моделировании хтп в умп.
- •52. Типовые задачи, решаемые умп хтп.
- •Понятие жизненного цикла объекта, информационной модели объекта.
- •Требования к информационной модели объекта.
- •Средства поддержки информационной модели объекта на всем его жизненном цикле.
- •56.Автоматизированные системы, используемые в процессе жизненного цикла изделий. Перечень и краткая характеристика.
- •57.Концепция cals, plm, ilm технологий. Основные стандарты cals технологий.
- •Стандарты cals
- •58. Основные объекты, составляющие базу данных, поддерживаемые в ms Access Панель "Объекты":
- •59. Последовательность операций при создании многотабличной базы данных.
- •60. Типы запросов к базе данных, поддерживаемых ms Access.
- •61. Последовательность создания запросов к базе данных.
- •62. Средства организации интерфейса пользователя к базе данных.
- •63. Типы форм, поддерживаемых ms Access. Проектирование форм и работа с ними
- •64. Сравнительная характеристика типов современных баз данных.
- •65. Характеристика систем оперативной аналитической обработки.
- •66. Характеристика систем поддержки принятия решений и систем добычи данных.
- •67. Поддержка принятия решений средствами искусственного интеллекта.
- •68. Типовые задачи, решаемые в универсальных математических пакетах.
- •69. Принцип построения документа с вычислениями в MathCad.
- •70. Графические возможности MathCad.
- •Построение графиков
- •71. Правила использования функций в MathCad.
- •Встроенные функции
- •Функции пользователя
- •72. Правила построения функций пользователя в MathCad. Задание функций пользователя
- •73. Краткая характеристика типов данных, поддерживаемых в MathCad.
44. Использование регрессионного анализа для выборок. Основные понятия. Назначение множественная регрессия
Общее назначение множественной регрессии состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной.
В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях.
В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...". Заметим, что термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели.
Общая вычислительная задача, которую требуется решать при анализе методом множественной регрессии, состоит в подгонке прямой линии к некоторому набору точек.
В простейшем случае, когда имеется одна зависимая и одна независимая переменная, это можно увидеть на диаграмме рассеяния.
Метод наименьших квадратов. На диаграмме рассеяния имеется независимая переменная или переменная X и зависимая переменная Y. Программа строит линию регрессии так, чтобы минимизировать квадраты отклонений этой линии от наблюдаемых точек. Поэтому на эту общую процедуру иногда ссылаются как на оценивание по методу наименьших квадратов.
Уравнение регрессии. Прямая линия на плоскости (в пространстве двух измерений) задается уравнением Y=a+b*X; более подробно: переменная Y может быть выражена через константу (a) и угловой коэффициент (b), умноженный на переменную X. Константу иногда называют также свободным членом, а угловой коэффициент - регрессионным или B-коэффициентом.
В многомерном случае, когда имеется более одной независимой переменной, линия регрессии не может быть отображена в двумерном пространстве, однако она также может быть легко оценена. Тогда, в общем случае, процедуры множественной регрессии будут оценивать параметры линейного уравнения вида:
Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Однозначный прогноз и частная корреляция. Регрессионные коэффициенты (или B-коэффициенты) представляют независимые вклады каждой независимой переменной в предсказание зависимой переменной. Другими словами, переменная X1, к примеру, коррелирует с переменной Y после учета влияния всех других независимых переменных. Этот тип корреляции упоминается также под названием частной корреляции. Если одна величина коррелирована с другой, то это может быть отражением того факта, что они обе коррелированы с третьей величиной или с совокупностью величин.
Линия регрессии выражает наилучшее предсказание зависимой переменной (Y) по независимым переменным (X). Отклонение отдельной точки от линии регрессии (от предсказанного значения) называется остатком.
Чем меньше разброс значений остатков около линии регрессии по отношению к общему разбросу значений, тем, очевидно, лучше прогноз. Например, если связь между переменными X и Y отсутствует, то отношение остаточной изменчивости переменной Y к исходной дисперсии равно 1.0. Если X и Y жестко связаны, то остаточная изменчивость отсутствует, и отношение дисперсий будет равно 0.0.
В большинстве случаев отношение будет лежать где-то между этими экстремальными значениями, т.е. между 0.0 и 1.0. 1.0 минус это отношение называется R-квадратом или коэффициентом детерминации. Это значение непосредственно интерпретируется следующим образом. Если имеется R-квадрат равный 0.4, то изменчивость значений переменной Y около линии регрессии составляет 1-0.4 от исходной дисперсии; другими словами, 40% от исходной изменчивости могут быть объяснены, а 60% остаточной изменчивости остаются необъясненными.
Обычно, степень зависимости двух или более предикторов (независимых переменных или переменных X) с зависимой переменной (Y) выражается с помощью коэффициента множественной корреляции R. По определению он равен корню квадратному из коэффициента детерминации. Это неотрицательная величина, принимающая значения между 0 и 1. Для интерпретации направления связи между переменными смотрят на знаки (плюс или минус) регрессионных коэффициентов или B-коэффициентов. Если B-коэффициент положителен, то связь этой переменной с зависимой переменной положительна; если B-коэффициент отрицателен, то и связь носит отрицательный характер. Конечно, если B-коэффициент равен 0, связь между переменными отсутствует.
Как это видно уже из названия множественной линейной регрессии, предполагается, что связь между переменными является линейной. На практике это предположение, в сущности, никогда не может быть подтверждено. Если нелинейность на двумерных диаграммах рассеяния переменных связи очевидна, то можно рассмотреть или преобразования переменных или явно допустить включение нелинейных членов.
Основное концептуальное ограничение всех методов регрессионного анализа состоит в том, что они позволяют обнаружить только числовые зависимости, а не лежащие в их основе причинные (causal) связи.
Мультиколлинеарность и плохая обусловленность матрицы. Проблема мультиколлинеарности является общей для многих методов корреляционного анализа. Представим, что имеется два предиктора (переменные X) для роста субъекта: (1) вес в фунтах и (2) вес в унциях. Очевидно, что иметь два предиктора совершенно излишни; вес является одной и той же переменной, измеряется он в фунтах или унциях. Это происходит при попытке выполнить множественный регрессионный анализ с ростом в качестве зависимой переменной (Y) и двумя мерами веса, как независимыми переменными (X).
Подгонка центрированных полиномиальных моделей. Подгонка полиномов высших порядков от независимых переменных с ненулевым средним может создать большие трудности с мультиколлинеарностью. А именно, получаемые полиномы будут сильно коррелированы из-за этого среднего значения первичной независимой переменной. При использовании больших чисел эта проблема становится очень серьезной, и если не принять соответствующих мер, то можно прийти к неверным результатам. Решением в данном случае является процедура центрирования независимой переменной, т.е. вначале вычесть из переменной среднее, а затем вычислять многочлены.