- •Раздел 1 программирование || объектно-ориентированное программирование
- •Раздел 1 программирование || объектно-ориентированное программирование
- •9. Создание и обработка исключений на пример с#.
- •1. Общая структура программы на языке с. Роль и задача заголовочных файлов.
- •3. Принципы работы операторов ветвления и циклов, на примере языка с. (проверить)
- •(Проверить, не доделан)
- •Стандартные функции динамического выделения памяти
- •Динамическое выделение памяти для одномерных массивов
- •Динамическое выделение памяти для двумерных массивов
- •N·m·(размер элемента)
- •Умные указатели
- •Класс auto_ptr
- •Класс shared_ptr
- •New/delete и классы
- •Альтернативы new/delete
- •6. Понятие класса, типы классов, члены классов, на примере языка с#.
- •7. Перегрузка операторов и функций на примере языка с#. (проверить, не доделан)
- •9. Создание и обработка исключений на пример с#.
- •11. Стандартные типы данных языка с, операции над ними.
- •12. Стандартные типы данных языка с#, операции над ними.
- •Abstract Class Example:
- •Динамическое приведение указателя
- •Динамическое приведение ссылки
- •Const_cast — константное приведение типов данных
- •Reinterpret_cast — операция приведения типов данных
- •Неявные преобразования
- •Явные преобразования
- •Исключения преобразования типов во время выполнения
- •17. Понятие класса Object в языке c#.
- •Особенности производительности
- •18. Понятие коллекции и принцип работы в с#.
- •(Http://professorweb.Ru/my/csharp/charp_theory/level12/12_1.Php)
- •Раздел 2 базы данных
- •Раздел 2 базы данных
- •Раздел 2 базы данных
- •1. Файловые формы хранения данных. Преимущества и недостатки
- •2. [Done] Сетевые формы хранения данных. Преимущества и недостатки
- •3. Языки разметки как структуры хранения. Преимущества и недостатки
- •4. [Done] Основные понятия реляционных бд и используемая терминология
- •5. Модель данных – определение, реализация в разных формах хранения.
- •6. [Done] Многоуровневая архитектура бд. Субд, ее назначение.
- •7. [Done] Реляционные ключи – назначение, типы, примеры применения
- •8. [Done] Оператор select – формат, последовательность обработки
- •9. Теоретико-множественное описание и характеристические функции отношений. Аксиомы Армстронга
- •10. [Done] Содержание процесса нормализации бд
- •11. [Done] Содержательная трактовка первой нормальной формы бд
- •1Nf tables as representations of relations
- •12. [Done] Содержательная трактовка второй нормальной формы бд
- •13. Унарные операции реляционной алгебры
- •14. Бинарные операции реляционной алгебры
- •15. [Done] Классификация и содержательный смысл различных операций соединения
- •16. [Done]Особенности применения конструкций where, order by, group by, having и агрегирующих функций в языке sql
- •17. [Done] Подзапрос в языке sql: типы, особенности применения
- •18. [Done] Процедурные расширения языка sql – курсоры, подпрограммы, триггеры.
- •19. [Done] Механизм представлений в языке sql
- •20. [Done] Средства поддержки целостности данных в языке sql
- •Раздел 3 операционные системы || администрирование в операционных системах linux
- •Раздел 4 основы проектирования информационных систем || практические вопросы автоматизации предприятий
- •Раздел 4 основы проектирования информационных систем || практические вопросы автоматизации предприятий
- •1. Понятие автоматизации. Основные термины и определения. Цели автоматизации. Основные требования к автоматизации. Процессы автоматизации.
- •3. Анализ объекта автоматизации. Понятие методологии анализа объекта автоматизации. Основные методологии анализа.
- •4. Стандартизация систем. Классификация ис.
- •Раздел 5 анализ и проектирование на uml
- •Раздел 6 теория систем и системный анализ || теория информационных процессов и систем
- •1. Определения системы. Классификации систем, место ит-систем в этих классификациях.
- •2. Основные закономерности систем. (Лекции Гусаровой)
- •3. Модели систем – определение, классификации, содержательные примеры. (лекции Гусаровой)
- •4. Связи в системах – определение, классификации, содержательные примеры.
- •5. Связи в информационных моделях систем – реляционные, онтологические, по управлению; их особенности и содержательные примеры.
- •6. Процессы в теории систем – определения, примеры, содержательная трактовка (Лекции Гусаровой)
- •7. Основные информационные процессы – определения, содержательная трактовка, примеры.
- •8. Процесс обработки данных. Основные постановки задач. Классификация методов реализации процесса обработки данных
- •9. Задачи машинного обучения в обработке данных. Примеры содержательной постановки
- •10. Основные понятия машинного обучения – решающая функция, метод обучения, функция потерь, переобучение. Содержательные примеры.
- •11. Методы регрессионного анализа в обработке данных.
- •12. Статистические методы классификации в обработке данных.
- •13. Метрические методы классификации в обработке данных.
- •14. Линейные методы классификации в обработке данных.
- •15. Нейросетевые методы в обработке данных.
- •16. Методы кластерного анализа в обработке данных.
- •17. Отбор признаков-регрессоров в обработке данных
- •18. Метод главных компонент и его модификации в обработке данных
- •19. Сингулярное разложение матриц в обработке данных
- •Раздел 7
13. Метрические методы классификации в обработке данных.
Метрический классификатор (similarity-based classifier) — алгоритм классификации, основанный на вычислении оценок сходства между объектами. Простейшим метрическим классификатором является метод ближайших соседей, в котором классифицируемый объект относится к тому классу, которому принадлежит большинство схожих с ним объектов.
Для
формализации понятия сходства вводится
функция расстояния между объектами
.
Как правило, жёсткого требования, чтобы
эта функция была метрикой
не предъявляется; в частности, неравенство
треугольника вполне может и нарушаться.
К метрическим алгоритмам классификации относятся:
Метод ближайших соседей
Метод потенциальных функций
Метод радиальных базисных функций
Метод парзеновского окна
Метрические классификаторы опираются на гипотезу компактности, которая предполагает, что схожие объекты чаще лежат в одном классе, чем в разных. Это означает, что граница между классами имеет достаточно простую форму, и классы образуют компактно локализованные области в пространстве объектов. Заметим, что в математическом анализе компактными называются ограниченные замкнутые множества. Гипотеза компактности не имеет ничего общего с этим понятием, и пониматься скорее в «бытовом» смысле слова.
Метод ближайших соседей — простейший метрический классификатор, основанный на оценивании сходства объектов. Классифицируемый объект относится к тому классу, которому принадлежат ближайшие к нему объекты обучающей выборки.
Метод
ближайших
соседей. Для повышения надёжности
классификации объект относится к тому
классу, которому принадлежит большинство
из его соседей
—
ближайших
к нему объектов обучающей выборки
.
В задачах с двумя классами число соседей
берут нечётным, чтобы не возникало
ситуаций неоднозначности, когда
одинаковое число соседей принадлежат
разным классам.
Пусть задана обучающая выборка пар «объект-ответ» .
Пусть
на множестве объектов задана функция
расстояния
.
Эта функция должна быть достаточно
адекватной моделью
сходства
объектов. Чем больше значение этой
функции, тем менее схожими являются два
объекта
.
Для
произвольного объекта
расположим
объекты обучающей выборки
в
порядке возрастания расстояний до
:
где
через
обозначается
тот объект обучающей выборки, который
является
-м
соседом объекта
.
Аналогичное обозначение введём и для
ответа на
-м
соседе:
.
Таким образом, произвольный объект
порождает
свою перенумерацию выборки.
В наиболее общем виде алгоритм ближайших соседей есть
где
—
заданная весовая
функция,
которая оценивает степень важности
-го
соседа для классификации объекта
.
Естественно полагать, что эта функция
неотрицательна и не возрастает по
.
По-разному задавая весовую функцию, можно получать различные варианты метода ближайших соседей.
—
простейший
метод ближайшего соседа;
—
метод
ближайших
соседей;
14. Линейные методы классификации в обработке данных.
Линейный классификатор — алгоритм классификации, основанный на построении линейной разделяющей поверхности. В случае двух классов разделяющей поверхностью является гиперплоскость, которая делит пространство признаков на два полупространства. В случае большего числа классов разделяющая поверхность кусочно-линейна.
Пусть
объекты описываются n числовыми признаками
.
Тогда пространство признаковых описаний
объектов есть
.
Пусть
—
конечное множество номеров (имён, меток)
классов.
Положим
.
Линейным классификатором называется алгоритм классификации вида
где
—
вес
-го
признака,
—
порог принятия решения,
—
вектор весов,
—
скалярное произведение признакового
описания объекта на вектор весов.
Предполагается, что искусственно введён
«константный» нулевой признак:
.
Пример алгоритма: однослойный персепторн
Однослойный персептрон — это линейный алгоритм классификации, принцип работы которого основан на модели нервной клетки - нейрона. Представляет собой примернейронной сети с одним скрытым слоем.
Пусть
-
множество объектов;
-
множество допустимых ответов. Будем
считать, что
,
где
-
признаковое описание объекта, а
-
дополнительный константный признак;
.
Задана обучающая выборка
.
Значения признаков
рассматриваются
как импульсы, поступающие на вход
нейрона, которые складываются с весами
.
Если суммарный импульс превышает порог
активации
,
то нейрон возбуждается и выдаёт на
выходе 1, иначе выдаётся 0. Таким образом,
нейрон вычисляет
-арную
булеву функцию вида
,
где
Для
настройки вектора весов воспользуемся
методом стохастического градиента.
Возьмем квадратичную функцию потерь:
,
а в качестве функции активации возьмем
сигмоидную функцию:
.
Согласно принципу минимизации
эмпирического риска
задача сводится к поиску вектора,
доставляющего минимум функционалу
.
Алгоритм не допустил при классификации ни одной ошибки.
Алгоритм допустил около 50% ошибок классификация, что неудивительно, т.к. входные данные были принципиально линейно неразделимы.
