Скачиваний:
99
Добавлен:
23.01.2020
Размер:
3.37 Mб
Скачать

Основы проектирования кибер- физических систем

Лекция 7

Высокий уровень разработки

Анализ данных и машинное обучение

Презентации к лекциям доступны по ссылке:

vk.cc/9XQ8Q9

Виды данных в КФС

структурированные данные (SQL-хранилище) предсказуемого формата;

неструктурированные данные (необработанное видео или сигналы) высокой степени случайности и вариативности;

частично структурированные данные с некоторой степенью случайности вариативности.

Простой анализ данных (аналитические

шаблоны)

Предварительная обработка – отбрасывание малоинтересных событий, денатурирование, извлечение свойств, сегментация, перевод данных в более подходящий формат (хотя озера данных предпочитают избегать немедленного преобразования), добавление таких

атрибутов, как ярлыки (озерам данных ярлыки не нужны); ● Оповещение – проверка данных; если они не

соответствуют каким-то граничным условиям, отправляется предупреждение. Элементарный пример: температура превышает определенный лимит, установленный в датчике;

Простой анализ данных

Окна событий – создается подвижный диапазон (окно), в котором действуют свои собственные правила. Окно может быть ограничено по времени (например, на протяжении одного часа) или длине (например, в рамках 2000 показаний датчика). Окна могут быть подвижными (например, проверка последних 10 событий датчика и возвращение результатов при каждом новом событии) и пакетными (когда событие генерируется только по завершении окна). Эта функция хорошо подходит для создания правил и событий, занимающихся подсчетом. К примеру, можно узнать количество скачков температуры за последний час и сделать вывод о том, что одно из устройств имеет дефект;

Простой анализ данных

Соединения – объединяют несколько потоков данных в один. Можно привести пример в сфере логистики. Допустим, компания рассылает посылки и отслеживает их с помощью специальных маяков, а ее многочисленные грузовики, самолеты и объекты недвижимости шлют потоки геолокационных данных. Таким образом, мы имеем два потока: один для посылки, а другой для заданного грузовика. Когда грузовик подбирает посылку, эти два потока объединяются;

Простой анализ данных

Ошибки – работая с миллионами датчиков, вы непременно столкнетесь с потерей данных, их искажением или неправильным порядком следования. Это актуально для интернета вещей с его множественными асинхронными и независимыми потоками. Например, информация может затеряться в сотовой сети, если автомобиль заедет в подземный гараж. Этот аналитический шаблон сопоставляет данные в рамках одного потока, пытаясь найти подобные ошибки;

Простой анализ данных

Базы данных – аналитический пакет должен взаимодействовать с каким-то хранилищем данных. Например, если данные поступают из ряда датчиков, таких как ярлыки Bluetooth, сигнализирующие о хищении или пропаже устройства, вам нужно будет сопоставлять их с базой данных идентификаторов разыскиваемых ярлыков;

Простой анализ данных

Временные события и шаблоны – эта функция чаще всего применяется в сочетании с окнами событий, упомянутыми выше. Здесь целевым шаблоном являются наборы или последовательности событий. Это такой конечный автомат. Представьте, что мы отслеживаем состояние устройства по его температуре, вибрациям и шуму, который оно издает. Последовательность временных событий может выглядеть так:

1.определить, превышает ли температура 100 °C;

2.определить, превышает ли уровень вибраций 1 м/с;

3.определить, издает ли устройство звук громкостью 110 дБ;

4.отправить оповещение, если все эти события происходят в такой последовательности;

Соседние файлы в папке Лекции