Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Перевод.docx
Скачиваний:
38
Добавлен:
22.03.2016
Размер:
52.78 Кб
Скачать

3. Большие данные

Облако может предоставить роботов и системы автоматизации с доступом к обширным ресурсам данных, которые невозможно поддерживать во встроенной памяти. "Большие данные" описывают "данные, которые превышают потенциал обработки обычных систем баз данных", включая изображения, видео, карты, сеть в режиме реального времени, финансовые операции и огромную сеть датчиков.

Недавний отчет национальной академии инженерии США обобщает много исследованных возможностей и проблем, созданных большими. Например, алгоритмы выборки могут обеспечить разумные приближения к запросам в больших наборах данных, чтобы сохранить работающие моменты быть управляемыми, но эти приближения могут быть серьезно затронуты "грязными данными".

Хантер представляет алгоритмы для основанной на облаке транспортной системы под названием мобильный миллениум, которые используют GPS в сотовых телефонах для сбора информации о трафике, обрабатывают их и распространяют, а также для сбора и обмена данными об уровне шума и качества воздуха (см. рис. 3).

Рис. 3. Данные могут быть собраны из многих источников, как показано на этой схематичной архитектуре для мобильного миллениума, основанной на облаке транспортной системы, которая сочетает в себе потоковые данные из такси, карт и дорожных датчиков. Мобильный миллениум использует большие данные и аспекты коллективного обучения роботов облачной робототехники и автоматики. (Изображение воспроизводится с разрешения авторов.)

Большие наборы данных могут способствовать машинному обучению, как было продемонстрировано в контексте компьютерного видения. Наборы данных крупномасштабных изображений, таких как ImageNet, набор данных визуальных объектов Паскаля и другие были использованы для распознавания объектов и мест действия. При использовании Trimble SketchUp 3D хранилища, Лай и др. уменьшили необходимость во вручную помеченных обучающих данных. Используя фотоколлекции сообществ, Гамметер и др. создали приложение дополнительной реальности с обработкой в облаке. Объединив интернет изображения с запросами местного оператора человека, Хидано-Пенья и др. обеспечили более надежную технику изучения объектов. Глубокое изучение - это технология, использующая многослойные нейронные сети, которые могут воспользоваться большими данными и могут использоваться для компьютерного видения и захвата.

Захват - это постоянная задача в области робототехники: определение оптимального способа захвата недавно обнаруженного объекта. Облачные ресурсы могут способствовать поэтапному обучению стратегиям захвата, сопоставив данные датчика с 3D CAD-моделями в онлайновой базе данных. Примеры данных датчика включают в себя 2D особенности изображения, 3D особенности и облака 3D точек, а также демонстрации.

Goggles компании Google, бесплатная услуга распознавания изображений для мобильных устройств (рис. 4), была включена в систему захвата роботами, основанную на Облаке, как показано на рис. 5.

Рис. 4. Система распознавания объектов Google сочетает в себе огромный набор данных изображений и текстовых меток с машинным обучением, чтобы облегчить распознавание объекта в Облаке. (Изображение воспроизводится с разрешения.)

Проект РобоЗемля хранит данные, связанные с объектами и картами для приложений, ранжированные от распознавания объекта до мобильной навигации для захвата и манипулирования (рис. 2). Набор данных колумбийского захвата, набор данных объекта массачусетского технологического института КИТ и набор данных бытовых объектов Willow Garage доступны в Интернете и были использованы для оценки различных аспектов захватывающих алгоритмов, в том числе стабильность захвата, надежное захватывание и понимание сцены. Далибар и др. подключили "инструкции" манипулирующих задач к объектам.

Задача одного исследования является определение форматов кросс-платформенных форматов для представления данных. В то время как данные датчика, такие как изображения и облака точек, имеют небольшое количество широко используемых форматов, даже относительно простые данные, такие как траектории, пока не имеют общих стандартов, но исследования продолжаются. Еще одной проблемой является работа с разбросанными образами для эффективной передачи данных, например, алгоритмов планирования редких (разбросанных) движения для роботов и систем автоматизации.

Большие наборы данных, собранные из распространенных источников, часто «грязные» с ошибочными, дублируемыми или поврежденными данными, как например, данные 3D позиции, собранные во время калибровки робота. Новые подходы требуются такими, чтобы быть устойчивыми к «грязным» данным.