Техника помогает роботам найти входную дверь

Техника помогает роботам найти входную дверь

В не столь отдаленном будущем роботы могут быть отправлены в качестве транспортных средств последней мили, чтобы оставить ваш заказ на заказ, пакет или подписку на набор еды на вашем пороге — если они смогут найти дверь.

Стандартные подходы для роботизированной навигации предусматривают картографирование области заблаговременно, а затем используют алгоритмы, чтобы направить робота к определенной цели или GPS-координате на карте. Хотя этот подход может иметь смысл для изучения конкретных сред, таких как планировка конкретного здания или планируемая полоса препятствий, он может стать громоздким в контексте доставки последней мили.

Представьте, например, что необходимо заранее составить карту каждого района в пределах зоны доставки робота, включая конфигурацию каждого дома в этом районе вместе с конкретными координатами входной двери каждого дома. Такая задача может быть трудно масштабируемой для всего города, особенно потому, что внешний вид домов часто меняется в зависимости от сезона. Картирование каждого дома также может столкнуться с проблемами безопасности и конфиденциальности.

Теперь инженеры MIT разработали метод навигации, который не требует предварительного картирования местности. Вместо этого их подход позволяет роботу использовать подсказки в своей среде для планирования маршрута к месту назначения, который можно описать в общих семантических терминах, таких как «входная дверь» или «гараж», а не в качестве координат на карте. Например, если роботу дают указание доставить посылку кому-то перед входной дверью, он может начать движение по дороге и увидеть подъездную дорогу, которую он обучен распознавать как ведущую к тротуару, которая, в свою очередь, может привести к к входной двери.

Новая техника может значительно сократить время, затрачиваемое роботом на изучение свойства, прежде чем идентифицировать свою цель, и не зависит от карт конкретных мест проживания.

«Мы не хотели бы составлять карту каждого здания, которое нам нужно было бы посетить», — говорит Майкл Эверетт, аспирант факультета машиностроения MIT. «С помощью этой техники мы надеемся уронить робота в конце любой дороги, и он найдет дверь».

Эверетт представит результаты группы на этой неделе на Международной конференции по интеллектуальным роботам и системам. Статья, в соавторстве с которой Джонатан Хау, профессор аэронавтики и космонавтики в Массачусетском технологическом институте, и Джастин Миллер из Ford Motor Company, являются финалистом «Лучшей статьи для когнитивных роботов».

«Ощущение того, что есть вещи»

В последние годы исследователи работали над внедрением естественного семантического языка в роботизированные системы, обучая роботов распознавать объекты по их семантическим меткам, чтобы они могли визуально обрабатывать дверь, например, как дверь, а не просто как твердое прямоугольное препятствие. ,

«Теперь у нас есть возможность дать роботам ощущение того, что есть в режиме реального времени», — говорит Эверетт.

Эверетт, Хау и Миллер используют аналогичные семантические методы в качестве трамплина для своего нового подхода к навигации, который использует уже существующие алгоритмы, которые извлекают элементы из визуальных данных для создания новой карты той же сцены, представленной в виде семантических подсказок или контекста.

В их случае исследователи использовали алгоритм для построения карты окружающей среды при перемещении робота с использованием семантических меток каждого объекта и изображения глубины. Этот алгоритм называется семантическим SLAM (одновременная локализация и сопоставление).

В то время как другие семантические алгоритмы позволили роботам распознавать и отображать объекты в своей среде, какие они есть, они не позволяли роботу принимать решения в данный момент во время навигации в новой среде по наиболее эффективному пути для семантического назначения. такие как «входная дверь».

«Раньше исследование было просто, плюхните робота вниз и скажите« иди », и он будет двигаться и в конечном итоге доберется, но это будет медленно», — говорит Хоу.

Стоимость идти

Исследователи стремились ускорить планирование пути робота в семантическом мире контекста. Они разработали новый «оценщик стоимости за поездку», алгоритм, который преобразует семантическую карту, созданную ранее существовавшими алгоритмами SLAM, во вторую карту, представляющую вероятность того, что любое заданное местоположение будет близко к цели.

«Это было вдохновлено переводом от изображения к изображению, где вы фотографируете кошку и делаете ее похожей на собаку», — говорит Эверетт. «Идея такого же типа происходит здесь, когда вы берете одно изображение, которое выглядит как карта мира, и превращаете его в это другое изображение, которое выглядит как карта мира, но теперь оно окрашено в зависимости от того, насколько близки разные точки карты. до конечной цели. «

Эта недорогая карта раскрашена в оттенках серого, чтобы представить более темные регионы как места, удаленные от цели, и более светлые регионы как области, близкие к цели. Например, тротуар, закодированный желтым цветом в семантической карте, может быть переведен с помощью алгоритма cost-to-go как более темная область на новой карте по сравнению с проезжей частью, которая постепенно становится светлее при приближении к входной двери — — самый светлый регион на новой карте.

Исследователи обучили этот новый алгоритм на спутниковых снимках с Bing Maps, содержащего 77 домов из одного городского и трех пригородных районов. Система преобразовала семантическую карту в недорогую карту и наметила наиболее эффективный путь, следующий за более светлыми областями на карте, к конечной цели. Для каждого спутникового изображения Эверетт назначил семантические метки и цвета для контекстных объектов в типичном переднем дворе, таких как серый для входной двери, синий для проезжей части и зеленый для живой изгороди.

Во время этого тренировочного процесса команда также применяла маски к каждому изображению, чтобы имитировать частичное представление, которое, вероятно, будет иметь камера робота при прохождении через ярд.

«Часть хитрости нашего подхода заключалась в том, чтобы [дать системе] много частичных изображений», — объясняет Хо. «Так что на самом деле нужно было выяснить, как все эти вещи были взаимосвязаны. Это часть того, что делает эту работу надежной».

Затем исследователи проверили свой подход в моделировании изображения совершенно нового дома вне учебного набора данных, сначала используя ранее существующий алгоритм SLAM для генерации семантической карты, затем применяя свой новый метод оценки стоимости для создания второго карта и путь к цели, в данном случае входная дверь.

Новая методика группы с минимальными затратами обнаружила, что входная дверь оказалась на 189 процентов быстрее, чем классические навигационные алгоритмы, которые не учитывают контекст или семантику, а вместо этого проводят чрезмерные шаги, исследуя области, которые вряд ли будут близки к их цели.

Эверетт говорит, что результаты показывают, как роботы могут использовать контекст для эффективного определения цели, даже в незнакомой, не нанесенной на карту окружающей среде.

«Даже если робот доставляет посылку в среду, в которой он никогда не был, могут быть подсказки, которые будут такими же, как и в других местах, которые он видел», — говорит Эверетт. «Таким образом, мир может быть изложен немного по-другому, но, вероятно, есть некоторые общие черты».

Это исследование частично поддерживается компанией Ford Motor.