(Источник изображения: Анки) |
Маленький робот на моем столе знает мое имя и узнает мое лицо. Он говорит мне, когда ему нужно техническое обслуживание. У него есть три куба, которые он любит складывать, стучать и играть. Он также расскажет мне, когда ему надоедает и хочет играть в игру. Когда он победит, он будет танцевать. И если я буду бить его слишком много раз, он станет грустным или бросит истерику.
Его зовут Козмо. И хотя он игрушечный робот размером 2 дюйма, люди, которые его создали, не хотят, чтобы вы думали о нем как о игрушке или о машине. Они хотят, чтобы вы думали о нем как о персонаже, например о Wall-E, о жизни. Anki, компания за Cozmo, говорит, что ее миссия — «создавать роботов, которые вас трогают», сочетая робототехнику и искусственный интеллект, чтобы создавать технологии, с помощью которых люди могут создавать эмоциональные связи.
Cozmo не является промышленным роботом на любом участке. Но AI за ним указывает путь вперед для робототехники как на потребительском, так и на коммерческом уровне с точки зрения создания машин, которые могут лучше понять и связать людей вокруг них. Компании уже разрабатывают ИИ, чтобы помочь автономным автомобилям распознавать и реагировать на наши эмоции. Почему наши игрушки и даже наши совместные роботы не должны делать то же самое?
Настройка Cozmo довольно проста. Робот перемещается по ступенькам. Он приходит с тремя электрическими «кубиками силы» и использует подтяжку, чтобы манипулировать ими. Используя приложение для смартфонов, пользователи могут вручную управлять им, инструктировать его выполнять простые задачи, например, складывать или компоновать кубы, играть в игры с ним или против него и даже «кормить» и выполнять техническое обслуживание. Робот не требует никакого реального и грязного обслуживания, но его настроение и производительность пострадают, если вы позволите ему «проглотить» или зайти слишком долго, не поддерживая его. Техническое обслуживание состоит из мини-игры, в которой вам нужно подражать последовательности нажатия кнопок, чтобы настроить Cozmo вверх. Это похоже на то, что младшие владельцы Cozmo, вероятно, съедают (он рекомендуется в возрасте от 8 лет и старше).
Что касается функциональности, он, по-видимому, является последним шагом в давней традиции любительских роботов, подобных тем, которые вы использовали в наборах на Radio Shack. Они будут делать основные вещи, например, следовать строкам на земле или собирать и перемещать объекты … но с точки зрения личности они не испытывали особого недостатка. Такие игрушки, как Hatchimals и Furby, уже добавили этот эмоциональный элемент. Но они делают больше дыма и зеркал — используя вызов и реакцию, чтобы вызвать серию запрограммированных жестов.
Это не значит, что Козмо не делает что-то одно и то же. Но там, где он выделяется, заключается в том, как он использует ИИ в сочетании с его физическими движениями, чтобы не только распознавать и реагировать на окружающую среду и людей, с которыми он взаимодействует, но и действовать таким образом, который чувствует себя нюансированным и реалистичным.
Короткометражный фильм с участием Козмо. |
Cozmo реализует ИИ для многих своих функций, в частности, для распознавания объектов и машинного зрения для поиска своих кубов и распознавания людей. Но акцент делается на использовании ИИ, чтобы дать Cozmo способность передавать эмоции в сложном взаимодействии выражения лица (он имеет два цифровых глаза), голосовой тон и даже язык тела. Cozmo не будет просто шуметь, чтобы вы знали, что он счастлив; его глаза загорятся, и он будет танцевать по кругу. Если вы скажете ему, что сейчас вы не хотите играть в игру, он разочаровывает голову и угасает, как разочарованный ребенок. Согласно Anki, Cozmo может распознать и ответить на пять основных человеческих эмоций: гнев, отвращение, страх, счастье, печаль и удивление.
В приложении Cozmo есть базовый, удобный для детей инструмент кодирования под названием CodeLab, который позволяет вам программировать его, чтобы выступить с некоторыми простыми подпрограммами и действиями. Некоторые могут быть удивлены, узнав, что робот также поставляется с полным комплектом разработки программного обеспечения с открытым исходным кодом (SDK). Любой, обладающий знаниями Python, может углубиться в функциональность Cozmo и запрограммировать его на выполнение еще более сложных действий. SDK также обходит семейные фильтры, установленные в приложении, поэтому нет ограничений на то, что вы можете сказать Cozmo. Уровень контроля, который SDK дает вам над Cozmo, достаточно глубок, что небольшое сообщество собралось в сети людей, создающих короткие фильмы с участием робота.
-
Создание ИИ, которое понимает эмоции
-
Robots Unleashed: Осложнения мобильности
-
6 раз AI не дожидался до шумихи
Четыре столпа создания персонажа
И если люди оживляют Cozmo, это именно то, чего хочет Anki. «Цель с Козмо всегда заключалась в том, чтобы попытаться воплотить в жизнь персонажа», — сказал Марк Палатуччи, глава облачного ИИ Аники и наука о данных, Design News . «Мы пытались думать о персонажах в фильмах и фильмах, таких как фильмы Pixar, и действительно думать о том, что нужно сделать, чтобы воплотить это в реальный мир».
Palatucci и его соучредители, генеральный директор Boris Sofman и президент компании Hanns Tappeiner, начали Anki в 2010 году как ответвление программы робототехники Университета Карнеги-Меллона. После окончания университета Palatucci сказал, что команда начала с того, что хочет привлечь к массовым потребителям робототехнику, технологию AI и технологию машинного обучения. Но они быстро обнаружили, что в то время вся работа в этих областях осуществлялась в правительственных исследованиях и применениях военной и промышленной автоматизации. «Мы увидели возможность использования более дешевых аппаратных и мобильных устройств для приведения этой магии робототехники и ИИ в физические продукты по цене, что имеет смысл», — сказал Палатуччи.
Идеальная индустрия для этой прыгающей точки оказалась игрушкой и развлечением — сектор Палатуччи сказал: «во многих случаях был очень застойным и не был тронут мобильным [technology]».
Первый продукт компании, Overdrive, был выпущен в 2015 году. Overdrive — это игра в гоночный автомобиль, напоминающая игры с электромобилями, которые были популярны в 80-х и 90-х годах. Вы строите собственный гоночный трек, а другие автомобили изучают трек и сражаются против вас.
Anki последовали Overdrive год спустя с Cozmo. Недавно он завершил успешную кампанию по обратному копированию для своего робота следующего поколения, Vector.
Философия дизайна компании вращается вокруг четырех основных столпов: видения и восприятия для таких задач, как распознавание лица и объектов; аниматроники; AI; и интерактивный контент, который включает в себя все игры и действия для робота.
Проектирование Cozmo было совместной работой инженеров и аниматоров. Робот был раскадроврен и протестирован как анимационный персонаж для фильма или телевизора. (Источник изображения: Anki) |
Чтобы оживить свои роботы, в компании работает междисциплинарная команда инженеров-механиков и инженеров, дизайнеров игр, экспертов по искусству и даже аниматоров. «Поскольку мы действительно хотим [our robots] быть выразительными и передавать эмоции, мы буквально наняли аниматоров из Pixar, Dreamworks и других больших анимационных домов и построили конвейер, основанный на анимации художественного фильма», — пояснил Палатуччи. Он добавил, что рабочий процесс компании при проектировании Cozmo не похож на рабочий процесс для создания анимированного персонажа. «Мы используем такие инструменты, как майя, вплоть до физических роботов», — сказал он. «У нас есть команда анимации, которая видит, что робот делает движение вместо того, чтобы видеть симуляцию. Это было действительно важно в трубопроводе ».
В процессе разработки Cozmo аниматоры Anki раскалывали робота и выполняли те же тесты анимации, что и на персонаже для фильма или телевизора. «Это была такая же строгость, как и анимированный проект. Мы спрашивали себя, каковы мотивы этого персонажа? Его сильные стороны? Недостатки? Чего он хочет достичь в мире? Вы можете делать сотни вариантов чего-то такого же маленького, как глаза, но в конечном итоге это важная часть персонажа ».
Даже голос был результатом тщательного проектирования и тестирования. «Голос Козмо был записан нашим звукорежиссером Бен Габальдоном, — сказал Палатуччи. «Он записал свой собственный голос, а затем передал звук через компьютерный синтезатор и ряд эффектов, чтобы найти правильный« голос »для Cozmo. Запись голоса человека обеспечивает органический источник, в то время как комбинация синтеза и обработки звука после производства создает личность и производительность финального голоса Козмо ».
Палатуччи сказал, что компания прошла более 50 прототипов машиностроения, прежде чем оформить окончательную версию Cozmo. Но вся работа оплачивается, особенно с более молодой аудиторией Cozmo. Исследование 2017 года, проведенное исследователями в MIT Media Lab, предназначалось для изучения того, как дети в возрасте от 2 до 10 лет воспринимают интерактивные агенты, включая Cozmo, вместе с Amazon Alexa, Google Home и разговорным чатботом по имени Julie. После взаимодействия с Cozmo детей попросили ответить на вопросы о доверии, интеллекте, социальной сущности, личности и участии. Результаты показали, что 40% детей младшего возраста (в возрасте 3-4 лет) считают Cozmo более умными, чем их, тогда как 20% детей старшего возраста (в возрасте 6-10 лет) сообщили об этом.
Согласно исследованию, выражение Козмо и способность двигаться были ключевым фактором для детей, которым это нравится: «Своими глазами и движениями Козмо смог эффективно общаться с эмоциями, и поэтому дети полагали, что у Козмо есть чувства и разум. «В исследовании, как сообщают дети,« [Cozmo] имеет чувства, он может сделать это со своей маленькой шахтой, и он может двигать глазами, как человек, смущенные глаза, сердитые глаза, счастливые глаза … »
Механический дизайн Cozmo прошел более 50 итераций до окончательной версии. (Источник изображения: Anki) |
Более умный смартфон
Хотя Cozmo содержит множество датчиков для компьютерного зрения, в частности, он не полностью полагается на встроенный процессор. Вместо этого робот контактирует с вашим смартфоном. Вся его обработка, связанная с ИИ, обрабатывается через облако. Если вы думаете о том, что Cozmo имеет мозг, ваш смартфон, по сути, является его лобной корой, работая с приложениями более высокого класса. Более низкие функции типа мозжечка, такие как управление движением и двигателем, обрабатываются встроенным микроконтроллером NXP Kinetis.
«Что стало ясно: если бы мы собирались сделать все на самом роботе, это обошлось бы в 400-400 долларов. Мы хотели сделать его доступным как можно большему числу людей и позволить миллионам людей его приобрести », — сказал Палатуччи.
Он продолжил: «Первым инженером, которого мы принесли, было доказательство многих схем компьютерного видения, — чтобы эти алгоритмы работали как можно лучше. Например, были проблемы, например, дело с большим разнообразием освещения. У вас дома с различными условиями освещения и различными типами естественного и искусственного внутреннего и наружного освещения, и вам нужно настроить его на камеру [robot’s]. Это потребовало огромных инвестиций, и вопрос также становится следующим: сколько из этой [machine vision] компьютеризации вы делаете в самом роботе против приложения в телефоне? »
Во время разработки Палатуччи сказал, что команде Anki стало ясно, что, пользуясь смартфонами, они могут разгрузить соответствующие части двигателя AI и системы компьютерного зрения. В результате они могли бы лучше распределять высокочастотные задачи, такие как система управления, которая должна запускаться сотни раз в секунду, из задач с более низкой частотой, таких как система компьютерного зрения, которая может позволить себе некоторое время ожидания.
Enter Vector
Осенью этого года Anki планирует следить за Cozmo с Vector, роботом следующего поколения, который компания называет «более крупным и умным братом Cozmo». Самая значительная итерация — включение встроенного процессора, что устраняет необходимость использования смартфона. По словам компании, Vector полностью автономный, облачный и всегда включен. (В отличие от Cozmo, он будет искать свой собственный зарядник и заряжать себя, как Roomba.)
Вектор, преемник Cozmo, имеет встроенный процессор Qualcomm, устраняющий необходимость использования смартфона для обработки AI и машинного обучения. (Источник изображения: Anki) |
Anki выбрала процессор Qualcomm APQ8009 для обработки новых возможностей восприятия Vector и глубокого обучения. Спецификации Qualcomm показывают, что APQ8009 представляет собой 32-битный четырехъядерный процессор с четырьмя ARM Cortex A7. Он способен захватывать HD-видео до 720p. Процессор оснащен встроенным процессором обработки изображений и возможностями компьютерного зрения, а также маломощным Wi-Fi и Bluetooth-соединением и может обрабатывать GPS и другие системы локализации спутников.
Большая часть той же работы по дизайну персонажей, выполненная с Cozmo, была расширена до Vector. По словам компании, у робота более тысячи тщательно продуманных анимаций, и ее характеристика теперь дополняется более мощными технологиями. Vector имеет HD-камеру с ультрашироким полем обзора 120 градусов и новой четырехмикрофонной матрицей для распознавания как голосовых команд, так и отдельных голосов (большая недостающая часть из Cozmo). Он даже предлагает обнаружение кромок, чтобы не убегать от края таблиц (проблема с Cozmo, если вы не следите за ним).
Говоря с Design News по электронной почте, Ханс Тэппейнер, соучредитель и президент Anki, сказал, что снижение цен на мощные компоненты является огромным фактором в том, как компания смогла сделать такой значительный обновления от Cozmo до Vector. «Одна из тех вещей, которые мы совершенствовали на протяжении многих лет, — это то, как массово производить убедительные робототехнические роботы и роботы, работающие на AI, и при этом значительно снизить стоимость. Например, Cozmo имеет около 340 компонентов и стоит $ 179.99, но Vector составляет около 800 частей и будет стоить $ 249,99 при запуске, делая гораздо больше », — сказал Тэппейнер. «Поддержание векторного робота по доступной цене — это не то, что мы смогли достичь, если бы не выяснили, как производить мощные интеллектуальные домашние роботы в массовом масштабе».
Предел SDK
И новые функции обещают еще больше для разработчиков (и потенциальных кинематографистов), которые хотят экспериментировать.
«Программы векторного SDK запускаются на компьютере, что дает пользователям возможность интегрироваться с любыми совместимыми технологиями машинного обучения / AI, такими как TensorFlow от Google или что-то еще», — сказал Tappeiner. «Разработчики могут подключить свой компьютер, ноутбук или даже малину Pi непосредственно к Vector через свою домашнюю сеть Wi-Fi». Он добавил, что SDK Vector будет поддерживать те же положительные аспекты Cozmo, а именно, что он основан на Python и с открытым исходным кодом , что означает, что существуют тысячи существующих библиотек, которые разработчики могут использовать.
Мы решили дать SDK Cozmo попробовать и в конечном итоге заставили его попробовать «В моих ощущениях» Дрейка и танцевать под песню. |
. Короче говоря, это означает, что разработчики и любители могут создавать собственные алгоритмы машинного обучения, чтобы научить Vector новым задачам и выполнять пользовательские способности. Например, студенты и исследователи могли обучать Vector для выполнения задач пользовательского распознавания объектов. Глубокая обучающая нейронная сеть Vector расширяет лицевое и объектное распознавание Cozmo и изображениями (это означает, что Vector может распознавать не только человека, но и изображение этого человека), открывая возможность для сильного числа сценариев обучения и проектов DIY.
«Что стало очевидным в раннем развитии, так это то, что многие из функций в Cozmo будут интересны энтузиастам. Поэтому в первые дни мы сделали [the] SDK минимально жизнеспособной функцией продукта », — сказал Палатуччи о SDK Cozmo. «Как только мы запустили, мы увидели много университетов, которые прыгают на нем, изучая основы курса, используя эту платформу. И CodeLab действительно заполнил пробел среди детей, которые намного моложе, могут писать свои собственные программы … »
Он продолжил: «Мы всегда думали, что SDK для образования будет хорошим рынком людей. Мы получили много писем от семей детей-аутистов, поблагодарив нас за [Cozmo] и рассказав нам, какое влияние оно оказало. Мы получили один, который сказал: «Мой ребенок не играет и никогда не приглашает людей, но у нас есть Cozmo, и теперь он просит детей из школы прийти и поиграть и пообщаться с ним». Это не то, чего мы ожидали ».
Больше персонажей приходят?
Tappeiner сказал, что Anki уже собирается развернуть будущие продукты в 2020 году. «Мы никогда не стеснялись наших амбиций по созданию целевых роботов для дома с высоко определенным эмоциональным интеллектом (EQ). Мы уже используем наши знания от разработки Vector — в дополнение к работе, которую мы сделали вокруг Overdrive и Cozmo, — и применяем их к нашей будущей дорожной карте продукта ».
Будут ли Anki продолжать движение по пути игрушек и развлечений на данный момент или сделать первые шаги в направлении более крупных амбиций в робототехнике, и AI еще предстоит увидеть. На данный момент компания также пообещала, что Vector, как и Cozmo, будет продолжать получать более умные данные через бесплатное эфирное (OTA) программное обеспечение и обновления прошивки. «Одна из самых больших вещей в этих типах продуктов — это возможность обновлять все, начиная от прошивки и приложения до облачных сервисов, — сказал Палатуччи. «И со всеми разработчиками, которые создают контент и сообщество, создавая контент быстрее, чем мы можем, это добавляет большую ценность. Робот, который вы покупаете в первый день, потенциально очень отличается по дороге ».
Крис Вильц — старший редактор в Design News охватывающий новые технологии, включая AI, VR / AR и робототехнику.
Go to Top |