В сентябре этого года Amazon провела пресс-мероприятие в парных сферах в своей штаб-квартире в Сиэтле, объявляя о головокружении Массив новых аппаратных продуктов, предназначенных для работы с голосовым помощником Алекса. Но на этом мероприятии Amazon также представила несколько новых возможностей для Alexa, которые продемонстрировали, каким образом компания пытается дать своему голосовому помощнику то, что по сути является лучшей памятью. В какой-то момент во время презентации исполнительный директор Amazon Дейв Лимп прошептал Алексею команду сыграть колыбельную. Алекса прошептала в ответ. Достигнута жуткость.
Управляемые голосом виртуальные помощники, такие как Alexa, и колонки, в которых они живут, больше не являются новинкой; По оценкам, в 2018 году 100 миллионов интеллектуальных громкоговорителей были установлены дома по всему миру. Но в этом году компании, производящие продукты с голосовым управлением, попытались превратить их в разумных гаджетов. Алекса может иметь компьютерную версию «догадки» и предсказывать поведение человека; Помощник Google может вести разговор, не требуя от вас неоднократно произносить слово «бодрствование». Если окружающие вычисления — представление о том, что компьютеры окружают нас и могут воспринимать и реагировать на наши потребности, — это видение, которое видят технологи на будущее, то 2018 год может стать годом, когда видение стало более четким. Не взрывом, а шепотом.
Конечно, прогресс остается медленным. Голосовые помощники, такие как Alexa, Google Assistant, Apple Siri и Microsoft Cortana, все еще требуют особой специфики в диалоге, которая заставляет их казаться менее умными. Недавнее исследование, проведенное исследовательской фирмой IDC, показало, что 52,2 процента людей, которые использовали умный динамик в прошлом году, сказали, что их голосовая платформа «меня легко слышит», что означает, что почти половина респондентов испытали противоположный опыт.
«Еще многое предстоит сделать», — говорит старший аналитик IDC Адам Райт. «Эти платформы изо всех сил пытаются вырваться из оков, требующих от пользователей давать статические компьютерные голосовые команды — несмотря на то, что маркетинговый ажиотаж заставил бы нас поверить».
Однако нет никаких сомнений в том, что голосовые помощники их все больше зарабатывают на наших кухнях (и в машинах, и в офисах, и везде, где мы привозим наши смартфоны). Функция шепота Алексы может показаться простой, но встраивание этого в голосового помощника сопряжено с трудностями, потому что шепот обычно не связан с вибрацией голосовых связок, согласно белой книге, опубликованной инженерами Amazon. Алекса должна была пройти обучение записи человеческих взаимодействий с управляемыми голосом микрофонами в дальнем поле как в режиме шепота, так и в режиме обычной фонации.
Дело не только в том, что Алекса может шептать сейчас; это то, что Алекса может шептать в ответ, что указывает на будущее окружающих вычислений. Подобно тому, как ваш друг может также понизить голос, когда вы начнете говорить тихо или заговорщически через стол, Алекса будет подражать вашему тону. Alexa также был обновлен, чтобы иметь «человеческие догадки»: когда вы говорите виртуальному помощнику, что вы ложитесь спать или выходите из дома, Alexa предложит вам включить или выключить свет или запереть дверь, если вы это обычно делаете do.
В октябре Google объявила об обновлении своего помощника, который работает на смартфонах и устройствах Google Home, что должно было сделать его более разговорным. Некоторое время назад вы смогли задать помощнику один вопрос — например, «Какого роста Леброн Джеймс?» — и сразу же задать ему дополнительный вопрос о Леброне, не называя его имени снова. Теперь Google расширил память помощника. Задайте ему вопрос или дайте команду, и она будет продолжать слушать в течение 8 секунд после этого, так что вам не придется постоянно говорить «ОК, Google». (Это похоже на недавно выпущенную в Amazon функцию «Следить», в который вы можете спросить у Алекса, скажем, о погоде в определенном городе, а затем спросить о ресторане в этом же городе без необходимости его повторной идентификации.)
Google также дал своему помощнику возможность выполнять некоторые обязанности по дому. для вас — такие вещи, как экранирование ваших вызовов на телефоне Android или (в функции под названием Duplex, которая была выпущена этой осенью) — вести телефонные разговоры с реальным человеком, чтобы забронировать столик в ресторане или встречу в салоне.
В этом году Microsoft предприняла шаги, чтобы сделать Cortana, своего виртуального помощника, который работает на ПК и смартфонах, более разговорным. Обновления Siri в этом году в основном касались ярлыков, которые позволяют группировать действия на вашем iPhone или iPad и запускать их с помощью короткой голосовой команды. Apple также улучшила предложения Spotlight на основе Siri, разработанные для того, чтобы анализировать ваши привычки с течением времени и предлагать варианты действий на вашем телефоне. Это не разговорный но это окружающая осведомленность о том, что вам нужно сделать.
Каждый технологический гигант сосредотачивается на своем видении того, что должны делать эти активированные голосом AI, их различные боты попали в предопределенные роли. Alexa — самый умный кухонный таймер в мире, Google Assistant знает о вас очень много, Cortana — ваш друг в ИТ, который помогает вам устранять неполадки, а Siri — помощник руководителя на вашем iPhone.
Во всех этих службах. Технология распознавания голоса со временем улучшилась, как и показатели успеха помощников для предоставления фактического ответа. Отчасти это связано с научными достижениями в области искусственного интеллекта, а отчасти из-за огромного охвата iPhone и растущей популярности таких продуктов, как Amazon Echo и Google Home, которые создали гигантскую управляемую голосом петлю обратной связи. Чем больше «умных» устройств продают, тем больше компаний, использующих данные, должны совершенствовать свои технологии голосовой связи; чем больше улучшается голосовое управление, тем более привлекательными становятся гаджеты.
Но виртуальные помощники все равно спотыкаются, к лучшему или к худшему. (Взаимодействие между людьми для победы.) Несмотря на усилия, направленные на то, чтобы эти вещи звучали по-человечески, они все еще требуют от нас, настоящих людей в уравнении, чтобы разговаривать с ними как роботы. По сути, они иногда не понимают естественный язык, несмотря на использование расширенной обработки естественного языка. «Вам не нужно заглядывать очень далеко, чтобы найти отзывы пользователей, которые по-прежнему озвучивают разочарования по поводу того, что их устройство трудно разговаривать или они их не слушают», — говорит Райт.
Хорошее управление голосом представляет столько же этических проблем, сколько и моментов легкости.
Это может не иметь большого значения, если Alexa или Google Assistant неправильно понимают песню название вы просите его сыграть, или когда Сири не может найти мне абсолютно удобную заправку, когда я нахожусь в движущейся машине (что все еще происходит, и это расстраивает). Но это очень важно, когда вы используете этих разговорных помощников в таких областях, как, например, здоровье. Возможно, никого не удивляет, что их несоответствия не так нахальны, когда вопрос, который вы задаете, касается застойной сердечной недостаточности или упражнений для выживших после рака. В сентябре этого года в докладе, опубликованном в Журнале медицинских интернет-исследований прозвенел предупредительный звонок о виртуальных помощниках, заявив, что они часто не понимают связанных со здоровьем запросов и что почти 30 процентов ответов предоставляемые ассистентами «могут причинить вред, если будут действовать».
И, конечно же, голосовое управление, которое хорошо работает представляет столько же этических проблем, сколько и моменты легкости. Виртуальные помощники входят в нашу жизнь так же, как мы все больше узнаем о коварном обмене данными, практикуемом некоторыми из крупнейших мировых технологических компаний. В течение многих лет мы активно вводили наши запросы о покупках, наши будущие направления, наши романтические интересы, наши самые сокровенные мысли в машины. Теперь мы просто выкрикиваем их вслух, и системы голосового управления от Amazon, Google, Apple, Microsoft и даже Facebook оживляют наши слова. Спросите у Портленда, пары из Орегона, чей частный разговор был записан Alexa в этом году.
Райт, аналитик, не убежден, что проблемы конфиденциальности являются огромным сдерживающим фактором для нынешних или потенциальных пользователей помощников с голосовым управлением. Он считает, что счастливые клиенты готовы отложить в сторону частную жизнь для удобства. И согласно исследованию IDC, конфиденциальность даже не является основным препятствием для использования умного помощника; Большинство респондентов (более 31 процента) заявили, что они просто «бесполезны для них».
Это не остановит агрессивные попытки технологических компаний убедить вас, что голосовые помощники действительно полезны, что-то мы, вероятно, услышим еще больше в 2019 году. И вот в чем дело: когда эти вещи станут более полезными, мы, вероятно, не заметим, что это происходит. Вместо этого технология будет развиваться вокруг нас. Когда-нибудь в 2019 году вы могли бы позвонить другу только для того, чтобы услышать его ответ от виртуального помощника, а не вашего собеседника. Или вы можете использовать того же помощника (Google), чтобы зарезервировать для вас место под видом взаимодействия между людьми. Мы увидели проблески этого в 2018 году, и теперь это происходит. Вы можете начать разговор со своим виртуальным помощником, затем сделать длительную, чрезвычайно человеческую паузу и возобновить разговор без каких-либо затруднений.
Позже тот же самый помощник напомнит вам закрыть дверь перед тем, как вы ложитесь спать. , И когда он читает вам сказку на ночь — может быть, фантастическую книгу о роботах, захвативших мир, — он может знать, что должен понизить голос, когда вы начинаете засыпать.