Спросите Алексу о погоде, и она скажет вам, что солнечно и 75 в приятном монотоне. Подскажите это, чтобы рассказать вам шутку, и он предложит каламбур в своем фирменном стаккато. Предложите ему спеть песню, и она выпустит автоматически настроенную деревенскую балладу. Виртуальный помощник Amazon может похвастаться множеством умных, похожих на людей способностей, но, как показывает его голос, Alexa по-прежнему всего лишь робот.
Чтобы помочь избавить Alexa от киборгического уклада, Amazon недавно обновила свои языковые теги разметки синтеза речи. которые разработчики используют для кодирования более естественных словесных паттернов в навыки или приложения Alexa. Новые теги позволяют Alexa делать такие вещи, как шепот, пауза, бред, ругань и изменяют скорость, громкость, акцент и тон своей речи. Это означает, что Алекса и другие цифровые помощники могут вскоре показаться менее роботизированными и более человечными. Но установление баланса между этими двумя крайностями остается серьезной проблемой для дизайнеров голосового взаимодействия и ставит важные вопросы о том, что люди действительно хотят от виртуального помощника.
Содержание статьи
Talk This Way
Давайте обойдемся без многообещающие вещи в первую очередь. Расширенные языковые теги могут сделать для компьютерной речи то же, что и пунктуация и эмодзи для текстовой коммуникации: увеличить пропускную способность информации. Простой язык разметки позволяет голосовым помощникам отличать 1996 год от 1996, или панду, которая ест побеги и листья, от панды, которая ест, стреляет и уходит. Расширенные теги позволяют им передавать гораздо больше. Вы знаете, как вы интерпретируете текстовое сообщение «великолепно звучит» иначе, чем «великолепно звучит;)»? Благодаря способности интонировать, цифровые помощники могут выражать подобные нюансы.
Возможно, вы слышали принцип дизайна, согласно которому форма должна следовать за функцией. У Алексы нет никакой физической формы, о которой можно было бы говорить, но ее цель должна сообщать ее персоне.
Возможно, более полезный помощник более полезен. «Музыкальные элементы речи помогают вам установить ожидания в отношении того, что будет дальше», — говорит Лаура Вагнер, психолингвист из Университета штата Огайо. Интонация может привести к более эффективной формулировке и меньшей неопределенности. Это также может дать Алексе эмоциональное преимущество перед цифровыми помощниками от Apple и Google. «Мы будем любить его больше, если он звучит по-человечески», — говорит Вагнер. Имеющиеся данные свидетельствуют о том, что люди чувствуют себя более связанными с объектами, способными к «случайному взаимодействию», отзывчивому общению с другим человеком. «Чем больше звучит Alexa, тем больше я хочу доверять ей и использовать ее», — говорит Вагнер.
Это, конечно, объясняет, почему Amazon хочет, чтобы Alexa звучала настолько человечно, насколько это возможно.
Имейте в виду (ожидание) разрыв
Но Amazon рискует заставить Алексу звучать слишком человечно, слишком рано. В феврале компания представила «речьконс» — десятки междометий, например argh; cheerio; * d'oh; * и bazinga (нет, действительно, bazinga ), что Алекса излагает более выразительно, чем другие слова. Amazon хочет добавить слой личности к своему виртуальному помощнику, но такие странные вещи могут сделать Alexa менее полезным.
«Если Alexa начнет хорошо говорить такие вещи, как хмм и ]вы собираетесь сказать ей подобные вещи », — говорит Алан Блэк, ученый-компьютерщик из Карнеги-Меллона, который помог в использовании тегов разметки синтеза речи в 1990-х годах. Люди склонны имитировать разговорные стили; сделайте цифрового помощника слишком случайным, и люди ответят взаимностью. «За счет этого ассистент может не понимать, что говорит пользователь», — говорит Блэк.
Улучшение личности голосового ассистента за счет его функций — компромисс, с которым все чаще сталкиваются дизайнеры пользовательского интерфейса. «Мы хотим, чтобы личность общалась или мы хотим, чтобы утилита давала нам информацию? Я думаю, что во многих случаях мы хотим, чтобы утилита давала нам информацию», — говорит Джон Джонс, который разрабатывает чат-ботов в глобальной консалтинговой фирме Fjord Просто потому, что Alexa может отбросить разговорные выражения и ссылки на поп-культуру, это не значит, что нужно. Иногда вам просто нужна эффективность. Цифровой помощник должен встретить прямую команду с коротким ответом или, возможно, молчанием, а не с буйями! (Еще одна речь, добавленная Amazon.)
Однако личность и полезность не являются взаимоисключающими. Возможно, вы слышали, что форма макса дизайна должна следовать за функцией. У Alexa нет физической формы, о которой следует говорить, но ее цель должна сообщить своей персоне. Но навыки понимания цифровых помощников остаются слишком элементарными, чтобы соединить эти два идеала: «Если речь очень похожа на человека, это может привести к тому, что пользователи будут думать, что все остальные аспекты технологии также очень хороши». са Майкл МакТир, соавтор The Conversational Interface . Чем больше разрыв между тем, как помощник звучит, и тем, что он может делать, тем больше расстояние между его способностями и тем, что пользователи ожидают от него.
Скажи мне, что ты хочешь
Это поднимает важный вопрос: что люди хотят от виртуального помощника? В конце концов, заботы дизайнеров взаимодействия должны отражать интересы пользователей, но вам интересно, кто больше всего выигрывает от изменений, которые они вносят. Усилия Amazon, направленные на то, чтобы сделать Alexa звучащим как можно более человечным, позволяют предположить, что пользователи ожидают от своих искусственно интеллектуальных помощников большего, чем просто включение света или прогноз погоды. Они хотят, чтобы эти устройства понимали их. Связаться с ними. Может быть, даже — не смейтесь — встречайтесь с ними.
Но было бы наивно игнорировать мотивы компаний, производящих эти продукты. Amazon хочет продавать вам вещи (в конце концов, в соответствии с его принципами разработки владельцы Alexa идентифицируются не как «пользователи», а как «клиенты»), и для этого можно использовать более эмоционального помощника. Амазонка уже пытается собрать чувства от голосов пользователей Alexa; Само собой разумеется, что ИИ, более способный выражать эмоции, также был бы более способен анализировать и манипулировать вашим собственным.
Жутко, да, но также многообещающе. Amazon может использовать выразительность Alexa, чтобы продавать ваши вещи, но социальные роботы могут использовать ту же технологию, чтобы, скажем, лучше заботиться о пожилых людях. Поскольку компании продолжают разрабатывать помощников, которые кажутся менее механическими, грань между полезностью и общением будет продолжать стираться. Достигнет ли он того момента, когда Алекса будет действовать как эмоционально интеллигентный друг? Может быть. Amazon остается в нескольких шагах от создания виртуального помощника, который может предугадать ваши потребности и желания; до тех пор он все еще сталкивается с множеством оставшихся без ответа вопросов, которые могут помочь сформировать, как эти помощники вписываются в вашу жизнь.