Квест на разработку надежной рейтинговой системы
Взять 01: слишком высокие рейтинги
Со временем мы стали видеть аномалии между рейтингами и фактическим качеством наших поставщиков услуг.
Мы знали, что наши поставщики услуг были очень профессиональны, потому что у нас был очень строгий процесс регистрации, но баллы были исключительно высокими (например, 4,99 из 5), и у нас едва были отрицательные отзывы или низкие оценки.
Однако мы получили достаточно жалоб, чтобы сделать вывод, что наша рейтинговая система не выделяет неэффективных поставщиков услуг. В некоторых крайних случаях мы даже видели клиентов, которые оценили услугу как 5 звезд, а затем занесли в черный список поставщиков услуг…
Не было никакой корреляции между неудовлетворительными поставщиками услуг и их рейтингами или обзорами.
Вот что мы нашли:
- 41% наших клиентов оценили свое лечение (для Uber это ± 70% пользователей, в Fiverr это ± 65%, основываясь на форумах).
- Только 15% написали обзор (продавцы Amazon отмечают 10% в качестве эталона).
- 97% оценок составляли 5 звезд (максимально возможный).
- Только 2% рейтингов были отрицательными (ниже 3 звезд)
- Это означает, что 1% всех пользователей сообщили: «плохой сервис»
Теперь вы можете взглянуть на эти цифры и подумать: «в каком прекрасном бизнесе они находятся!», Но возвращаясь к уровню чувствительности наших услуг, составленному с учетом количества жалоб, которые мы получили через наш чат по интеркому, наших показателей удержания. И другие наши ключевые показатели эффективности — мы просто знали, что эти цифры не могут отражать реальное качество предложения.
Наша рейтинговая система не была надежной.
Пример 02: Понимание, почему это происходит
В ходе опросов клиентов и частых повторений продуктов мы нашли 3 основные причины:
1. Большинство клиентов молчит. Эти пользователи означают мир для бизнеса, но они никогда не общаются с ним: они не оставляют обзоры, они не предоставляют обратную связь, а вместо этого — они просто действуют. Если они недовольны продуктом, они просто перестанут его использовать, ничего не сказав. Пуф… ушел.
2. Публичные жалобы — это обычно неприятный поступок. В нашем случае это еще сложнее: многие из наших поставщиков услуг относятся к относительно низкому социально-экономическому статусу: они усердно работают, путешествуют от одного клиента к другому, носят с собой свое оборудование, усердно работают для развития своего бизнеса. Теперь вы показываете мне клиента, который чувствует себя комфортно, оставляя плохой отзыв для косметолога, который просто провел 2 часа, работая над ее ногтями, просто потому, что ее педикюр был недостаточно хорош.
3. Это вопрос времени. В нашем случае многие из проблем были обнаружены через несколько дней после лечения (то есть маникюр скол или волосы снова стали вьющимися). К тому времени пользователям было намного проще запускать приложение и связываться с нами через интерком-чат, чем переходить к своим историческим заказам, вводить последний, нажимать кнопку обзора и оставлять плохой отзыв. Опция чата была не только более доступной, но и обычно вызывала немедленный отклик у нашей команды по работе с клиентами.
Мы поняли, что из-за характера нашего бизнеса (и клиентов) положительные отзывы поступают благодаря рейтингу. система, в то время как отрицательный отзыв поступает в виде жалоб, направленных непосредственно в нашу команду по работе с клиентами, что косвенно вводит в заблуждение нашу систему рейтинга.
Проверьте лучшее из мобильной ложки
Пример 03: Решение этой проблемы
Пользователи стремятся к прозрачности, и наши пользователи ничем не отличаются. Если мы хотели, чтобы наши клиенты пользовались доверием нашей рейтинговой системы, мы должны были сделать ее более надежной.
Мы хотели собрать больше отзывов (и рейтингов) и, что еще важнее, побудить клиентов критиковать нас, написав отрицательные отзывы.
Мы добавили в продукт две небольшие функции / модификации:
1. Подсказка для оценки самой последней обработки независимо от того, когда пользователи вернулись в приложение: Поскольку пользователи не всегда обращали внимание на параметр рейтинга, мы позаботились о том, чтобы они увидели его как раздражающую популярность каждый раз, когда они возвращались в приложение — даже если это произошло через 10 дней после начала лечения.
Тем самым мы хотели повысить шансы того, что пользователи будут оценивать свои услуги, и, если прошло достаточно времени, то, возможно, они будут удобнее критиковать его.
Это изменение дало некоторые незначительные улучшения:
- 53% клиентов оценили свое лечение (по сравнению с 41% ).
- 92% рейтингов составляли 5 звезд (по сравнению с 97% ).
- 19% клиентов написали обзор (по сравнению с 15% ).
- Тем не менее, только 2% обзоров были отрицательными.
2. Опрос удовлетворенности одним кликом: Мы добавили опрос одним кликом, который был разослан клиентам через 24 часа после окончания лечения. В опросе спрашивалось что-то вроде: «как вы относитесь к своему лечению?», И в нем было 3 ответа, обозначенных как смайлики: счастливое лицо, безразличное лицо и расстроенное лицо (которые впоследствии были заменены другим дизайном).
96% не оценивали поставщиков услуг вообще.
Таким образом, изменения, которые мы внесли, не оказали существенного влияния, но они доказали, что пользователи, которые были крайне недовольны сервисом, выражали свое «несчастье» в опросе одним щелчком мыши вместо того, чтобы ставить плохой отзыв или низкий рейтинг для поставщики услуг.
Подпишитесь на мою рассылку и станьте на 23% удивительнее среднего!
Пример 04: переход к количественным данным
На данном этапе у нас все еще были 3 серьезные проблемы:
- Наша рейтинговая система все еще была чрезмерно позитивной и воспринималась как ненадежная.
- Исследование удовлетворенности было лишь частично эффективным для отслеживания несчастных клиентов из-за низкого уровня вовлеченности.
- Еще раз, не всегда была корреляция между жалобами клиентов, рейтингами и показателями удовлетворенности опросами.
Мы начали работать над двумя умными индексами, предназначенными для измерения качества каждого лечения, не полагаясь на обратную связь с людьми.
1. Оценка удовлетворенности потребителя
Как рассчитать уровень удовлетворенности покупателя, не спрашивая его?
Вы анализируете поведение этого покупателя после каждой процедуры, сравниваете его с предыдущими моделями поведения и оцениваете уровень удовлетворенности в соответствии с к дельте.
Для нас у нас было 8 типов действий которые клиенты могли выполнять и могли рассказать нам об уровне своей удовлетворенности (то есть пометить поставщика услуг как любимого, предварительно заказав другое лечение, дай хороший отзыв и многое другое). Мы отслеживали эти действия и создавали поведенческие шаблоны, чтобы сравнить новые экземпляры с существующими и выявить исключения.
Результат? Учитывая набор действий, выполненных данным клиентом, мы могли оценить (с некоторой эвристикой, конечно), насколько удовлетворен этот клиент данным лечением.
Затем мы взяли пробелы в оценках (исключения т. е. дельты) и начали их агрегировать для каждого поставщика услуг.
Поэтому, если, например, некоторые поставщики услуг часто генерировали более низкие показатели удовлетворенности — их средняя дельта удовлетворенности была отрицательной тогда как поставщики услуг, которые вели высокие показатели удовлетворенности — начали демонстрировать положительные дельты.
2. Персональный индекс частоты выпадения (оттока) для каждого поставщика услуг
Я писал об этом здесь: минимизация утечек на рынке для автономных услуг.
Мы изначально изобрели личную частоту пропадания, чтобы отслеживать утечка в автономном режиме, но, как мы выяснили позже, это магическое число было также очень полезно в качестве показателя качества.
В двух словах: этот индекс вычисляет частоту оттока, которую ведет каждый поставщик услуг, измеряя частоту выпадения постоянных клиентов который прекратил использование продукта после того, как обслуживался этим конкретным поставщиком услуг.
Если средний коэффициент сброса в системе 20%, а у определенного поставщика услуг — 50%, это означает, что этот человек вызывает серьезный отток — что очень плохо.
Высокий коэффициент пропадания может указывать на одно из следующего:
- Этот человек обеспечивает плохое качество обслуживания (= плохое).
- Этот человек выводит клиентов из сети (= плохо, плохо, плохо).
В любом случае — этот человек наносит ущерб нашему бизнесу и должен либо улучшиться, либо быть удален из системы.
Бум! Теперь вы говорите!
С этими двумя индексами теперь мы можем видеть корреляцию между нашими исследованиями удовлетворенности, оценкой удовлетворенности и уровнем снижения. И красота этих индексов заключалась в том, что они всегда были включены и не зависели от вовлеченности клиентов или коэффициентов конверсии. Muhahaha!
На этом этапе мы почувствовали, что у нас достаточно показателей качества для мониторинга сообщества наших поставщиков услуг.
Но вся эта красота все еще не решала первоначальную проблему надежности рейтинга…
Взять 05: поделиться некоторыми конфиденциальными номерами с нашими клиентами
Таким образом, индексы были хороши для внутреннего контроля качества, но нам все еще нужен был способ повысить надежность визитных карточек наших провайдеров и исправить нашу слишком позитивную систему оценок.
Вместо того, чтобы пытаться снизить рейтинги, мы решили оставить все как есть и добавить дополнительную информацию основанную на некоторых внутренних, беспристрастных KPI.
Цель состояла в том, чтобы продвигать Наиболее эффективные поставщики услуг, основанные на достоверных данных, не призывающие клиентов критиковать своих поставщиков услуг.
В смелый шаг (по крайней мере, так мы к этому относились) мы добавили следующие ключевые показатели эффективности:
1. Пунктуальность: мы знали, что опоздания расстроили наших клиентов, так почему бы не поделиться этой информацией с ними заранее?
За счет ужесточения наших процедур обслуживания и регистрации опозданий — мы смогли поддерживать показатель пунктуальности для каждого поставщика услуг. Мы представили этот номер нашим клиентам и таким образом достигли двух вещей: 1 — мы призвали поставщиков услуг приложить больше усилий. 2 — мы были прозрачны с нашими «чувствительными ко времени» клиентами, которые были рады узнать эту информацию, прежде чем выбрать поставщика услуг.
2. Популярность (индекс избранного): поэтому покупателям было неудобно размещать плохие отзывы, но у нас было нечто более ценное, чем их слова: их действия . Мы использовали нашу функцию «добавить в избранное», чтобы измерить количество клиентов, которые отдали предпочтение каждому поставщику услуг и поделились этим числом с нашими клиентами.
Вы можете найти поставщиков услуг со средним баллом 4,95 звезды но их индекс фаворитов составлял 10% в то время как другие поставщики услуг имели только 4,83 звезды но имели 70% фаворитов. Индекс избранного был более достоверным, поскольку он основывался на поведении клиентов, а не на голосах или словах.
3. Ранг: помните скорость выпадения? Этот блестящий индекс не был чем-то, что мы могли бы поделиться с нашими клиентами, но мы могли бы определенно продвигать некоторых поставщиков услуг, у которых был самый низкий показатель сброса (и наибольшее удержание), давая им особое звание.
Видите ли, поставщики услуг с низким уровнем сбрасывания ставки способствуют удержанию рынка — они хороши для бизнеса, так почему бы не продвигать их, давая им специальный значок? Мы создали 4 уровня ранга и поделились этими значками как часть визитной карточки.