Как выявлять привычки пользователей: data-driven подход

Боб Мур (Bob Moore), генеральный директор и соучредитель SaaS-компании кросс-платформенной аналитики RJMetrics, выступил на ежегодной конференции Habit Summit в 2016 году с презентацией о том, как выявлять и вырабатывать пользовательские привычки, применяя data-driven подход.

Вступление

В начале 1980-х гг. память имела цену2 цента за байт. На первый взгляд, думается, что это не верно уж и большое количество. Но так думается ровно , пока мы не вдумаемся, что же такое байт в конечном итоге.

Так, обладателю маленькой кофейни, дабы сохранить нужную информацию о продаже чашки кофе в базе данных (время и дата продажи, наименование, цена, и т.д.) потребовалось бы приблизительно 16 байт либо 32 цента. Учитывая, что средняя цена чашки кофе в то время была около 50 центов, сохранение всех этих данных было полностью невыгодным в экономическом замысле.

Поразмыслить лишь, 1 Гб при тех расценках стоил $20 000 000!

Недавно.

К счастью, обстановка с того времени значительно изменилась, и цена хранения данных быстро снизилась. на данный момент вы имеете возможность купить флешку на 1 Гб приблизительно за $0.80 вместо $20 000 000. Ее хватит, дабы сохранить данные о продаже 62 500 000 чашек кофе.

Также случился фундаментальный сдвиг в возможностях передачи, хранении и сбора данных. На графике ниже отображен рост скорости передачи данных за период с 1970 по 2012 гг.:

Как выявлять привычки пользователей: data-driven подход

Скорость передачи данных в домашней сети, 1970-2012 гг.
Шкала по вертикали: скорость (бит в секунду)
Шкала по горизонтали: год

Кое-какие из вас, быть может, привычны со следующей инфографикой. Это ландшафт маркетинговых разработок по состоянию на март 2011 и август 2016 года:

Ландшафт маркетинговых разработок в 2011 и 2016

В 2011 году на данной инфографике было 100 компаний, тогда как в 2016 их насчитывалось уже 1 876. Любая из этих разработок разрешает применять интернет для сбора информации о людях, взаимодействующих с продуктами компаний. Это источники данных (data sources) появились вследствие того что сейчас хранение данных стоит дешево, а скорость ее передачи большая.

Возможность сохранять все данные о пользователях и продукте разрешает иметь достаточное количество информации о поведении ваших клиентов, дабы начать разбирать их действия с позиций психологии.

на данный момент несложнее, чем когда-либо осознавать привычки и поведение собственных клиентов, применяя data-driven подход. Как раз об этом и отправится обращение в данной статье.

Просматривайте кроме этого: 4 примера действенного применения «громадных данных» от больших ритейлеров

причинность и Корреляция

Частенько происходит подмена понятий «корреляции» (correlation) и «причинности» (causation).

Главная мысль тут такова: лишь вследствие того что две вещи ведут себя сходным образом, еще не свидетельствует, что одна из них вызывает другую.

Тайлер Вигэн (Tyler Vigen), создатель блога Spurious Correlations (Фальшивые корреляции), находит корреляции между совсем несвязанными между собой статистическими данными. К примеру, между числом смертей в бассейнах и числом фильмов с участием Николаса Кейджа. Его цель — продемонстрировать, что наличие корреляции нельзя приравнивать к наличию причинно-следственной связи.

Количество людей, утонувших в бассейне (коричневый график) коррелирует с числом фильмов с Николасом Кейджем (тёмный график)

Посмотрев на график, возможно заявить, что существует важная связь между двумя этими размерами. Отечественный мозг приходит к умозаключению, что каким-то образом Николас Кейдж важен за эти смерти.

Объяснений, из-за чего это вправду возможно так, — множество. Вот только кое-какие из них:

  1. Прямая причинно-следственная сообщение: фильмы с Николасом Кейджем вызывают смерти в бассейнах. Быть может, фильмы с его участием так дезориентируют людей, что те в буквальном смысле падают в бассейн и тонут.
  2. Обратная причинно-следственная сообщение: смерти в бассейнах влекут за собой появление фильмов с Николасом Кейджем. Быть может, люди, которые связаны с индустрией бассейнов, любой раз, в то время, когда происходит возрастание смертностей в следствии утопления в бассейнах, желают отвлечь внимание общественности от этого факта и содействуют выпуску фильмов с Николасом Кейджем.
  3. Скрытая переменная: существует третья переменная, вызывающая оба этих события. Допустим, в то время, когда ожидается жаркое лето, в прокат производят больше блокбастеров, а люди чаще проводят время в бассейнах. Или происходит спад в Экономике, и Николас Кейдж больше склонен сниматься в это время период, а люди больше времени выполняют дома, отдыхая у собственных бассейнов.
  4. Циклическая причинность. Это теория, в соответствии с которой Николас Кейдж — серийный убийца. Любой раз, в то время, когда выходит фильм с его участием, он испытывает столь сильную эйфорию, что начинает ходить и сталкивать людей в бассейны. Но лишь в тот момент, в то время, когда он сталкивает кого-то в бассейн, к нему и приходят идеи хороших фильмов. Так, А вызывает В, а В вызывает А.
  5. Эти вещи совсем не связаны между собой.

Цель этого примера состоит не в том, дабы заявить, что единственное верное объяснение — последнее, а разрешить понять, что мы в действительности не знаем правды. И без сбора дополнительной информации мы не сможем сделать этого, поскольку любая из этих вещей теоретически вероятна.

Для получения желаемых результатов мы должны применять эти корреляции в качестве направляющих указателей, талантливых привести нас к возможности выполнения и дополнительным тестам итераций, применяя цикл проверки догадок «создать-оценить-обучиться» (Build, Measure, Learn):

Цикл проверки догадок «создать-оценить-обучиться» (Build, Measure, Learn)

Итеративный процесс, основанный на данных, разрешает отыскать настоящие результаты, кроме того с учетом ошибочно-хороших результатов (false positives).

Статистическая значимость

Скажем, вы решили совершить сплит-тестирование на вашем сайте, и ваш текущий коэффициент конверсии (conversion rate) образовывает 1%.

Вы тестируете другую версию страницы, и коэффициент конверсии возрастает до 1.1% (опыт А). В этом случае с целью достижения статистически значимых результатов вам потребуется 159 650 визитёров.

В опыте B мы переходим от 1% к 2%, и размер нужного трафика быстро снижается до 2 226 визитёров.

В случае если совершить опыт, из-за которого коэффициент конверсии увеличится до 3%, количество нужного трафика снизится еще значительнее.

Что касается стартапов, то у них нет возможности иметь огромные размеры выборки, дабы определить какие-то вещи о собственных продуктах и о том, как клиенты смогут конвертироваться либо взаимодействовать с ними. Вы вправду должны играться по-большому. В другом случае возможно погибнуть в ожидании, по причине того, что вы окажетесь в ситуации, в то время, когда постепенные по собственной природе трансформации не смогут быть протестированы за тот период времени, которым вы располагаете.

И как правило при таком сценарии вы станете достигать локальных максимумов (local max).

Так, совершая маленькие постепенные трансформации (цвета кнопки, текст на домашней странице, и т.д.), вы возможно начнете с A, дойдете до локального максимума, а после этого совершите еще один тест и перейдете в точку B. Сейчас вы поразмыслите: «Что ж, в этом направлении график идет вниз, как и в другом. Я отыскал собственный максимум». Тестируя маленькие постепенные трансформации, вы так и не найдёте собственный глобальный максимум (big max).

Шкала по вертикали: результаты
Шкала по горизонтали: стратегия

В случае если у вас весьма ограниченное количество данных и вы желаете верить втом, что вы найдёте собственный глобальный максимум, самое серьёзное, что вы должны сделать — это тестировать большие трансформации.

Громадные трансформации разрешают вам не только узнать ответы значительно стремительнее (так как в этом случае влияние на коэффициент конверсии совсем второе), вместе с тем отыскать эти глобальные максимумы.

Потом мы разглядим кое-какие примеры настоящих техник, каковые применяли RJMetrics.

Просматривайте кроме этого: Как избежать предвзятого отношения к собственным данным?

Техника: «анализ золотых перемещений» (Golden Motion Analysis)

За этим примечательным заглавием в конечном итоге прячется не что иное как ретроспективный анализ (retroactive analysis) поведения пользователей, талантливый предвещать возможность совершения ими желаемого действия в будущем.

Разглядим его использование на конкретном примере.

Компания RJMetrics предлагает всем желающим бесплатную пробную версию собственного продукта (инструмент бизнес-аналитики). В течение 7 дней пользователи смогут протестировать все его функции.

Компания решила узнать, какие конкретно действия людей ведут к повышению коэффициента конверсии, и после этого, применяя эти сведенья, поменять собственный onboarding-процесс так, дабы большее количество пользователей совершали эти действия.

С целью этого они решили вооружить собственный продукт инструментом, что бы собирал разные эти. Еще недавно сделать подобное было бы весьма сложно. на данный момент же за счет того, что показалось огромное количество SAS-инструментов (к примеру, Mixpanel, Snowplow, Heap), возможно легко собирать подробную данные обо всем, что происходит с вашим продуктом:

  • Вход в совокупность
  • Создание графиков
  • Редактирование графиков
  • Добавление пользователей
  • Предоставление неспециализированного доступа к панелям мониторинга
  • Применение API
  • Подключение нескольких источников данных
  • Время, совершённое в инструменте

Потом вы должны взятую данные с другими значимыми данными, касающихся ваших целей. Для RJMetrics данной целью было повышение коэффициента конверсии. Тут вы снова же имеете возможность применять инструменты сторонних производителей, например, тот же RJMetrics.

В итоге у вас образуется подобная таблица:

Любая запись тут отображает одно конкретное воздействие пользователя: создание таблицы, вход в совокупность, добавление нового пользователя, и т.д.

Затем вы имеете возможность свести все эти сведенья к истории о каждом отдельном пользователе, воспользовавшимся бесплатной версией вашего продукта.

В итоге компания имела возможность сообщить по каждому пользователю, конвертировался он либо нет, сколько графиков он создал, сколько пользователей добавил, какое количество данных присоединил, применял ли он API, и т.д. Всего у них было 20-30 различных параметров:

Слева-направо: ID пользователя, конвертировался он либо нет, количество созданных графиков, количество добавленных пользователей, количество присоединенных данных, и т.д.

После этого они совершили тесты для проверки догадок, дабы узнать, вели ли те либо иные действия пользователей к повышению коэффициента конверсии.

У RJMetrics была куча теорий. К примеру, одна из них звучала так: присоединение большего количества источников данных ведет к повышению коэффициента конверсии. И эта догадка была фальшивой. Сравнив количество людей, добавивших один источник данных, с числом тех, кто добавил более одного источника данных, они нашли отсутствие статистически значимого отличия и соответственно доказательства того, что данное воздействие пользователей ведет к повышению конверсии:

Они прошлись по всему перечню догадок, пока не дошли до создания графиков. Вопрос был следующий: ведет ли создание большего количества графиков на протяжении пробного периода к повышению коэффициента конверсии? И ответом было решительное «да»:

Из тех, кто не создал по большому счету ни одного графика, в итоге конвертировались лишь 30% людей. Из тех же, кто добавил 1 и более график, конвертировалось 62%.

Тест продемонстрировал сильное статистически значимое отличие кроме того с небольшим размером выборки (sample size).

Они пошли дальше и сравнили результаты по большему количеству графиков, и нашли каскадную статистическую значимость: чем больше графиков было создано, тем выше был коэффициент конверсии:

Слева-направо: количество графиков, коэффициент конверсии, размер выборки, статистическая значимость (да/нет)

В итоге они поменяли собственный продукт так, дабы любой пользователь создал по крайней мере 2 графика:

  • Создали обучающий тур по применению построителя отчетов (report builder).
  • Давали новым клиентам домашние задания по созданию собственных отчетов. Улучшили документацию по построителю отчетов.
  • Снабдили менеджеров по работе с клиентами инструментами для отслеживания данной метрики.

И после этого им необходимо было напомнить себе об «эффекте Николаса Кейджа». Лишь по причине того, что люди создают коэффициент и графики конверсии возрастает, еще не обосновывает, что внесение всех этих трансформаций в обязательном порядке приведет к повышению коэффициента конверсии. Быть может, пользователи, каковые конвертировались, легко изначально были расположены к созданию графиков.

Вследствие этого было принципиально важно возвратиться назад и повторно измерить эти, совершить процесс еще раз и взглянуть, что случится.

Рост коэффициента конверсии RJMetrics, 2013 г.

В итоге за 2 месяца RJMetrics удалось расширить собственный коэффициент конверсии в два раза.

Если бы они просто проводили сплит-тестирования либо пробовали направляться собственной интуиции без применения всех измерения и этих инструментов данных, они ни при каких обстоятельствах бы не обнаружили, что именно создание графиков было тем действием, талантливым привести их к таким результатом. Это был весьма значимый момент в истории компании.

Просматривайте кроме этого: Как эти оказывают помощь принимать более действенные бизнес-ответа?

Техника: Кластерный анализ (cluster analysis)

Обычно мы думаем о отечественных потенциальных клиентах с позиций персон пользователя (user personas) либо пользовательских групп (user group). Построение этих образов совершенных клиентов очень принципиально важно для любой компании.

Исторически сложилось так, что огромное количество работы по созданию этих образов в действительности осуществляется без применения фактических данных. Многие создают гипотетические образы пользователей, основываясь только на совершённых опросах, и т.д. Не смотря на то, что это и весьма действенно, сейчас существует много бесплатных разработок, разрешающих вам выяснить ваши персоны пользователя и поместить людей в эти группы.

Тут опять понадобится та сводная таблица, которую мы разглядывали выше, потому, что она является перечнемвсех тех вещей, каковые различные люди делают с продуктом. При с кластерным анализом вы имеете возможность выяснить параметры, по которым вы станете собирать людей:

Что касается RJmetrics, они постоянно знали о 2 типах собственных пользователей: один из которых был «зритель» (тот, кто применял и просматривал графики), а второй — «создатель» (тот, кто создавал графики). Соответственно, в случае если человек создал хотя бы один график, он попадал в категорию «создатель».

Итог совершённого ими кластерного анализа, в котором употреблялись всего 2 показателя «создание отчётов» и «просмотр отчётов», вы имеете возможность видеть ниже:

Шкала по вертикали: просмотр отчета
Шкала по горизонтали: создание отчета, редактирование отчета, создание метрики

4 красных X на этом графике соответствуют центрам кластеров — самые типичным представителям данного кластера.

Кроме этого, если вы увидели, точки на графике окрашены в различные цвета в соответствии с принадлежностью к одному из 4-х кластеров.

Обратите внимание на зеленые точки рядом с X в правом нижнем углу:

Эти люди были самыми «изголодавшимися» потребителями, каковые так ничего и не создали. Они входили в совокупность каждый день и каждые 5-10 мин. обновляли страницу. Кластерный анализ деятельно определял аккаунты этих клиентов.

Выяснилось, были случаи, в то время, когда компании крепили телевизоры на стене, выводили на них панель RJMetrics и устанавливали расширение для браузера, машинально обновляющее страницу каждые 10 мин..

Так, RJMetrics нашли паттерн применения (usage pattern), о котором они кроме того не догадывались, но что демонстрировал громадной количество потребления их продукта.

Потом они связались с этими компаниям, совершили тематические изучения (case studies) по применению их продукта в качестве платформы для визуального отображения информации, и создали контент по применению продукта подобным образом.

Сейчас перейдем к пользователям, находящимся в левом верхнем углу. Это те пользователи, каковые взаимодействовали с панелью RJMetrics уже более реалистично, но так и не создали ни одного графика:

Как правило этими людьми появились другие руководители и генеральные директора; другими словами люди, важные за потребление информации, но не являющиеся прямыми создателями этих данных.

Имея возможность математически выяснить, кто попадает в эту группу, а кто нет, RJmetrics смогли заявить, что принципиально важно как раз для них. Так, для этих начальников не имеет значения, что компания обучает создавать графики — для них принципиально важно верно трактовать эти.

И, наконец, самыми перспективными для компании были две оставшиеся группы пользователей:

В зеленом квадрате находятся «супер-пользователи» RJMetrics. Это люди, каковые создавали графики и взаимодействовали с ними; люди, каковые частенько входили в совокупность. Одним словом, это те пользователи, о которых все мы грезим.

Вместе с тем на графике мы видим красный прямоугольник — это люди, находящиеся на пороге того, дабы стать этими «сверх-пользователями». У них имелись все нужные навыки для графиков и они входили в совокупность достаточно систематично. Но они не потребляли продукт так же «жадно», как пользователи из зеленого квадрата.

У компании стало возмможно обратиться напрямую к этим пользователям и содействовать тому, дабы со временем они перешли в разряд пользователей из зеленого квадрата. Наряду с этим они не тратят время тех людей и руководителей, кто уже и без того находится в зеленом квадрате. Их, со своей стороны, они вероятно будут склонять к получению тематических изучений либо завлекать на пользовательские конференции, и т.д.

В следствии, благодаря кластерам, каковые они смогли выяснить, компании удается сохранять размещение собственных пользователей и не вызывать у них эмоции отторжения скучными для них сообщениями.

Просматривайте кроме этого: Как выяснить паттерн клиента на вашем сайте?

Вместо заключения

Так, возможности, каковые открывают для нас эти, бесконечны. И в этом, фактически, и состоит мораль всей истории.

Крайне важно, дабы компании осознавали ценность и всю значимость данных. Не смотря на то, что они и не ответят на все ваши вопросы, при всем наряду с этим они являются очень ответственный элемент, что делается все более значимым по мере того, как вы изучаете пользовательские привычки.

Делайте бизнес на базе данных!

По данным: habitsummit.com

Случайные статьи:

Data Driven подход с Facebook Pixel Как получить центовый трафик


Подборка похожих статей:

riasevastopol