Почему так сложно прогнозировать отток клиентов?

12.10.2015 Маркетинг

Оттекание клиентов (churn) — увлекательная неприятность. Вычислить его фактическое значение несложно. Но когда вы начинаете составлять прогноз на будущее, расчет делается заметно тяжелее.

Довольно часто маркетологи определяют и прогнозируют оттекание по-различному. Давайте разберемся с бессчётными методами и выбрать оптимальный. Для начала ответим на вопрос: что такое оттекание?

где:

Customer Lost During Period — количество клиентов, покинувших вас за период
Customers At Beginning Of Period — общее число клиентов на начало периода

К примеру, на начало января у вас было 100 клиентов. За месяц вы утратили 10 из них. Показатель оттока за январь будет равен 10%.

Это дескриптивная модель оттока. Она позволяет понять, что случилось, но ее возможности ограничены , если нам занимательна тенденция трансформации показателя. Единственное, что мы можем сообщить, опираясь на эту формулу: «Мы утратили 10% клиентов в этом месяце».

Дескриптивная модель предполагает, что для различных обстановок оттекание будет однообразным:

Неприятность появляется при попытке составить прогноз на будущее, основываясь на показателях прошлых периодов. Мы говорим: «Ожидается оттекание N% клиентов в следующем месяце, т.к.Почему так сложно прогнозировать отток клиентов? мы утратили n% в этом. Вычислить утраты клиентов в этом случае окажет помощь выборочная функция распределения:

В приведенном уравнении оттекание — выборка из бета-распределения. Подобная модель расчета употребляется с целью составить прогноз на базе имеющихся данных. Среднее значение распределения — это самая вероятная величина показателя.

Наряду с этим существует ряд других значений оттока, замечаемых только благодаря случайности. Бета-распределение показывает, как возможно осуществление этих альтернатив — оно зависит от площади под кривой. Не обращая внимания на то, что варианты 1/10 и 100/1000 дают однообразный показатель оттока — 10%, они воображают полностью различные распределения. Ниже изображены варианты с 1/10, 10/100 и 100/1000 уровнями оттока, визуализированные как распределения:

Обстановка подобна анализу результатов сплит-тестирования. Если вы вычислили уровень оттока, прежде всего направляться проверить, есть ли количество обработанных данных достаточным чтобы утверждать о достоверности этого значения.

Как пример: в случае если всего у вас 100 клиентов, в прошлом месяце вы утратили 3% из них, а в этом — 6%, то в полной мере возможно, что показатель churn практически был однообразным за оба периода. Выборочная функция распределения показывает, как полученная величина оттока соответствует данным, каковые мы собрали.

В то время, когда у нас нет достаточного количества данных, взятых на протяжении сплит-тестирования, мы продолжаем его до тех пор, пока не достигнем нужной статистической значимости. Возможно ли применить таковой прием при определении значения оттока?

Одна из главных задач аналитика — рассчитывать churn ежемесячно. Рассчитывая оттекание за январь, мы не можем применять эти февраля. Нужен метод, что смоделирует:

  • Утраты, каковые мы замечали посредством бета-распределения (фактический уровень оттока);
  • Скорость оттока как плавающую величину.

Еще одна сложность содержится в том, что число клиентов, покинувших нас за месяц, в какой-то мере случайно. Если бы мы имели возможность спрогнозировать его на 100%, модель оттока возможно было бы свести к несложной формуле.

  • Как устранить 4 главные обстоятельства оттока клиентов?

Моделирование оттока

Сделаем ход назад и попытаемся создать модель, в которой возможно не опасаться недостаточного количества данных. Вместо того, дабы фокусироваться на оттоке в изоляции, давайте разглядим клиентскую базу компании. Начнем с упрощенной модели, неспешно додавая упомянутые выше сложности.

На начальной стадии у нас имеется переменные:

p0 — начальная численность потребительского населения, изменяющаяся под действием переменных;
с — коэффициент оттока;
a — новые клиенты;
l — потерянные клиенты (на основании начальной численности уровня и населения оттока).

Формула, определяющая число клиентов в данном месяце (p1), выглядит следующим образом:

где

Сейчас посмотрим, что происходит с течением времени, при условии что:

Первая проверка любой математической модели пребывает в том, дабы сопоставить ее с вашим мировоззрением. Рост, показанный на графике, значительно более «ровный», чем в реальности. К тому же, на 50-м месяце рост останавливается.

Все вследствие того что эта модель применяет постоянное значение оттока (с) и новых клиентов (а). В конечном итоге, ни то, ни второе не есть постоянным. Модель необходимо дорабатывать.

Вместо того дабы учитывать постоянный c, начнем использовать последовательность cn и an.

Создадим 12-месячную последовательность уровня оттока:

c = 0.1, 0.11, 0.1, 0.09, 0.085, 0.07, 0.073, 0.072, 0.07, 0.069, 0.07, 0.069

Кроме этого создадим последовательность из количества новых клиентов:

a = 200, 180, 210, 212, 230, 250, 240, 230, 245, 250, 255, 260

Эти последовательности моделируют год, за который оттекание понижался, а число новых клиентов возрастало.

Формула для вычисления pn, изменится:

где:

Не забывайте, что p0 — «отправная» численность клиентов. Р1 — численность в последних числахЯнваря и т. д.

Диаграмма видоизменилась и стала выглядеть следующим образом:

Невооруженным глазом видно, что это был хороший год!

Появляется вторая неприятность. Существует множество неопределенностей, каковые не отражены в модели. Попытаемся добавить в отечественный расчет маленькую долю возможности.

  • Оттекание клиентов: как с ним бороться?

Внимание на стохастические процессы!

Термин «стохастический» в математике свидетельствует «случайный». Т.е. результат для того чтобы процесса не может быть спрогнозирован в начальном состоянии совокупности. самые известным стохастическим процессом есть броуновское перемещение. Если вы почитаете о нем в Википедии, то столкнетесь с несколькими ужасающими уравнениями.

Однако, их мысль достаточно несложна.

Начнем с обычного распределения, которое определяется величиной µ — математического ожидания и σ — среднеквадратического отклонения.

Стандартным обычным распределением именуется распределение с µ=0 и σ=1. На графике оно выглядит следующим образом:

Выборка из обычного распределения — совокупность случайных чисел данной модели. Причем чем ближе число к середине, тем возможнее его выпадение.

В случае если мы выберем 1000 случайных чисел из стандартного распределения N (0,1), то возьмём следующий график:

Чтобы привести пример к виду Броуновского перемещения, нужно вычислить нарастающий результат, в то время, когда любая точка будет являться суммой всех прошлых в модели.

В то время, когда мы представим распределение в виде Броуновского перемещения, его график купит следующий вид:

В случае если на первый взгляд график думается хаотичным, то по окончании применения способа нарастающего итога он делается похож на схемы колебания курса акций! В действительности, Броуновское перемещение есть ответственным компонентом модели Блэка-Шоулза (Black-Scholes model), используемой для ценообразования опционов. Кто знал, что прогнозирование оттока приведет нас в мир финансов!

Принципиально важно отметить: в случае если среднее значение обычного распределения больше нуля, модель броуновского перемещения будет иметь тенденцию перемещения вверх. В случае если среднее значение меньше нуля — график устремится вниз. Такое перемещение именуется дрейфом, т.к. случайный процесс дрейфует в определенном направлении.

  • Оттекание пользователей: каких клиентов направляться возвращать прежде всего?

Стохастическая модель оттока

Следующим этапом прогнозирования оттока есть формулировка стохастического дифференциального уравнения. Хорошее уравнение оказывает помощь обрисовать переменную либо функцию. Но отечественная разновидность будет различаться.

Стохастическое дифференциальное уравнение будет характеризовать случайный процесс!

Мы предполагаем, что приток и отток — случайные процессы, каковые характеризуют динамику численности потребительского населения в течении продолжительных лет. Дабы лучше осознать процесс, раздельно разглядим приток — как компонент модели.

Определим приток как Броуновское перемещение с математическим ожиданием µacq и среднеквадратическим отклонением σacq.

Формула говорит о том, что привлечение клиентов за период n — это n-ый ход в Броуновском перемещении. Хитрость в понимании — n-ый ход — не просто число, а пространство из множества возможных значений.

Имитировать оттекание мало сложнее. За базу модели кроме этого заберём Броуновское перемещение:

Данное уравнение — только теоретическое изменение оттока, которое в действительности мы ни при каких обстоятельствах не сможем замечать. Дабы совершенно верно воображать утраты, нужен еще один ход. Так как оттекание — выборка бета-распределения со средней величиной cn:

где l:

Сейчас отечественная функция будет смотреться как:

И в итоге приобретаем:

Полученное уравнение весьма похоже на последнюю выведенную нами формулу. Главное отличие в том, что Аn и Ln — случайные процессы, а не фиксированные значения в последовательности.

Посмотрим, как будут смотреться результаты выборки в этом случае. Все, что необходимо — найти значения некоторых параметров.

µchurn = 0.001, σchurn = 0.001
µacq = 0.05, σacq = 40
p0 = 1000

Предполагаем, что исходное значение оттока 0,1, а приток равен 200 (т.е. уровень оттока в начале 10%, а за период мы приобретаем 200 клиентов). На рисунке ниже графическое изображение стохастического процесса на период 72 месяца.

Помните — стохастическая модель предполагает, что любой раз, в то время, когда мы запускаем ее, мы приобретаем различные ответы!

Вы имеете возможность сообщить: «В моей компании ничего не бывает случайно! Мы не просто так занимаемся планированием!» Стохастические модели не утверждают, что события случайны. Они только считают, что события не выяснены.

К примеру, любой раз, в то время, когда вы проводите сплит-тестирование, существует шанс, что ваше ответ неправильно. Кроме того в случае если итог будет выяснен с 99,99% точностью, остается возможность неточности. Предположим, быстро изменился источник трафика Либо ваша совокупность сбора статистики дала сбой.

Незначительные колебания происходят чаще, чем большие, и обычное распределение учитывает это. Помимо этого, обычное распределение предполагает, что вы всегда работаете над улучшением продукта, а команда маркетологов систематично повышает конверсию (об этом говорит дрейф процесса).

  • Как расширить прибыль, снижая показатель оттока клиентов?

Моделирование данных, взятых наблюдением

Отечественной стохастической модели так же, как и прежде не достаточно параметров μchurn, σchurn, μacq, σacq. Не забывайте, за μ мы принимаем приобретения клиентов и общую тенденцию оттока, за σ — количество неопределенностей, с которыми мы сталкиваемся.

Будем применять прошлые значения притока и оттока клиентов:

с = 0.1, 0.11, 0.09, 0.085, 0.07, 0.073, 0.072, 0.07, 0.069, 0.07, 0.069
a = 200, 180, 210, 212, 230, 250, 240, 230, 245, 250, 255, 260

Сейчас рассчитываем μ и σ на основании собранных статистических данных. Отечественная модель предполагает накопительный результат значений обычного распределения. Наряду с этим запрещено отклонение и математическое ожидание от него. Мы должны вычислить отличие между каждой стадией:

cdiff = 0.010, -0.010, -0.010, -0.005, -0.015, 0.003, -0.001, -0.002, -0.001, 0.001, -0.001
adiff = -20, 30, 2, 18, 20, -10, -10, 15, 5, 5, 5

После этого, применяя нижеприведенные формулы, находим μ и σ:

Приобретаем:

μchurn = -0.002818182

σchurn = 0.006925578

μacq = 5.454545

μacq = 5.454545

Посредством параметров, взятых эмпирическим методом, строим стохастическую модель:

Самая броская линия на графике — данные, на которых основана полученная модель. Факт, что исходная информация находится в центре — хорошая проверка объективности отечественной модели. Остальные варианты, отмеченные яркими линиями — возможные дороги развития событий.

Еще одно подтверждение правильности взятой модели: чем дальше мы продвигаемся вперед во времени, тем шире делается диапазон вероятных вариантов. Так как чем дальше мы прогнозируем, тем менее уверены в собственных словах.

  • 27 стратегий удержания клиентов, каковые направляться взять на вооружение сейчас же

Применение способа на практике

Начальники в большинстве случаев не желают, дабы вы продемонстрировали им стохастический процесс со словами: «Посмотрите, как много мы не знаем! Страно, не правда ли?» Мы обрисовали, как сложно прогнозировать уровень оттока, но как применить модель на практике?

Разбирая эти за прошлый период, вы имеете возможность выстроить модель сегодняшнего дня и взглянуть, по какому как раз пути стали развиваться события. В случае если ваша компания не намечает глобальных изменений, то, вероятнее, дальше процесс будет протекать по подобной схеме.

Разбирая данные прошлых периодов, вы имеете возможность постараться разобраться в будущем. Применяя эти за 12 месяцев, вы видите, что модель предвещает на следующие 6:

В случае если председатель совета директоров видит в воображении расширение клиентской базы до 4000 человек за шесть месяцев, стохастическая модель окажет помощь вам с научной точки зрения растолковать, что это нереально кроме того с учетом лучшего финала событий. При «понижения» цели до 2500 клиентов модель посоветует, какие конкретно трансформации стоит внести в работу.

  • Как вычислить и расширить пожизненную сокровище клиента?

Заключение

Прогнозировать оттекание достаточно тяжело — постоянно остаётся некая неопределенность. Но, она не сможет поменять статус оттока как серьёзной SaaS-метрики.

Рассчитывая этот показатель любым методом, убедитесь, что вы понимаете свои ограничения. Чем меньше у компании клиентов, тем выше точность расчета. Чем больше клиентов — тем больше возможность вмешательства в процесс «сторонних» сил, и, как следствие, ниже точность прогноза.

Высоких вам конверсий!

По данным: blog.kissmetrics.com, image source: Rehman Asad

Случайные статьи:

Лекция 9 Case Study: Прогнозирование оттока пользователей


Подборка похожих статей: