Как зарабатывать больше с байесовской оценкой сплит-тестов? — Про успех, стратегию, карьеру и маркетинг

Классический подход к анализу тестов — так называемый t-тест, способ, используемый в частотной статистике. Не смотря на то, что он научно-обоснован, его недочёт: обращая внимание лишь на статистическую значимость, вы рискуете прибылью.

Сейчас обсудим, из-за чего байесовский подход лучше частотных метрик. Звучит сложно, но не нервничайте — в конце поста вы сможете совершить личный байесовский анализ без особенного труда.

Как создать успешную программу тестов?

Печальная правда в том, что многие стратегии тестирований умирают негромкой смертью. Если не все члены команды верят в проект по оптимизации, вы израсходуете большое количество времени, обосновывая собственную правоту. А вера в замысел тестов во многом зависит от числа успешных опробований. В случае если ваш «коэффициент побед» низок — скажем, ниже 20%, — значит, сайт не изменяется с течением времени, и мотивация и энергия людей скоро иссякает.

Нет отдачи от упрочнений — нет увлеченности, не говоря уже о том, что желание финансировать проект скоро улетучивается без достаточного маркетингового ROI.

Без результатов вашу работу не увидят. В случае если одно из десяти опробований «выстреливает», управление сочтет тесты «балластом» — и понизит приоритет проекта, либо вовсе закроет его.

Необходимо больше побед!

Ответ разумеется — необходимо больше успешных тестов. Но сообщить легко, а как сделать? К примеру, тестируя более храбрые вариации — но имеется и второй подход.

Пересмотрите само восприятие «успешного» теста, поменяв способ анализа.

Для оценки сплит-тестов принято применять частотную статистику. Не осознали? на данный момент объясним.

Основная неприятность частотных данных — результаты теста тяжело трактовать. Так, t-тест (входящий в частотную статистику) контролирует, как отличаются значения двух свободных групп. Главное положение теста — нет никакой отличия между коэффициентами конверсии групп А и В. Это так называемая нулевая догадка.

С частотной обработкой результатов вы отвергаете эту догадку, хотя доказать, что вариант В превосходит контрольную версию А. При заблаговременно заданном уровне достоверности теста (в большинстве случаев, 90% либо 95%), вы оцениваете, ниже ли р-значение (1 — уровень достоверности) теста порогового р-значения. В случае если итог чуть ли подпадает под нулевую догадку (скажем, р-значение — 0,02), то конверсия А отличается от В.

Поднимая «занавес тайны» над P-значениями, либо Как обучиться обожать малые эти (Small Data)

Невиновен, пока не доказано обратное

Частотная статистика напоминает судебные процессы. Нулевая догадка в суде — ответчик не виновен. Это отправная точка: подсудимый не считается виновным, пока вина не доказана.

Другая догадка — виновность ответчика, которую еще предстоит доказать уликами.

После этого доказательства защиты и обвинения оцениваются. Судьи задают вопросы себя: «Возможно ли, с учетом имеющихся данных, вычислять ответчика невиновным?» Иначе говоря актуальна ли нулевая догадка так же, как и прежде? Если она актуальна, мы не отвергаем ее, а утверждаем, что доказательств не хватает для обвинительного вердикта.

В другом случае, мы отвергаем нулевую догадку.

Так, t-тест основан на предположении, что варианты А и В равны. Это сбивает с толку, и не только вас: недавнее изучение продемонстрировало, что более 80% маркетологов совсем не знают частотную статистику.

Последнее, что интересует маркетолога, это с какой возможностью нулевая догадка ошибочна и версии теста не равны. Все, что он желает знать — какая из предположений действеннее?

Иными словами, частотная статистика нерелевантна главному вопросу сплит-теста.

Победил либо нет? Хороший вопрос!

Вторая неприятность — бинарность результатов. Вы или победили, или проиграли. Иначе говоря вы или отвергаете нулевую догадку, или оставляете ее в силе.

Места дискуссиям тут нет.

Посмотрев на тест ниже, вы осознаете, что победителя нет и вариацию не следует реализовывать. Так как р-значение не хватает низкое, дабы отвергнуть нулевую догадку. Исходя из этого тест неудачный, и маркетологи начинают сперва.

Но хорошие тенденции видны (рост конверсии — 5%). Легко улучшение не хватает сильное, дабы признать его заметным и значимым. Быть может, еще пара конверсий, либо чуть громадная выборка, и итог стал бы вторым.

Несложнее говоря — мысль теста хороша, а догадка верна. Легко стоило совершить опробование мало в противном случае либо продолжительнее. Но частотное тестирование — это поиск полных победителей. Другая догадка должна быть доказана так же точно, как правонарушение в суде — мельчайшие сомнения недопустимы.

Необходимо снять риски, как это вероятно.

Кстати, это неудивительно, в случае если знать, что t-тестами контролируют лечебные препараты. Вряд ли фармацевтическая компания начнёт выводить на рынок лекарство без полной уверенности в его безопасности и пользе.

Но интернет-маркетинг — не ядерная физика и не медицина. От мелкого просчета тестировщика никто не пострадает. Твёрдый упор на безопасность не содействует росту бизнеса.

Дабы победить, необходимо рисковать — хотя бы мало.

Как запустить сплит-тест, что сделает ваш онлайн-бизнес по-настоящему успешным

Какова альтернатива?

Байесовский подход к оценке сплит-тестов сейчас делается популярнее. Большая часть известных программных ответов для тестов обратились к байесовской оценке результатов.

Гугл Optimize и Stats Engine от Optimizely применяют способ, а VWO сравнительно не так давно перешли на байесовские ответы. И на другими словами обстоятельства: подход осмысленный, поскольку он отвечает на главный вопрос сплит-теста.

Байесовская статистика не применяет нулевую догадку, но определит: с какой возможностью В лучше А? Так мы забываем о р-значении, вместо чего спрашиваем: учитывая замечаемые эти, какова возможность того, что догадка верна?

То, чего мы ожидаем от тестов: В лучше А, либо нет? И на какое количество?

Байесовская оценка тестов

Подход избавляет от тяжёлых терминов. Никаких нулевых догадок, р-значений, z-значений и другого. Байесовский способ просто говорит о том, что сработало лучше: В либо А.

Звучит элементарно, не так ли? взглянуть на график:

На базе данных способ говорит о том, что с возможностью 89,1% версия В лучше, чем А. Применяя байесовский подход, вы забываете о бинарности результатов. Сейчас маркетологи видят правильную цифру — на какой процент вариация лучше контрольной версии.

Больше не требуется твердить: «с р-значением 0.102 мы не можем отвергнуть нулевую догадку». Смело и звучно заявляем: «С возможностью 89,1% конверсия варианта В выше, чем у контрольной версии А!».

Второе звучит лучше, не правда ли?

Байесовская статистика не применяет нулевую догадку, но определит: с какой возможностью В лучше А

Твитнуть цитату:

Как показалось понятие о среднем значении?

Делайте ставки!

Но необходимо ли реализовывать победившую версию? Байесовский анализ оценивает риски и рассчитывает, как следствия повлияют на доходы.

Среднее увеличение дохода (сумма зеленых полос в примере выше) возможно умножить на величину среднего значения и продолжить период до 6 месяцев (приблизительно, по причине того, что мы не знаем, как продолжительно трансформации будут стимулировать доход). То же верно для среднего падения конверсии (сумма красных полос выше).

В отечественном примере, компания утратит деньги с возможностью 10,9% (сумма риска — около $ 200 тыс.), а получит — с возможностью 89,1% (около $ 660 тыс.). Заманчивая возможность, не правда ли?

Байесовская оценка учитывает, что трансформации смогут быть малыми, и контролирует, перевешивает ли ожидаемый рост дохода риски от нулевого результата.

Как на большом растоянии стоит заходить?

Различные типы компаний по-различному относятся к риску. В случае если у вас стартап, то пространство для маневра шире, чем у громадного и «неповоротливого» бизнеса. Терять деньги не обожает никто, исходя из этого минимальная возможность успеха обязана держаться на уровне 75%.

Число не фиксированное и может варьироваться, в зависимости от теста. Скажем, поменяв заголовок, вы рискуете куда меньше, чем радикально переработав процесс заказа. На второе уйдет больше ресурсов, соответственно, возможность успеха должна быть выше.

статистическая достоверность и Оптимизация конверсии: это что может значить?

Вместо заключения

На фоне частотной статистики, у байесовского способа целая россыпь преимуществ:

Он понятнее — тяжёлые термины статистики больше не необходимы;
Лучше подходит бизнесу — способ показывает, что В лучше А на Х%.
Вы не теряете хорошие идеи, не доказавшие значимость при частотной оценке.
Доходы растут, а трансформации ускоряются. Вы не тратите время, опровергая нулевую догадку, а внедряете версии, каковые принесут прибыль.

Высоких вам конверсий!

По данным: conversionxl.com

Случайные статьи:

Как зарабатывают деньги на школьниках?! (тестирование игр)

Подборка похожих статей:

Возможность зарабатывать больше…

Шумиха около применения санкций стала мало тише. Возможно нормально сесть и подвести промежуточные итоги. Что изменилось в нашей жизни? Отметим два самых…
Техника скорочтения: как прочитывать больше 30 книг в год?

в один раз Уорен Баффет (Warren Buffett), которого довольно часто именуют величайшим инвестором ХХ века, просматривал лекцию перед студентами…
Хотите продавать больше? поставьте себя на место клиента

Ни при каких обстоятельствах не вспоминали над тем, какой метод создания маркетинговых сообщений самый действенный? Легко забрать продукт и назвать его…
Еще больше обновлений платформы lpgenerator

Здравствуйте, глубокоуважаемые пользователи сервиса! Как вы, точно, увидели, к осени, классическому сезону оживления фактически любого бизнеса,…

Случайные статьи:

Как зарабатывают деньги на школьниках?! (тестирование игр)

Подборка похожих статей:

riasevastopol