Цель симулятора
Научить продакт-менеджеров планировать, проводить и анализировать A/B тесты на реальном трафике. Правильно формулировать гипотезы, избегать ошибок при интерпретации данных и эффективно работать со стейкхолдерами.
Сценарий симулятора

Добро пожаловать в команду онлайн-маркетплейса бытовой техники "Техника24"!


Здесь твоя работа будет не про скучные таблицы, а про реальные ситуации, когда бизнес зависит от твоих решений. У тебя есть трафик, есть проблемы — и, как водится, куча предложений от коллег, готовых "спасать конверсию". В этом симуляторе ты разберешься, как отличить удачные гипотезы от бесполезных и вытащить из данных настоящую пользу.

Предыстория
Шаг 1: Формулируем гипотезу
Команда "Техника24" бьет тревогу. Мы видим, что товары активно добавляют в корзину, но конверсия в заказ всего 3,2%.

Собрание начинается. На встрече:
  • Ваня, маркетолог: "Ребята, я уверен, что скидка в 10% спасет всё! Пусть всплывает окошко, если клиент уходит. Они точно оформят заказ!"
  • Саша, CPO: "Сначала давайте проверим, поможет ли это. Иначе скидка ударит по марже."
  • Катя, аналитик: "А мы успеем тест провести до Черной Пятницы? Надо действовать быстро."

И тут появляешься ты. В роли продакт-менеджера, твоя задача — организовать тест так, чтобы получить надежные результаты и принять правильное решение. Важно доказать свою точку зрения и не дать маркетингу слить бюджет. Готов?

Стартовать
Контекст:
Ты — продакт-менеджер маркетплейса, и твоя цель — понять, почему конверсия из корзины в заказы остается низкой. На встрече с командой маркетолог Ваня предлагает добавить всплывающее окно с 10% скидкой для тех, кто не завершает покупку.

Аналитик Саша сразу уточняет:
— Если будем тестировать, нужна правильная гипотеза. Без неё эксперимент ничего не покажет.
Теперь тебе нужно помочь команде сформулировать гипотезу, чтобы тест имел смысл и дал корректные результаты.

Какую из приведённых гипотез можно считать корректной для A/B теста?

Комментарий от Саши:
— Хорошая попытка, но гипотеза слишком общая. Ты говоришь о действии и эффекте, но не уточняешь метрику (например, конверсия в заказы) и временные рамки. Без этих данных результат будет сложно измерить.
Комментарий от Саши:
— Слишком расплывчато. Какие именно метрики ты собираешься улучшить? Конверсию? Средний чек? Уровень отказов? Также не указаны размер скидки и срок, за который ты ожидаешь результат. Гипотеза должна быть конкретной, чтобы тест был корректным.
Комментарий от Саши:
— Да! Гипотеза должна быть конкретной. Мы указываем метрику, эффект и временные рамки. Иначе не поймем, получилось ли достичь цели.
Комментарий от Саши:
— Это не гипотеза, а скорее утверждение, и оно звучит как допущение без проверки. Почему продажи вырастут? Как ты будешь это измерять? Вспомни: гипотеза должна быть проверяемой, а значит, нужны цифры, метрики и конкретное действие.
Дальше
Проверить
Узнать результат

Почему гипотезу нельзя формулировать как «мы увеличим продажи, если предложим скидку»?

Комментарий от Вани:
— Да, это верно, но не полный ответ. Сложность прогнозирования — лишь одна из причин. Проблема шире: гипотеза должна учитывать, что продажи зависят не только от скидок.
Комментарий от Вани:
— Тоже правильно, но недостаточно. Тесты лучше строить на конкретных метриках, таких как конверсия. Это делает результаты более точными и привязанными к действиям пользователей.
Комментарий от Вани:
— Верно, но не охватывает всю картину. Кроме выбора метрики, важно учитывать, что продажи сильно зависят от внешних факторов, которые ты не сможешь контролировать в тесте.
Объяснение от Вани:
— Да! Продажи зависят от кучи вещей: от логистики до погоды. Лучше сфокусироваться на конверсии в заказы. Тогда тест покажет, влияют ли скидки на целевое действие — оформление заказа.
Дальше
Проверить
Узнать результат

Какой из нижеперечисленных параметров не является обязательными для гипотезы?

Комментарий от Саши:
— Правильно! Ожидания важны для внутренней аналитики, но в гипотезе это лишнее. Главное, чтобы тест был четко определен: какая метрика, какие изменения и на какой период.
Комментарий от Саши:
— Временной период — обязательная часть гипотезы. Без него ты не сможешь понять, когда остановить тест и оценить результаты.
Комментарий от Саши:
— Без ключевой метрики ты не поймешь, что именно проверяешь. Это одна из самых важных частей гипотезы!
Комментарий от Саши:
— Если ты не описал, что именно изменится, то непонятно, какой результат ожидать. Это обязательный пункт в любой гипотезе.
Дальше
Проверить
Узнать результат

В какой ситуации гипотеза «добавление бесплатной доставки повысит конверсию в покупку» будет плохо сформулированной?

Комментарий от Вани:
— Длительность теста важна, но это не единственная проблема. Если упустишь другие аспекты, тест тоже может быть некорректным. Попробуй еще раз.
Комментарий от Вани:
— Без достаточного трафика тест, конечно, не даст надежных результатов. Но это не единственная ошибка в данном случае. Что еще важно?
Комментарий от Вани:
— Правильно подмечено, что такая ситуация запутает результаты теста. Но не забудь: это не единственная ошибка, из-за которой гипотеза будет плохо сформулированной.
Комментарий от Вани:
— Верно! Если бесплатная доставка уже частично действует, мы не узнаем, что изменится. И без точной выборки или сроков результат будет ненадежным.
Дальше
Проверить
Узнать результат
Итог Шага 1:
Теперь ты знаешь, как формулировать гипотезы. Помни, гипотеза — это основа для анализа результатов. Она должна:
  • Фокусироваться на одной метрике.
  • Быть проверяемой и иметь временные рамки.
  • Быть привязана к проблеме, которую ты пытаешься решить.

Комментарий от Саши:
— Теперь готов к тестам! Без хорошей гипотезы запускать тест — как ехать в отпуск без плана.



Следующий шаг ➡️

Предыстория
Шаг 2: Планируем и оформляем эксперимент
Эксперимент по добавлению всплывающего окна со скидкой готов к запуску, и теперь все зависит от того, насколько грамотно ты спланируешь его. Ошибка на этом этапе может обесценить весь тест. Давай проверим, насколько ты готов к работе!

Саша подводит итог на встрече:

— Если начнем без чёткого плана, получим кучу бесполезных данных. А потом потратим время на споры о том, что было не так.

Стартовать
Как правильно определить размер выборки для теста?

Решение о размере выборки — одно из самых важных. Слишком маленькая выборка даст случайные результаты, слишком большая — затянет тест.
Комментарий от Саши:
— Это слишком упрощенный подход. Размер выборки зависит от многих факторов: текущей конверсии, ожидаемого эффекта и статистических порогов. Лучше воспользоваться калькулятором.
Комментарий от Саши:
— Это правильный ответ! Недостаточный объем данных = мусорные результаты. Используй калькулятор, чтобы рассчитать нужную выборку. Обычно мы учитываем порог значимости 95% и силу теста. Без этого эксперимент не имеет смысла.
Комментарий от Саши:
— Тест на всей аудитории может привести к проблемам. Например, если гипотеза ошибочна, это негативно скажется на всех пользователях. Правильный размер выборки снижает риски.
Комментарий от Саши:
— Если тестировать только на постоянных клиентах, результат будет неполным. Поведение новых пользователей может отличаться, а гипотеза должна проверяться на репрезентативной выборке.
Дальше
Проверить
Узнать результат

Какие данные нужно зафиксировать перед запуском теста?


Саша напоминает:

— Если заранее не зафиксируем все ключевые параметры, после теста начнем подгонять результаты. Давай разберемся, что важно зафиксировать!

Комментарий от Саши:
— Это правильный ответ! Не забудь указать, на какой выборке тестируем. Параметры должны быть определены до запуска. Это поможет честно интерпретировать результаты и избежать манипуляций.
Комментарий от Саши:
— Это важные параметры, но недостаточно. Без указания периода и ожидаемого результата будет сложно понять, сколько времени и ресурсов потребуется для теста и как интерпретировать данные.
Комментарий от Саши:
— Текущий трафик — полезная информация, но этого мало для планирования. Без фиксации метрики и ожидаемого результата ты не сможешь оценить успех теста.
Комментарий от Саши:
— Выручка может дать представление о бизнес-контексте, но никак не помогает определить параметры для A/B теста. Здесь важнее целевая метрика, сегментация и период.
Дальше
Проверить
Узнать результат

Как лучше распределить пользователей между группами A и B?


Тут важно избежать перекосов и случайностей, чтобы результаты теста были достоверными.

Комментарий от Вани:
— Время посещения сайта может зависеть от множества факторов, например, времени суток или дня недели. Это создаст перекосы в группах, и тест перестанет быть объективным.
Комментарий от Вани:
— Все верно! Случайное распределение — наше всё! Только так мы получим репрезентативные группы, и результаты будут объективными.
Комментарий от Вани:
— Источник трафика влияет на поведение пользователей. Например, люди из рекламы часто ведут себя иначе, чем те, кто пришёл через органический поиск. Это нарушит чистоту эксперимента.
Комментарий от Вани:
— Это вообще запрещённый приём. Текущие покупатели отличаются от остальных пользователей, поэтому группа B будет несравнимой с группой A.
Дальше
Проверить
Узнать результат

Какой минимальный срок теста считается достоверным?


Саша предупреждает:

— Здесь нужно учитывать и трафик, и поведение пользователей. Слишком короткий тест даст ложные выводы, но и затягивать нет смысла.

Комментарий от Саши:
— Три дня — это слишком мало, чтобы набрать достаточную выборку и получить статистически значимые результаты. Решения, основанные на таком тесте, могут оказаться ошибочными.
Комментарий от Саши:
— Именно так! Не важно, сколько дней — важно, чтобы выборка набралась и тест достиг значимости. Обычно для этого требуется минимум 2 недели, но главное — стабильные данные.
Комментарий от Саши:
— Прекращать тест, как только что-то показало рост, — большая ошибка. Это приведёт к искажённым выводам, ведь краткосрочные всплески не всегда означают стабильный эффект.
Комментарий от Саши:
— Месяц может быть избыточным, если тест уже достиг статистической значимости. Важно не ориентироваться на время, а следить за стабильностью метрик.
Дальше
Проверить
Узнать результат
Итог Шага 2:
Ты справился! Теперь ты знаешь, как спланировать тест так, чтобы получить достоверные результаты:

  • Используй калькулятор выборки для точного расчета объема аудитории.
  • Фиксируй параметры эксперимента до его запуска.
  • Распределяй пользователей случайно, чтобы избежать перекосов.
  • Убедись, что тест длится, пока не достигнет значимости — не время, а данные решают.

Ваня улыбается:
— Всё, можно запускать!



Следующий шаг ➡️

Предыстория
Шаг 3: Определяем метрики и KPI
Эксперимент почти готов к запуску, но теперь команда ожидает от тебя выбора ключевых метрик.

Саша предупреждает:

— Поставим неправильные метрики — эксперимент не покажет, что сработало, а что нет. Не забывай: метрики должны соответствовать цели! В этом тесте цель — увеличить количество заказов.

Стартовать
Какая метрика должна стать основной в этом эксперименте?

Фокусируемся на конечном результате — росте завершенных заказов.
Комментарий от Саши:
— Точно! CR (conversion rate) — главный показатель, который показывает, сколько пользователей завершили покупку. Это напрямую отражает цель нашего эксперимента.
Комментарий от Саши:
— Добавления в корзину — это промежуточная метрика. Она показывает интерес к товару, но не говорит о том, завершил ли пользователь покупку. А наша цель — именно конверсия в заказы.
Комментарий от Саши:
— Средний чек важен, но он не связан напрямую с количеством завершённых покупок. Даже с низкой конверсией ARPU может быть высоким, если кто-то сделал одну крупную покупку.
Комментарий от Саши:
— Это вообще не про конверсии в заказы. Посетить страницу корзины не значит сделать покупку. Мы оцениваем результативность теста через CR.
Дальше
Проверить
Узнать результат

Какие вспомогательные метрики помогут дополнить анализ?


Вспомогательные метрики дают более полную картину того, как изменения влияют на пользователей.

Комментарий от Саши:
— Эти метрики интересны, но не дают прямой связи с целями эксперимента. Время на сайте может увеличиться из-за нерешительности, а отмены заказов лучше анализировать отдельно.
Комментарий от Саши:
— Верно! Средний чек покажет, не снижается ли прибыль из-за скидки, а Retention (удержание) позволит понять, насколько изменилось поведение пользователей в будущем.
Комментарий от Саши:
— Эти показатели важны для понимания верхних этапов воронки, но они не помогают оценить влияние изменений на прибыль или лояльность.
Комментарий от Саши:
— Это скорее индикатор того, насколько изменения создали вопросы или проблемы у пользователей. Полезная информация, но не для оценки итогов эксперимента.
Дальше
Проверить
Узнать результат

Какую ошибку важно избежать при анализе метрик?


Некоторые метрики могут выглядеть полезными, но на деле вводят в заблуждение.

Комментарий от Саши:
— Retention важен для понимания долгосрочного эффекта, но не всегда имеет прямую связь с целью конкретного теста. Игнорировать его не ошибка, если это не ключевая метрика.
Комментарий от Саши:
— Иногда фокус на одной метрике оправдан, особенно если она основная. Ошибка — не учитывать вспомогательные показатели, но это не означает, что анализировать надо всё подряд.
Комментарий от Саши:
— Промежуточные метрики могут быть полезны для диагностики, но их недостаточно для понимания, достигнута ли цель эксперимента. Это скорее упущение, чем критическая ошибка.
Комментарий от Саши:
— Да, вот тут точно ошибка! Если включать нерелевантные метрики, результаты запутают. Важно работать только с показателями, связанными с целью теста.
Дальше
Проверить
Узнать результат

Какие KPI помогут принять окончательное решение?


Теперь выбери ключевые показатели эффективности (KPI), которые покажут, достигнуты ли цели эксперимента.

Комментарий от Саши:
— Если CR, например, был 3%, то рост на 5 п.п. поднимет его до 8%. А выручка должна расти, иначе скидка не принесла нужного эффекта
Комментарий от Саши:
— Это приятный бонус, но не ключевой показатель для оценки скидки. Вряд ли снижение обращений напрямую связано с целями эксперимента.
Комментарий от Саши:
— Рост трафика — метрика, связанная с маркетинговыми усилиями, а не с влиянием скидки на поведение пользователей. Тут важнее смотреть на конверсию и выручку.
Комментарий от Саши:
— Лояльность — долгосрочный показатель, который сложно измерить в рамках короткого A/B теста. Для оценки скидки это слишком общая метрика.
Дальше
Проверить
Узнать результат
Итог Шага 3:
Теперь ты знаешь, как правильно выбрать и использовать метрики:
  • Основная метрика: CR (конверсия в заказ).
  • Вспомогательные метрики: средний чек и Retention.
  • Избегай нерелевантных данных, чтобы не запутать анализ.
  • KPI: выручка и рост CR помогут решить, внедрять ли изменение.

Саша доволен:
— Отлично! Теперь можно запускать тест и переходить к анализу данных и интерпретации результатов.



Следующий шаг ➡️

Предыстория
Шаг 4: Запуск теста и интерпретация данных
Эксперимент завершён, пора взглянуть на результаты. В офисе все напряжённо ждут: что покажет A/B тест?

— Ну что, давай посмотрим на цифры! — говорит Саша, открывая дашборд.

Результаты теста:

  • Группа A (контрольная): Конверсия (CR) = 3.2%, Средний чек = 15 000 руб., Пользователей = 5 000
  • Группа B (тестовая): Конверсия (CR) = 3.8%, Средний чек = 14 500 руб., Пользователей = 5 000
  • P-value = 0.07

Теперь тебе предстоит проанализировать эти данные и понять, что делать дальше.

Стартовать
Что означает p-value = 0.07?
Комментарий от Саши:
— p-value = 0.07 выше общепринятого порога в 0.05. Это значит, что вероятность случайного результата слишком велика, чтобы считать его значимым.
Комментарий от Саши:
— Здесь p-value говорит о том, что результат недостаточно надежен. Мы не можем считать гипотезу подтвержденной, пока не достигнем значимого уровня.
Комментарий от Саши:
— Обычно для принятия решения используется порог p-value ≤ 0.05. Значение 0.07 говорит о том, что различия между контрольной и тестовой группами могли возникнуть случайно.
Комментарий от Саши:
— Продолжение теста не гарантирует улучшения p-value. Если тест уже собрал необходимую выборку, результат нужно интерпретировать как незначимый.
Дальше
Проверить
Узнать результат

Какой вывод можно сделать на основе среднего чека?

Комментарий от Саши:
— Снижение среднего чека — не всегда плохой знак. Если конверсия выросла и общая выручка увеличилась, то скидка может быть оправдана.
Комментарий от Саши:
— Нельзя игнорировать снижение среднего чека. Важно анализировать, как изменение влияет на общую выручку, а не только на конверсию.
Рассчёт и комментарий от Саши:
  • Группа A (контрольная): 5000 пользователей × 3.2% CR × 1500 руб. = 240 000 руб.
  • Группа B (тестовая): 5000 пользователей × 3.8% CR × 1450 руб. = 275 500 руб.

— В тестовой группе при снижении среднего чека выручка выросла на 35 500 руб.. Но так как p-value > 0.05, статистически значимых выводов сделать нельзя, — напоминает Саша.
Комментарий от Саши:
— Средний чек — важный показатель, который помогает понять, как изменения влияют на общий доход. Исключать его из анализа нельзя.
Дальше
Проверить
Узнать результат

Что делать, если результаты теста незначимы?

Комментарий от Саши:
— Маленькая выборка может быть причиной высокой p-value. Увеличим количество участников, чтобы повысить точность.
Комментарий от Саши:
— Если p-value высокое, результаты теста могут быть случайными. Принимать решение на основе недостоверных данных рискованно. Лучше сначала увеличить выборку и провести повторный анализ.
Комментарий от Саши:
— Если выборка недостаточна, изменять гипотезу бессмысленно. В первую очередь нужно убедиться, что данных хватает для достоверных выводов.
Комментарий от Саши:
— Неудачный тест — это не провал, а источник уроков. Отказываться от экспериментов из-за одного незначимого результата нерационально.
Дальше
Проверить
Узнать результат

Как учитывать влияние изменений на лояльность пользователей?

Комментарий от Саши:
— Опросы полезны, но они дают лишь субъективную картину. Лучше подкрепить их объективными данными, такими как частота повторных покупок или Retention.
Комментарий от Саши:
— Лояльность — это основа долгосрочного роста. Нам важно понять, вернутся ли пользователи за повторными покупками после изменений.
Комментарий от Саши:
— Исключать лояльность нельзя, так как она влияет на долгосрочные метрики, включая выручку. Нам нужно понять, как изменения сказываются на поведении пользователей.
Комментарий от Саши:
— Выручка важна, но это не единственный критерий успеха. Если пользователи не возвращаются, эффект от изменений будет краткосрочным.
Дальше
Проверить
Узнать результат
Итог Шага 4:
  • P-value показывает вероятность случайного результата. Если оно выше 0.05, нужен дополнительный анализ.
  • Комплексный подход: оцениваем конверсию и средний чек вместе, а не по отдельности.
  • Увеличение выборки поможет сделать результаты более надёжными.
  • Лояльность измеряем через Retention и NPS, чтобы понять долгосрочные эффекты.
Саша улыбается:
— Ну что, теперь у нас есть план. Двигаемся к последнему шагу: принятию решения о внедрении изменений.



Следующий шаг ➡️

Предыстория
Шаг 5: Принятие решения и рекомендации по дальнейшим действиям
Ты сидишь в переговорной с командой, и все смотрят на тебя в ожидании.

— Ну что, какой у нас план? Внедряем скидку или попробуем что-то другое? — спрашивает маркетолог Лена.

Ты внимательно смотришь на данные:
  • Конверсия (CR) в тестовой группе выросла с 3.2% до 3.8%
  • Средний чек снизился с 15 000 руб. до 14 500 руб.
  • P-value = 0.07 — результат статистически незначимый

Команде нужно понять, что делать дальше. Снижение чека выглядит тревожно, но рост конверсии дает надежду. Время принять решение!

Стартовать
Какое решение принять на основе данных теста?
Комментарий:
— Рост CR действительно положительный сигнал, но p-value > 0.05 означает, что результат мог быть случайным. Решение на основе таких данных может привести к рискам.
Комментарий:
— Средний чек действительно снизился, но важно рассматривать совокупный эффект на выручку и маржинальность. Итоговое решение должно учитывать все ключевые метрики.
Комментарий:
— Увеличение выборки могло бы повысить точность результатов, но уже сейчас видно, что скидка снижает средний чек. Лучше сфокусироваться на альтернативных стимулах.
Комментарий:
— Рост конверсии обнадеживает, но снижение среднего чека может подорвать маржинальность. Учитывая, что результат теста статистически незначим, стоит попробовать другие стимулы, такие как бесплатная доставка.
Дальше
Проверить
Узнать результат

Как улучшить будущие эксперименты?

Комментарий:
— Чем больше выборка и длительность эксперимента, тем точнее результат. Эксперименты должны быть спланированы таким образом, чтобы исключить влияние случайных факторов.
Комментарий:
— Релизы крупных фич могут существенно повлиять на поведение пользователей, затрудняя оценку результатов теста. Эксперименты лучше проводить в стабильных условиях.
Комментарий:
— Маленькая выборка увеличивает вероятность ошибок и приводит к недостоверным выводам. Эксперименты с недостаточной выборкой не дают точных данных для принятия решений.
Комментарий:
— Использование одной метрики может упростить анализ, но это приведет к потере ценной информации. Для полноты картины нужно анализировать дополнительные метрики.
Дальше
Проверить
Узнать результат

Какую роль играет сегментация пользователей при принятии решения?

Комментарий:
— Игнорирование сегментации может привести к ошибочным выводам. Общий результат может скрывать различия в реакции разных групп пользователей, что может негативно сказаться на долгосрочной стратегии.
Комментарий:
— Сегментация помогает выявить, как различные группы реагируют на изменения. Например, акция может хорошо работать для новых пользователей, но снижать лояльность у постоянных клиентов.
Комментарий:
— Углубленный анализ через сегментацию позволяет учитывать особенности аудитории. Это делает тесты более точными и дает инсайты для персонализации.
Комментарий:
— Сегментация важна, но не отменяет ключевые статистические методы анализа. Основные метрики, такие как CR и p-value, остаются базой для принятия решений.
Дальше
Проверить
Узнать результат

Какие дополнительные данные могут быть полезны для принятия решения?

Комментарий:
— Динамика во времени действительно важна, но сама по себе она не даст полной картины. Например, резкий рост CR в первые дни может быть временным эффектом. Для глубокого анализа нужны дополнительные данные.
Комментарий:
— Данные об отказах и возвратах показывают качество заказов, но не дают информации о влиянии акции на лояльность и общий пользовательский опыт. Они полезны, но не единственный источник для анализа.
Комментарий:
— NPS важен для понимания восприятия акции, но без учета количественных данных, таких как динамика CR или выручки, выводы будут неполными.
— Для принятия решения важны как количественные, так и качественные данные. Динамика во времени покажет устойчивость эффекта, а NPS поможет оценить влияние акции на лояльность.
Дальше
Проверить
Узнать результат
Итог Шага 5:
Теперь ты знаешь:
  • Как стратегически принимать решения на основе данных
  • Какие данные дополнительно учитывать для полноты картины
  • Почему сегментация важна для детального анализа
  • Как улучшать эксперименты для повышения точности и надёжности результатов



К завершению ➡️

Завершение симулятора
Поздравляем, ты успешно завершил симулятор! 🎉

Теперь ты владеешь навыками:
  • Формулирования гипотез и выбора метрик
  • Планирования и проведения A/B тестов
  • Интерпретации данных и избегания ошибок
  • Принятия стратегических решений на основе экспериментов

Бонусы для тебя:

Теперь ты готов к реальным вызовам и сможешь проводить эксперименты, которые действительно влияют на бизнес. 🚀

Made on
Tilda