Что именно представляет собой A/B эксперимент и почему оно используется
Что именно представляет собой A/B эксперимент и почему оно используется
A/B эксперимент представляет собой подход сопоставления двух или нескольких вариантов раздела, интерфейса, сообщения, CTA-элемента, анкеты, рассылки, маркетингового сообщения а также другого веб блока. Главная цель проявляется в том том, дабы выяснить, какая версия эффективнее функционирует в реальном использовании. Без опоры на догадок а также оценочных оценок применяется тест на настоящей посетителей, где контрольная группа получает формат A, а другая — формат B.
Такой подход позволяет формировать действия с опорой на результатах данных, но без опоры на индивидуальных вкусов а также единичных замечаний. В обзорных источниках, включая 1вин, нередко подчеркивается, что сплит эксперимент особенно ценно в тех случаях, при которых точечные корректировки способны воздействовать на реакции пользователей: переходы, регистрации, передачу заявок, глубину просмотра, возвращаемость, покупки, оформления подписок или прочие целевые результаты. Эксперимент позволяет понять, на самом деле ли изменение усиливает 1win результат.
По какому принципу работает A/B проверка
Принцип сплит эксперимента относительно прост. Вначале выбирается элемент, какой нужно проверить. Объектом проверки способен оказаться headline, визуальный тон CTA-элемента, порядок элементов, формулировка сообщения, построение поля ввода, картинка, цена, вариант предложения а также позиция целевого шага. Затем создаются как минимум два решения: первоначальный и измененный. Затем подготовкой трафик распределяется между ними на основе до запуска установленным условиям.
Контрольная часть пользователей сохраняет возможность получать исходную страницу, тогда как вторая открывает обновленную. Платформа собирает данные о реакциях каждой части затем сопоставляет показатели. В случае если вариант B демонстрирует более высокий показатель с учетом нужном количестве данных, такой вариант можно внедрять. Если прироста не наблюдается либо обновленная вариация показывает себя хуже, правка отклоняется. Как раз в данной логике а также заключается прикладная ценность проверки: он позволяет проверять предположения до окончательного 1вин внедрения.
Для чего используется A/B эксперимент
A/B эксперимент нужно ради уменьшения неопределенности. В веб платформах даже небольшая деталь способна влиять на оценку экрана. Конкретный headline может быть яснее иного, короткая заявка способна заполняться регулярнее расширенной, а намного более видимая кнопка действия имеет шанс усилить объем нажатий. Без проверки такие решения обычно выглядят предположениями.
Подход дает возможность оптимизировать сервис поэтапно. Без необходимости полной переделки всего сайта или сервиса получается оценивать конкретные блоки и записывать реальный эффект. Такой подход уменьшает вероятность слабых решений, сберегает ресурсы а также помогает собирать знания о поведении пользователей. Через накоплением тестов специалисты 1 win формирует не совокупность мнений, а систему валидированных решений.
Какого типа блоки получается сравнивать
Сравнивать можно почти любой блок, который воздействует по части реакции пользователя. Как правило всего тестируют заголовки, разделы, призывы на клику, тексты кнопок, анкеты создания профиля, расположение секций, изображения, карточки позиций, очередность этапов, инструменты отбора, навигацию, промоблоки, сообщения, рассылки плюс рекламные креативы. Существенно, для того чтобы выбранный блок был связан с конкретной точной целью.
Если ориентир состоит в необходимости увеличении заполненных форм, разумно тестировать заявку, сообщение рядом с нее, количество строк плюс видимость CTA. Когда важно повысить объем сессии, стоит проверять переходы, модули предложений, внутренние переходы а также построение раздела. Чем точнее соотношение 1win среди корректировкой плюс задачей, тем самым информативнее итог проверки.
Предположение в качестве база эксперимента
Всякий корректный A/B эксперимент запускается от проверяемой идеи. Проверяемая идея показывает, какого типа изменение предлагается, по какой причине оно способно сказаться в отношении эффект плюс какой метрика обязан измениться. Например, получается сформулировать, если упрощение заявки регистрации сократит число отказов, потому ведь пользователю нужно будет меньше усилий для завершения процесса.
Качественная гипотеза не может оставаться очень размытой. Формулировка типа «сделать интерфейс лучше» не помогает помогает зафиксировать показатель. Гораздо более полезный вариант: «при условии что поменять объемный текст кнопки с помощью краткий а также понятный, число переходов повысится, так как что шаг станет понятнее». Подобная гипотеза непосредственно 1вин указывает предмет проверки, причину и метрику.
Контрольная а также тестовая аудитории
На уровне A/B эксперименте базовая часть просматривает первоначальный вариант, и экспериментальная — новый. Это разделение необходимо ради корректного анализа. Если без контроля заменить страницу затем оценить результаты до и после, результат может исказиться по причине сезонных факторов, рекламной нагрузки, перестройки источников посещений, информационного фона, технических сбоев или других окружающих причин.
Параллельный показ нескольких версий сокращает влияние непредвиденных условий. Обе группы оказываются на уровне близкой обстановке: единый а также тот же период, одинаковые же каналы пользователей, близкие девайсы и общий окружение. Поэтому расхождение внутри метриках с 1 win значительной вероятностью соотносится как раз с конкретным правкой, а не с внешними внешними обстоятельствами.
Какие метрики применяются при А/Б проверках
Критерий — представляет собой число, на основе которого проверяется эффект эксперимента. Подбор показателя строится на основе назначения проверки. Для страницы с заявкой важны передачи обращений, ради торговой площадки — переносы в покупку а также покупки, для медиа — длина изучения а также длительность сессии, для аппа — создания аккаунтов, запуски, возвращаемость плюс следующие 1win действия.
Необходимо разграничивать основную плюс дополнительные критерии. Ключевая отражает, зачем чего запускается эксперимент. Дополнительные помогают выявить побочные последствия. К примеру, обновление кнопки имеет шанс повысить нажатия, при этом снизить ценность следующих действий. Следовательно важно анализировать не лишь в сторону первый шаг, но еще на последующее развитие: выполнение формы, возвращения, уходы, сбои плюс итоговую ценность результата.
Статистическая существенность
Математическая достоверность отражает, в какой степени возможно, что зафиксированная отличие между решениями не является считается статистическим шумом. Если первый вариант немного превосходит другой по итогам пары десятков посещений, такой результат пока не означает выигрыш. При ограниченном количестве сведений показатель способен быстро измениться, после того как 1вин группа будет больше.
С целью надежного заключения нужно нужное объем событий. Если меньше планируемая отличие между вариантами, тем больше данных необходимо собрать. Когда корректировка обязано улучшить результат только на пару процентных пунктов, проверке потребуется повышенный объем срока плюс пользователей. Расчетная существенность позволяет избегать принимать быстрые действия с опорой на основе случайных колебаний.
Масштаб наблюдений и продолжительность эксперимента
Размер аудитории воздействует на точность результата. Когда эксперимент видит очень ограниченный объем посетителей, выводы имеют шанс стать ненадежными. Например, несколько дополнительных переходов в одной группе могут выглядеть как рост, однако в условиях значительном масштабе окажутся простой случайностью. Следовательно до начала важно понимать, какой объем пользователей 1 win или действий нужно для подтверждения гипотезы.
Длительность эксперимента также получает важность. Очень быстрый эксперимент способен не успеть отражать расхождения между обычными и нерабочими днями, дневной и вечерней реакцией, несколькими каналами трафика. Как правило проверка должен захватывать завершенный период активности посетителей. Вместе с этом условии чрезмерно долгий период проверки тоже неоптимален, в случае если внешние условия могут ощутимо поменяться.
Зачем не стоит менять тест по ходу период проведения
Одна из частых ошибок — вносить изменения внутрь проверку после запуска. Когда по ходу процессе проверки поменять формулировку, группу, дизайн, условия показа а также цель, показатели станут неоднородными. После этого станет сложно понять, какое изменение именно сказалось в отношении эффект. Эксперимент потеряет чистоту, а выводы станут ненадежными 1win.
До начала необходимо определить проверяемую идею, версии, критерии, распределение выборки плюс критерии окончания. Вслед за начала лучше не стоит вмешиваться при отсутствии серьезной причины. Если выявлена неточность внутри настройке или технический сбой, лучше остановить проверку, устранить ошибку а также начать новый проверку, чем стараться анализировать смешанные наблюдения.
Одновременное тестирование многих правок
В отдельных случаях возникает идея оценить за один раз несколько изменений: обновленный заголовок, иную CTA, укороченную форму плюс измененный расположение блоков. Подобный вариант имеет шанс показать итоговый эффект, при этом не сможет объяснит, какой точно элемент сказался на метрику. Когда обновленная вариация выиграла, останется неочевидно, какая правка сработало эффективнее прочего.
Ради корректной сравнения обычно изменяют отдельный существенный объект на 1вин одну проверку. Если требуется проверить несколько комбинаций, применяется мультивариантное эксперимент. Такой метод сложнее, нуждается значительного числа пользователей а также внимательной оценки. Ради основной части целей А/Б проверка на основе конкретной ясной гипотезой показывает намного более корректный плюс полезный эффект.
Сценарии А/Б тестирования в интерфейсе
Внутри интерфейсах сплит проверка часто используется ради оптимизации понятности сценариев. Например, можно сравнить несколько форматы заявки: длинную с количеством элементов ввода а также краткую с минимальным сокращенным числом сведений. Когда короткая заявка повышает количество оконченных созданий аккаунтов без риска снижения качества обращений, такую форму допустимо оценивать гораздо более удачной.
Следующий случай — проверка текста кнопки. Нейтральная надпись имеет шанс быть менее понятной, чем прямое название шага. Дополнительно сравнивают место кнопок, очередность смысловых секций, оформление 1 win подсказок, использование шкалы выполнения, формат отображения предупреждений плюс количество действий в сценарии. Каждый подобный элемент воздействует на то, в какой степени легко завершить заданное событие.
A/B эксперимент на уровне материалах
На уровне содержании тестирование дает возможность определить, какие именно headline-блоки, анонсы, построения плюс типы эффективнее привлекают вовлечение. Можно сравнивать разные вступления, размер материала, последовательность доводов, наличие маркированных блоков, дизайн элементов, представление выгод или формат раскрытия сложной темы. Вместе с этом существенно измерять не исключительно лишь клики, однако еще дальнейшее действие.
Headline имеет шанс усилить число кликов, но когда контент не будет соответствует интересам, повысится доля уходов. Поэтому контентные эксперименты должны принимать во внимание глубину контакта: длительность изучения, глубину страницы, перемещения в пределах ресурса, возвращения а также совершение целевых действий. Хороший итог — это не только исключительно привлечение интереса, но совпадение ожидания а также содержания.
А/Б эксперимент на уровне почтовых рассылках
Внутри email-кампаниях обычно тестируют темы сообщений, подпись автора, первые предложения, период отправки, объем письма, позицию элементов действия и тексты условий. Одна часть получателей получает контрольную вариацию email, часть — тестовую. Затем этим анализируются просмотры, клики, отписки, жалобы плюс дальнейшие действия на сайте.
Важно не нужно ограничиваться метрикой open rate. Subject-строка рассылки имеет шанс быть яркой а также получать внимание, при этом в случае если она не совпадает контенту, клики плюс уверенность способны ослабнуть. Следовательно качественный email-тест измеряет всю цепочку: открытие, переход, поведение вслед за нажатия а также реакцию аудитории на рассылку.
