Mikhail Bezverkhii – Product Manager | Consulting

📈 Как читать графики персентилей

this text is also available in English


Вы умеете читать графики персентилей и получать из этого пользу? Если нет, то через пару минут они вам понравятся.


Сначала немножко базы: как их в принципе читать? Ниже я привел 4 графика, которые на самом деле отражают один и тот же показатель, но с разным масштабом и определением "начала".


Как читать графики персентилей

Предположим, что мы смотрим на количество лоточков клубники, которые жители Будапешта съедают за год. На самом деле мы можем так смотреть на любые данные, заголовок выдуманный. Левый верхний график отвечает на вопрос: какой процент жителей Будапешта (X) съедает не больше, чем Y лоточков клубники за год? Мы увидим, что 27% жителей города вообще не ест ни один лоточек. Дальше потребление клубники экспоненциально растет — настолько сильно, что мы понимаем, что лучше смотреть на него на нижнем левом графике: это тот же самый график, но показывающий значения только для 20% наибольших фанатов клубники.


Два графика справа по сути являются отражениями графиков сверху, просто вопрос поставлен иначе: какой процент жителей Будапешта (X) съедает не меньше, чем Y лоточков клубники за год.


Так вот, я обожаю смотреть на графики персентилей, когда работаю c A/B-тестами, ведь в отличие от любых мер среднего, они не искажают реальность. Типичное искажение: среднее арифметическое не несет никакого смысла, потому что полностью искажено верхними 5 процентами. С другой стороны, разница медиан существует, но не так велика. А вот на графике персентилей сразу видно, где именно возникает рост и куда нужно посмотреть внимательнее.


Средние и медианы против персентилей

Собственно говоря, график персентилей тем и полезен, что дает наглядное изображение сразу 100 показателей, которые по своей сути являются аналогами медианы.


Но мое любимое использование подобных графиков относится даже не к тестам, а к оценке здоровья какого-то показателя.


Посмотрите на картинки в галерее:

Здоровая кривая персентилей
Кривая с ухудшениями
Сильно рваная кривая

Графики показывают примерно одинаковое поведение, если посмотреть на какие-то ключевые значения, но они приходят к этим значениям по-разному. Самый здоровый график — на первом слайде, потому что рост между персентилями, хоть и не равномерный, но довольно стабильный. Его проще всего списать на случайность (что было бы полной правдой: каждый следующий персентиль просто прирастает на 1.01 - 1.012 по отношению к предыдущему).


График на втором слайде показывает определенное изменение: сразу по паре персентилей могут не расти. На третьем слайде это изменение еще сильнее: не растут уже цепочки из 5 персентилей.


Что это значит с продуктовой точки зрения?


Желание людей покупать что бы то ни было, очень часто выглядит именно так, как покупка лоточков с клубникой:


На самом деле у потребителей клубники тоже ведь есть проблема: кто-то хочет не 200 лоточков и не 201, а 200.5. Но пол-лоточка купить нельзя — так что человеку приходится покупать себе 200 лоточков (потому что 201-й уже не лезет в него).


Но что если наш товар — не клубника, а что-то еще? Например, машины. Здесь все еще сложнее, купить полмашины уж точно не получится! Слава богу, люди придумали измерять такой параметр, как цену машины, и получается, что один владелец Ламбы как бы покупает десять Тесл или сто-двести подержанных Москвичей. Но вот беда: удовлетворить запрос на машины с точностью до "Москвича" при покупке Ламбы не получится. Если человек хочет потратить полмиллиона евро, конечные комплектации будут стоить условные 480000, 490000, 505000. И вот 505000 уже в бюджет 500000 не вписываются — так что человек с этим бюджетом покупает вариант за 490000. Продавец недосчитался 10 тысяч евро, потому что не был достаточно гибким!


Впрочем, при продаже машин это еще нормально: товар все-таки сложный и его просто нельзя легко модифицировать. А что если вы продаете что-то цифровое и видите рваный график с третьего слайда?


Ну что же, значит — вы не добираете с каждого покупателя, который почему-то покупает опцию дешевле своего максимума.


Потерянная выручка

Еще раз, почему это так работает?


Таким образом, график персентилей — это рентген вашей выручки. Он показывает, где у клиента есть деньги, но нет подходящего варианта.


Теперь у вас есть ещё один инструмент, который может показывать больше, чем привычные средние. Надеюсь, в следующий раз, глядя на рваный график, вы вспомните про клубнику, Ламбу и недополученные 10 000 €.