Вы продали старый диван на Авито и внезапно заметили всплеск просмотров других ваших объявлений — от велосипеда до коллекции книг. Это не магия, а сложные алгоритмы машинного обучения, которые Авито скрывает под капотом своей платформы. Разберемся, как работают эти системы и почему продажа одной вещи «бустит» остальные.
⚙️ Фундамент: Рекомендательные Технологии Авито
Авито — не просто «доска объявлений». Это крупнейший в мире классифайд с 60 млн активных пользователей в месяц и 30 млрд кликов в день . Почти 30% просмотров объявлений и 25% контактов (звонков/сообщений) генерируются именно рекомендательными системами . Их архитектура включает три ключевых слоя:
- Генерация кандидатов
Система использует 5 параллельных моделей (онлайн и оффлайн), чтобы предложить тысячи потенциально релевантных объявлений. Среди них:
- Item2Vec — нейросеть, преобразующая текст заголовка, параметры товара и геоданные в 128-мерные векторы. Похожие товары (например, iPhone разных моделей) группируются в «кластеры» даже при разных описаниях .
- Кросс-категорийные рекомендации — алгоритм, который предлагает товары из несвязанных разделов (например, после просмотра авто — услуги грузчиков), чтобы расширить пользовательские интересы .
- Ранжирование
Отобранные кандидаты сортируются по вероятности контакта (нажатия «Показать телефон»). Модель учитывает:
- Историю действий (просмотры, избранное);
- Контекст (локация, время суток);
- Популярность товара (число контактов за час) .
- Блендинг
Финалный шаг — смешивание выдачи. Алгоритм предотвращает «эффект пузыря» (когда лента заполняется только авто или одеждой), добавляя товары из разных категорий. Вероятность показа раздела зависит от активности пользователя в нем .
🔍 Почему это уникально?
В отличие от Netflix или Amazon, Авито сталкивается с проблемой короткого жизненного цикла товаров. Например, 80% объявлений о смартфонах продаются за 3 дня. Классические алгоритмы коллаборативной фильтрации не успевают их ранжировать, поэтому команда разработала гибридные модели, сочетающие онлайн-анализ поведения и оффлайн-кластеризацию товаров .
🧠 Нейросети в Действии: Как Item2Vec Понимает Запросы
Представьте объявление «Миниатюрная wifi камера». Старая система не связала бы его с «SQ11» (модель камеры), так как заголовки не совпадают. Item2Vec решает эту проблему:
- Архитектура: LSTM-сеть анализирует заголовки, эмбеддинги параметров (бренд, цвет) и геоданные.
- Обучение: 540 млн пар «похожих» товаров, где «похожесть» определяется последовательными контактами пользователя в течение 8 часов .
- Фишка: Векторы товаров нормируются так, чтобы «дешевые» айфоны имели большую «длину» вектора и чаще попадали в рекомендации к дорогим моделям — это повышает конверсию .
Пример из практики:
Пользователь ищет вакансии «Грузчик с ежедневной оплатой». Item2Vec связывает это с кластером «подработка» и предлагает «Продавец-консультант» в том же городе, даже если заголовки не совпадают.
🚀 Эффект «Буста»: Почему Продажа Товара Оживляет Другие Объявления
Ваше наблюдение подтверждается внутренней механикой Авито. Вот как это работает:
- Обновление пользовательского профиля в реальном времени
Продажа товара — сигнал для онлайн-моделей, что профиль пользователя изменился. Система интерпретирует это как:
- «Продавец активен → вероятно, другие его товары тоже актуальны»;
- «Пользователь доволен сделкой → повысим вес его объявлений в рекомендациях» .
- Высвобождение «слотов» в ленте
Проданный товар исключается из рекомендаций. Алгоритм динамически заполняет освободившееся место товарами из того же кластера (например, если проданы кроссовки Nike — система предложит другие кроссовки пользователя) . - Кросс-категорийный импульс
После успешной сделки система снижает «штраф» за разнородность в блендинге. Это позволяет показывать товары из «непопулярных» для пользователя разделов (например, после продажи дивана — кухонную утварь), увеличивая их охват .
💡 Эксперимент Авито:
В A/B-тестах добавление кросс-категорийных рекомендаций увеличило конверсию на 1.7 п.п., хотя изначально снижало точность предсказаний (offline-метрики). Пользователи совершали больше сделок благодаря разнообразию ленты .
🔮 Будущее: Генеративный ИИ и LLM
С 2023 года Авито активно использует большие языковые модели (LLM) для усиления рекомендаций:
- Генерация описаний: Модель на базе Mistral 7B, дообученная на 1.1 ТБ данных, создает SEO-оптимизированные тексты. В тестах это дало +60% положительных отзывов от продавцов .
- Мультимодальность: Алгоритм анализирует текст + фото — например, определяет бренд кроссовок по изображению, даже если оно не подписано .
- Персонализация через чаты: LLM суммаризирует диалоги покупателей и продавцов, чтобы предлагать релевантные товары в push-уведомлениях .
💎 Заключение: Алгоритмы как «Невидимые Продавцы»
Рост просмотров после продажи — результат сложной цепи событий: обновление профиля → переранжирование товаров → снижение фильтра «однообразия». Авито создал экосистему, где рекомендации адаптируются к поведению в реальном времени, а генеративный ИИ превращает сырые данные в персонализированный опыт.
Ключевой вывод:
Успешная сделка — сигнал алгоритмам, что вы надежный продавец. Система «вознаграждает» вас повышенным доверием к остальным товарам. Это не хаос, а продуманная механика, где каждый клик ведет к новым возможностям.
P.S. Интересный факт: В 2017 году команда Авито вошла в топ-10 мирового конкурса по рекомендательным системам, обойдя команды Amazon и Netflix .
Добавить комментарий