Интеллектуальный поиск по каталогу: рост релевантности и снижение пустых запросов с помощью ML и NLP
Короткое описание кейса
Внедрение интеллектуальной поисковой системы с гибридным векторным поиском, NLP и автоматической обработкой запросов позволило значительно повысить точность поиска по сложному каталогу и создать основу для будущего AI-ассистента.
Заказчик (Клиент)
Крупная компания, работающая в сегменте e-commerce с широким ассортиментом специализированных товаров.
Тип клиента: средний и крупный бизнес с высокой нагрузкой на поисковые сценарии и службу поддержки.
Контекст и проблемы
Стандартный текстовый поиск перестал справляться с растущей сложностью пользовательских запросов и каталога:
Поиск не понимал синонимы, симптомы и связанные понятия.
Частые опечатки в названиях товаров приводили к пустым результатам.
Отсутствовали интеллектуальные подсказки при вводе.
Система не различала типы запросов (вещество, форма, дозировка, симптом).
Пользователи не находили нужные товары и обращались в поддержку.
Снижалась конверсия и росла нагрузка на операторов.
Существующее решение не масштабировалось и не учитывало специфику предметной области.
Услуга (Solution / Service)
Услуга: Разработка интеллектуальной поисковой системы с использованием технологий машинного обучения и обработки естественного языка (ML / NLP).
Решение:
Создание модульной поисковой платформы с гибридным поиском (текст + векторы), интеллектуальной обработкой пользовательских запросов и REST API для интеграции.
Как решение помогло
Реализован гибридный поиск (BM25 + векторный HNSW) для повышения релевантности.
Добавлен поиск по связанным понятиям (симптомы, заболевания, свойства).
Внедрена многоуровневая система исправления опечаток.
Реализован интеллектуальный автокомплит и подсказки при вводе.
Создан NER-модуль для категоризации запросов.
Внедрён fallback-механизм повторного поиска при отсутствии результатов.
Подготовлена архитектура для последующего внедрения AI-ассистента.
Результаты (Results / Outcomes)
Количественные и качественные показатели:
Значительное снижение количества пустых поисковых запросов.
Повышение релевантности выдачи по сложным и неточным запросам.
Сгенерирован расширенный семантический контент для 50000 товаров.
Реализована обработка запросов по 10+ атрибутам товаров.
Обеспечена стабильная работа поиска под высокой нагрузкой.
Влияние и ценность (Impact / Benefits)
Пользователи быстрее находят нужные товары, даже при неточном вводе.
Снижается нагрузка на службу поддержки.
Повышается конверсия поисковых сценариев.
Каталог становится «умным», а не просто списком товаров.
ROI достигается за счёт роста продаж, снижения ручной поддержки и масштабируемости решения.
Создан фундамент для дальнейшего развития AI-функций без переработки архитектуры.
Инструменты и технологии (Tools / Technologies)
Поиск и хранение данных:
Elasticsearch 8+
BM25, HNSW (векторный поиск)
Machine Learning и NLP:
Alibaba-NLP / gte-multilingual-base
Claude Haiku +GPT-mini 4o
Named Entity Recognition (NER)
Алгоритмы нечеткого поиска и лингвистической нормализации
Backend и API:
Python 3.10+
FastAPI
REST API с полной документацией
DevOps и инфраструктура:
Docker, Docker Compose
Git
Jupyter Notebook
Контактная информация / CTA (Call To Action)
Если ваш поиск не понимает пользователей, а пользователи — поиск, значит, пора это менять.