Короткое описание кейса
Внедрение интеллектуальной поисковой системы с гибридным векторным поиском, NLP и автоматической обработкой запросов позволило значительно повысить точность поиска по сложному каталогу и создать основу для будущего AI-ассистента.
Заказчик (Клиент)
Крупная компания, работающая в сегменте e-commerce с широким ассортиментом специализированных товаров.
Тип клиента: средний и крупный бизнес с высокой нагрузкой на поисковые сценарии и службу поддержки.
Контекст и проблемы
Стандартный текстовый поиск перестал справляться с растущей сложностью пользовательских запросов и каталога:
- Поиск не понимал синонимы, симптомы и связанные понятия.
- Частые опечатки в названиях товаров приводили к пустым результатам.
- Отсутствовали интеллектуальные подсказки при вводе.
- Система не различала типы запросов (вещество, форма, дозировка, симптом).
- Пользователи не находили нужные товары и обращались в поддержку.
- Снижалась конверсия и росла нагрузка на операторов.
Существующее решение не масштабировалось и не учитывало специфику предметной области.
Услуга (Solution / Service)
Услуга: Разработка интеллектуальной поисковой системы с использованием технологий машинного обучения и обработки естественного языка (ML / NLP).
Решение:
Создание модульной поисковой платформы с гибридным поиском (текст + векторы), интеллектуальной обработкой пользовательских запросов и REST API для интеграции.
Как решение помогло
- Реализован гибридный поиск (BM25 + векторный HNSW) для повышения релевантности.
- Добавлен поиск по связанным понятиям (симптомы, заболевания, свойства).
- Внедрена многоуровневая система исправления опечаток.
- Реализован интеллектуальный автокомплит и подсказки при вводе.
- Создан NER-модуль для категоризации запросов.
- Внедрён fallback-механизм повторного поиска при отсутствии результатов.
- Подготовлена архитектура для последующего внедрения AI-ассистента.
Результаты (Results / Outcomes)
Количественные и качественные показатели:
- Значительное снижение количества пустых поисковых запросов.
- Повышение релевантности выдачи по сложным и неточным запросам.
- Сгенерирован расширенный семантический контент для 50000 товаров.
- Реализована обработка запросов по 10+ атрибутам товаров.
- Обеспечена стабильная работа поиска под высокой нагрузкой.
Влияние и ценность (Impact / Benefits)
- Пользователи быстрее находят нужные товары, даже при неточном вводе.
- Снижается нагрузка на службу поддержки.
- Повышается конверсия поисковых сценариев.
- Каталог становится «умным», а не просто списком товаров.
- ROI достигается за счёт роста продаж, снижения ручной поддержки и масштабируемости решения.
- Создан фундамент для дальнейшего развития AI-функций без переработки архитектуры.
Инструменты и технологии (Tools / Technologies)
Поиск и хранение данных:
- Elasticsearch 8+
- BM25, HNSW (векторный поиск)
Machine Learning и NLP:
- Alibaba-NLP / gte-multilingual-base
- Claude Haiku +GPT-mini 4o
- Named Entity Recognition (NER)
- Алгоритмы нечеткого поиска и лингвистической нормализации
Backend и API:
- Python 3.10+
- FastAPI
- REST API с полной документацией
DevOps и инфраструктура:
- Docker, Docker Compose
- Git
- Jupyter Notebook
Контактная информация / CTA (Call To Action)
Если ваш поиск не понимает пользователей, а пользователи — поиск, значит, пора это менять.