Кейс создания геораспределенной отказоустойчивой архитектуры для 800+ терминалов. Обеспечили 100% доступность, 0 простоев, автоматическое переключение между ЦОД и стабильную работу Redis.

Короткое описание кейса

Создание геораспределённой IT-инфраструктуры с балансировкой между двумя дата-центрами позволило обеспечить бесперебойную работу критически важного сервиса и полностью исключить простои при сбоях.

Заказчик (Клиент)

Компания, предоставляющая цифровой сервис удалённой проверки и обработки данных с распределённой сетью терминалов.

Тип клиента: крупный бизнес с высокими требованиями к отказоустойчивости, безопасности и непрерывности процессов.

Контекст и проблемы

Изначальная архитектура не выдерживала требований к надёжности:

Все терминалы (около 800 устройств) зависели от одного сервера приложений.
Любой сбой или обслуживание приводили к полной остановке сервиса.
Нарушались ключевые бизнес-процессы и возникали финансовые потери.
Требовалась работа в двух независимых дата-центрах с разными провайдерами.
Высокие требования к безопасности соединений и обработке данных.
Кластер Redis работал нестабильно при частичных сбоях.

Услуга

Услуга: Проектирование и внедрение отказоустойчивой IT-инфраструктуры с геораспределением и балансировкой нагрузки.

Как это помогло на практике:

Реализована архитектура с двумя независимыми дата-центрами и автоматическим переключением трафика между ними (GSLB).
Внедрена балансировка нагрузки через HAProxy на уровне приложений.
Настроены отказоустойчивые VPN-каналы для защищённого взаимодействия.
Переработана схема работы с Redis: подключение через балансировщик вместо прямого обращения.
Оптимизирована работа системы под высокую нагрузку и большое количество одновременных соединений.
Внедрены механизмы health-check и автоматического failover.

В результате система перестала зависеть от одного сервера, одного канала или одного дата-центра.

Результаты

Количественные и качественные показатели:

100% отказоустойчивость на уровне приложений — система продолжает работать даже при падении одного ЦОД.
0 секунд простоя для пользователей при переключении между площадками.
Обслуживание 800+ терминалов без перебоев.
Полностью устранены ошибки работы Redis при частичных сбоях.
Существенно повышена стабильность сетевых соединений между площадками.
Реализована стабильная работа системы под высокой нагрузкой.

Влияние и ценность

Критический сервис стал непрерывным — бизнес больше не зависит от сбоев инфраструктуры.
Исключены простои, влияющие на операционные процессы и выручку.
Повысилось доверие пользователей к системе.
Снижены операционные риски и нагрузка на IT-команду.
Архитектура стала масштабируемой — можно добавлять новые узлы без переработки системы.
ROI достигается за счёт:
отсутствия простоев,
снижения потерь,
повышения стабильности работы сервиса.

Инструменты и технологии

Инфраструктура и балансировка:

HAProxy
GSLB (DNS-балансировка между ЦОД)

Серверная часть:

Linux-серверы приложений

Базы данных и кэширование:

Redis Cluster + Redis Sentinel

Сетевые решения и безопасность:

VPN (OpenVPN, ГОСТ и стандартное шифрование)
Firewall, маршрутизация, защищённые каналы связи

Мониторинг и логирование:

Prometheus
Grafana
ELK Stack

DevOps и автоматизация:

Ansible
JMeter (нагрузочное тестирование)

Контактная информация

Если ваш сервис не должен «падать вообще» — значит, пора строить архитектуру, которая это гарантирует.

Команда JUST IT проектирует отказоустойчивые системы под реальные нагрузки и бизнес-критичные процессы.

Свяжитесь с нами, чтобы:

устранить точки отказа,
повысить стабильность,
и перестать зависеть от «единственного сервера, который нельзя трогать».

Отказоустойчивая архитектура для распределённого сервиса: 100% доступность платформы с 800 терминалами