Как мы переселили 45 точек в облако и перестали бегать с огнетушителем
Есть один верный признак того, что IT в компании выросло быстрее, чем планировалось: когда слово «сервер» звучит чаще, чем «продажи», а любой сбой в регионе превращается в мини-детектив с элементами хоррора.
Именно в такой момент к нам пришёл клиент с распределённой сетью из 45 точек в разных городах. Бизнес рос, точки открывались, а IT… оставалось локальным. В самом буквальном смысле.
Как всё работало «до»
У каждой точки был свой локальный сервер. Да, прям физический. Где-то под столом, где-то в кладовке, где-то рядом с шваброй (мы не шутим).
Отсюда вырастали типовые проблемы:
централизованного управления — ноль;
отчётность собиралась долго и с болью;
если «падал» сервер в регионе — точка могла простоять 2–3 дня;
мониторинга не было: о проблеме узнавали не из алерта, а от недовольного менеджера;
масштабирование выглядело как квест: «купить сервер → установить → настроить → помолиться».
В какой-то момент стало ясно: так дальше нельзя. Нужна единая система. И желательно — без серверов под столом.
Что решили сделать
Решение выглядело логично: перевести всё в облако и сделать одну централизованную IT-платформу для всех точек.
Выбрали Yandex Cloud, развернули централизованную базу 1С и организовали терминальный доступ — чтобы сотрудникам в филиалах было всё равно, где физически живёт система. Звучит просто. На практике — как обычно, не совсем.
Первое осложнение: «А у нас интернет нестабильный» Как только речь зашла о терминальном доступе, всплыл классический страх: «А если в регионе плохой интернет — всё же встанет?» Решение:
протестировали каналы связи по всем городам;
оптимизировали RDS-сессии под минимальную нагрузку;
заложили резервные сценарии подключения.
В итоге выяснилось, что локальные сервера падали чаще, чем интернет в регионах. Просто раньше это называлось «ну, сервер опять умер».
Второе осложнение: миграция без остановки бизнеса Остановить работу 45 точек «на выходные» — идея из разряда фантастики. Поэтому пошли поэтапно:
мигрировали точки волнами;
на переходный период системы работали параллельно;
данные синхронизировались, пользователи почти не заметили переезда.
Самый частый вопрос от сотрудников был не «почему не работает», а «а мы уже в облаке или ещё нет?» — лучший комплимент для IT-проекта.
Третье осложнение: мониторинг, которого раньше не было Когда инфраструктура централизуется, внезапно появляется новый запрос: «А можно теперь видеть всё и сразу?» Можно. И нужно. Мы настроили мониторинг на Zabbix и Grafana:
состояние серверов;
доступность сервисов;
загрузку ресурсов;
потенциальные проблемы ещё до того, как они станут инцидентами. Теперь IT узнаёт о проблемах раньше, чем бизнес. Это редкое и приятное чувство.
Что получилось в итоге
Через три месяца:
доступность системы — 99,95%;
критических простоев — ноль;
время простоя сократилось с дней до часа;
IT-затраты снизились на 42%;
открытие новой точки — 1 день, а не 2–3 недели.
И, что особенно важно, IT перестало быть узким местом для роста бизнеса.
Главный вывод
Централизация — это не про «модно» или «все так делают». Это про:
управляемость,
предсказуемость,
и спокойный сон IT-команды.
Когда инфраструктура перестаёт зависеть от конкретного железа в конкретном городе, бизнес начинает расти быстрее. А IT наконец-то занимается развитием, а не поиском сервера, который «просто не включился». И да — сервер под столом мы тоже считаем частью истории цифровой эволюции. Но пусть он там и останется.