blog

Как мы приручили корпоративные совещания: история о MeetingAI, человеческом факторе и одном очень упрямом микрофоне

Есть проектные истории, которые проходят гладко, как свежий релиз в пятницу (то есть никогда).
А есть проекты, которые превращаются в приключение.

Вот как мы решили приручить корпоративные совещания и создали систему, которая теперь делает протоколы быстрее, чем участники успевают выйти из Zoom… ну, ладно, из собственных корпоративных ВКС.

Глава 1. Клиент, у которого встреч было больше, чем витаминок в аптеке в сезон ОРВИ

Компания пришла к нам с простой мечтой:
«Хотим систему, которая будет записывать встречи, распознавать речь, сортировать решения и выдавать протоколы автоматически. И чтобы всё было своё, безопасное. И желательно не падало».

На словах — звучит как стандартный проект.
На деле — как сборка Икеи без инструкции.

У компании было:
➊ море видеоконференций,
➋океан аудиофайлов «с прошлых совещаний» (разных форматов, иногда экзотических),
➌ и полный штиль в плане автоматизации.

Протоколы писались вручную.
Расшифровка занимала часы.
Поиск в записях — только методом: «промотаю ещё чуть-чуть, вдруг там».
► И, конечно, любимое всеми ИТ-слово — безопасность.

Всё должно быть внутри периметра. Никаких внешних сервисов.
ИИ — давайте, но только домашний, заводской, с паспортом.

Глава 2. Мы строим систему, а она строит характер

Мы собрались, вдохнули и начали строить MeetingAI:
➊ развернули OpenVidu,
➋ встроили Whisper,
➌ подключили pyannote.audio,
➍ прилепили GPT-модель для анализа,
➎ всё обернули в нормальный интерфейс,
➏ прикрутили хранилище, поиск и авторассылку.

На бумаге — идеально.
В жизни — почти идеально.

Глава 3. Проблемы, которые мы *не заказывали*, но они всё равно приехали

1. Микрофон-ревун из переговорки №7
Первый тест в реальной комнате показал неожиданное:
► звук отражался так, будто совещание проходило в пещере.
Не помогала ни звукопоглощающая плитка, ни очевидно страдающий конферансье.
Whisper в какой-то момент будто пытался сказать:
«Ребят… ну вы серьёзно?»
Как решили:
Сделали акустическое профилирование комнаты → обучили модели на реальном шуме → обновили фильтры → теперь даже люди удивляются, как система их понимает.

2. Фильтр сезонных простуд
Пики распознавания речи упали… внезапно.
► Оказалось, что половина сотрудников внезапно заболела, голос сел, одни говорили в нос, другие кашляли, третьи еле шептали.
Whisper снова попытался уйти в отпуск.
Как решили:
Добавили кастомную акустическую адаптацию под «голосовые состояния человека в ноябре».
Теперь модель понимает даже тех, кто говорит как «Бэтмен после гриппа».

3. Человеческий фактор, aka “Кто выключил микрофон?”
На одном пилотном совещании система упорно фиксировала тишину.
Причина оказалась проста:
главный докладчик вещал вдохновенно… в выключенный микрофон.
Как решили:
Сделали автоуведомление:
«Мы ничего не слышим. Возможно, ваш микрофон хочет внимания».
Работает.

4. Аудиофайлы из архива времён мамонтов
Клиент сказал:«Нужно чтобы система обрабатывала и старые записи тоже».
Мы спросили: «Какие?»
Они прислали… всё.
WAV, MP3, AAC, M4A, что-то подозрительное с расширением .rec и один файл, который, кажется, был записан на диктофон телефона 2008 года.
Как решили:
Написали конвертер, который переваривает вообще всё.
Он стал нашим личным сверхспособным шредером аудиоформатов.

Глава 4. What we delivered

После всех приключений получилась система, которая:
записывает и хранит встречи;
расшифровывает речь с точностью 88–92%;
понимает, кто говорит;
вычленяет решения, темы, задачи;
упаковывает всё в аккуратный протокол;
рассылает участникам через 5–10 минут;
работает 24/7 (в отличие от людей);
не болеет, не опаздывает и не забывает включить запись.

► Доступность — 99.5%.
► Диаризация — ~90%.
► Точность тематического анализа — 95%.
► Скорость протокола — «быстрее, чем кофе успеет остыть».

Глава 5. Чем всё кончилось

У клиента теперь нет «бесконечных совещаний с неясным итогом».
Каждая встреча заканчивается протоколом.
Каждая мысль — фиксируется.
Каждое решение — документируется.
И никто больше не ищет записи методом «на глаз», потому что есть поиск по словам, темам и именам спикеров.

Мы шутим, что MeetingAI — это их новый корпоративный сотрудник. Он работает без выходных, не берёт больничных, не страдает осенним хандрой и даже не просит премию. Хотя, честно говоря, он её заслужил.
Подробнее с нашими кейсами можно ознакомиться тут

У Вас есть вопрос?

AI / ИИ