Как мы приручили корпоративные совещания: история о MeetingAI, человеческом факторе и одном очень упрямом микрофоне
Есть проектные истории, которые проходят гладко, как свежий релиз в пятницу (то есть никогда). А есть проекты, которые превращаются в приключение.
Вот как мы решили приручить корпоративные совещания и создали систему, которая теперь делает протоколы быстрее, чем участники успевают выйти из Zoom… ну, ладно, из собственных корпоративных ВКС.
Глава 1. Клиент, у которого встреч было больше, чем витаминок в аптеке в сезон ОРВИ
Компания пришла к нам с простой мечтой: «Хотим систему, которая будет записывать встречи, распознавать речь, сортировать решения и выдавать протоколы автоматически. И чтобы всё было своё, безопасное. И желательно не падало».
На словах — звучит как стандартный проект. На деле — как сборка Икеи без инструкции.
У компании было: ➊ море видеоконференций, ➋океан аудиофайлов «с прошлых совещаний» (разных форматов, иногда экзотических), ➌ и полный штиль в плане автоматизации.
► Протоколы писались вручную. ► Расшифровка занимала часы. ► Поиск в записях — только методом: «промотаю ещё чуть-чуть, вдруг там». ► И, конечно, любимое всеми ИТ-слово — безопасность.
Мы собрались, вдохнули и начали строить MeetingAI: ➊ развернули OpenVidu, ➋ встроили Whisper, ➌ подключили pyannote.audio, ➍ прилепили GPT-модель для анализа, ➎ всё обернули в нормальный интерфейс, ➏ прикрутили хранилище, поиск и авторассылку.
На бумаге — идеально. В жизни — почти идеально.
Глава 3. Проблемы, которые мы *не заказывали*, но они всё равно приехали
1. Микрофон-ревун из переговорки №7 Первый тест в реальной комнате показал неожиданное: ► звук отражался так, будто совещание проходило в пещере. Не помогала ни звукопоглощающая плитка, ни очевидно страдающий конферансье. Whisper в какой-то момент будто пытался сказать: «Ребят… ну вы серьёзно?» Как решили: Сделали акустическое профилирование комнаты → обучили модели на реальном шуме → обновили фильтры → теперь даже люди удивляются, как система их понимает.
2. Фильтр сезонных простуд Пики распознавания речи упали… внезапно. ► Оказалось, что половина сотрудников внезапно заболела, голос сел, одни говорили в нос, другие кашляли, третьи еле шептали. Whisper снова попытался уйти в отпуск. Как решили: Добавили кастомную акустическую адаптацию под «голосовые состояния человека в ноябре». Теперь модель понимает даже тех, кто говорит как «Бэтмен после гриппа».
3. Человеческий фактор, aka “Кто выключил микрофон?” На одном пилотном совещании система упорно фиксировала тишину. Причина оказалась проста: ► главный докладчик вещал вдохновенно… в выключенный микрофон. Как решили: Сделали автоуведомление: «Мы ничего не слышим. Возможно, ваш микрофон хочет внимания». Работает.
4. Аудиофайлы из архива времён мамонтов Клиент сказал:«Нужно чтобы система обрабатывала и старые записи тоже». Мы спросили: «Какие?» ► Они прислали… всё. WAV, MP3, AAC, M4A, что-то подозрительное с расширением .rec и один файл, который, кажется, был записан на диктофон телефона 2008 года. Как решили: Написали конвертер, который переваривает вообще всё. Он стал нашим личным сверхспособным шредером аудиоформатов.
Глава 4. What we delivered
После всех приключений получилась система, которая: ✓ записывает и хранит встречи; ✓ расшифровывает речь с точностью 88–92%; ✓ понимает, кто говорит; ✓ вычленяет решения, темы, задачи; ✓ упаковывает всё в аккуратный протокол; ✓ рассылает участникам через 5–10 минут; ✓ работает 24/7 (в отличие от людей); ✓ не болеет, не опаздывает и не забывает включить запись.
► Доступность — 99.5%. ► Диаризация — ~90%. ► Точность тематического анализа — 95%. ► Скорость протокола — «быстрее, чем кофе успеет остыть».
Глава 5. Чем всё кончилось
У клиента теперь нет «бесконечных совещаний с неясным итогом». ✓ Каждая встреча заканчивается протоколом. ✓ Каждая мысль — фиксируется. ✓ Каждое решение — документируется. И никто больше не ищет записи методом «на глаз», потому что есть поиск по словам, темам и именам спикеров.
Мы шутим, что MeetingAI — это их новый корпоративный сотрудник. Он работает без выходных, не берёт больничных, не страдает осенним хандрой и даже не просит премию. Хотя, честно говоря, он её заслужил.