Заказчик:
Есть компании, где совещания — это просто встречи. А есть компании, где совещания — это священный ритуал длиной в вечность. И вот как раз к нам пришла такая организация: крупная, распределённая, очень серьёзная и с таким количеством встреч, что любой календарь глядя на них нервно подрагивал.
И всё бы ничего, но проблемы тоже были серьёзные.
Что происходило до ИИ-эры
Немного контекста. Представьте:
➊ каждая видеоконференция — на внешней платформе;
➋ протоколы — вручную, пару часов после каждого обсуждения;
➌ найти нужный момент в записи — только перематывать полтора часа разговора;
➍ офлайн-встречи? Тоже надо расшифровывать вручную… но никто уже не успевал;
➎ аналитики и структурированных данных нет — только человеческая память и блокноты;
➏ безопасность корпоративных данных — под вопросом.
Если кратко: встречи проводятся, решения принимаются, но никто не помнит кто что решил, когда и почему. А если и помнит, то записано всё где-то в Excel третьей версии из архива секретаря.
Компания сказала: «Так жить нельзя. Нам нужна собственная система. С записью. С расшифровкой. С анализом. И желательно без магии, но можно с ИИ».
Мы сказали: «Сделаем. Но магия всё-таки понадобится».
И всё бы ничего, но проблемы тоже были серьёзные.
Что происходило до ИИ-эры
Немного контекста. Представьте:
➊ каждая видеоконференция — на внешней платформе;
➋ протоколы — вручную, пару часов после каждого обсуждения;
➌ найти нужный момент в записи — только перематывать полтора часа разговора;
➍ офлайн-встречи? Тоже надо расшифровывать вручную… но никто уже не успевал;
➎ аналитики и структурированных данных нет — только человеческая память и блокноты;
➏ безопасность корпоративных данных — под вопросом.
Если кратко: встречи проводятся, решения принимаются, но никто не помнит кто что решил, когда и почему. А если и помнит, то записано всё где-то в Excel третьей версии из архива секретаря.
Компания сказала: «Так жить нельзя. Нам нужна собственная система. С записью. С расшифровкой. С анализом. И желательно без магии, но можно с ИИ».
Мы сказали: «Сделаем. Но магия всё-таки понадобится».
Что в итоге создали
Мы разработали собственную интеллектуальную платформу MeetingAI — корпоративную систему видеоконференцсвязи со встроенным ИИ-аналитиком, который превращает любые совещания в аккуратные структурированные протоколы.
И это не просто «ещё одна видеосвязь». Это:
➊ OpenVidu под капотом — для стабильных ВКС и записи всех потоков;
➋ Whisper — чтобы голос превращался в текст;
➌ pyannote.audio — чтобы понять, кто говорил;
➍ GPT-модель — чтобы текст превращался в структурированный протокол;
➎ собственный модуль анализа тем, решений и поручений;
➏ единое хранилище записей с полнотекстовым поиском по содержанию;
➐ поддержка офлайн-записей — можно загрузить аудиофайл, и система сама всё обработает;
➑ автоматическая рассылка протоколов участникам через 5–10 минут после встречи.
По сути, это такой корпоративный помощник, который ходит на все встречи, всё записывает, всё расшифровывает, всё анализирует и никогда не спрашивает: «А мы вообще в прошлом совещании это обсуждали?».
И это не просто «ещё одна видеосвязь». Это:
➊ OpenVidu под капотом — для стабильных ВКС и записи всех потоков;
➋ Whisper — чтобы голос превращался в текст;
➌ pyannote.audio — чтобы понять, кто говорил;
➍ GPT-модель — чтобы текст превращался в структурированный протокол;
➎ собственный модуль анализа тем, решений и поручений;
➏ единое хранилище записей с полнотекстовым поиском по содержанию;
➐ поддержка офлайн-записей — можно загрузить аудиофайл, и система сама всё обработает;
➑ автоматическая рассылка протоколов участникам через 5–10 минут после встречи.
По сути, это такой корпоративный помощник, который ходит на все встречи, всё записывает, всё расшифровывает, всё анализирует и никогда не спрашивает: «А мы вообще в прошлом совещании это обсуждали?».
Как мы к этому пришли (и почему без приключений не обошлось)
➊ Сначала — архитектура
Мы погрузились в инфраструктуру клиента, выстроили архитектуру решения, учли всю безопасность и придумали, как вписать новую систему в существующую экосистему.
➋ Потом — платформа
Развернули OpenVidu в контейнерах, настроили балансировку и сделали так, чтобы конференции держали нагрузку до 50 участников одновременно.
➌ Затем — мозги
Подключили Whisper, pyannote.audio и GPT-модель.
На этом этапе выяснилось, что одна из переговорных клиента обладала странной акустикой: звук отражался так, что даже люди с трудом понимали друг друга. Whisper страдал. Мы тоже.
Пришлось делать дополнительный тюнинг и обучать модели под реальную акустику помещения.
Но мы справились: система теперь распознает речь там, где раньше даже микрофоны плакали.
➍ А потом — ещё и офлайн-встречи
Сделали загрузку файлов, поддержку разных форматов, автоматическую конвертацию, единое хранилище и поиск по всем материалам — как онлайн, так и офлайн.
➎ И наконец — авторассылка
Протоколы сами улетают участникам. Ровно через десять минут после встречи.
Ни раньше, ни позже — как швейцарские часы, но только на Python.
Мы погрузились в инфраструктуру клиента, выстроили архитектуру решения, учли всю безопасность и придумали, как вписать новую систему в существующую экосистему.
➋ Потом — платформа
Развернули OpenVidu в контейнерах, настроили балансировку и сделали так, чтобы конференции держали нагрузку до 50 участников одновременно.
➌ Затем — мозги
Подключили Whisper, pyannote.audio и GPT-модель.
На этом этапе выяснилось, что одна из переговорных клиента обладала странной акустикой: звук отражался так, что даже люди с трудом понимали друг друга. Whisper страдал. Мы тоже.
Пришлось делать дополнительный тюнинг и обучать модели под реальную акустику помещения.
Но мы справились: система теперь распознает речь там, где раньше даже микрофоны плакали.
➍ А потом — ещё и офлайн-встречи
Сделали загрузку файлов, поддержку разных форматов, автоматическую конвертацию, единое хранилище и поиск по всем материалам — как онлайн, так и офлайн.
➎ И наконец — авторассылка
Протоколы сами улетают участникам. Ровно через десять минут после встречи.
Ни раньше, ни позже — как швейцарские часы, но только на Python.
Что получил клиент
Результаты — как из красивой презентации, только настоящие:
Безопасность
✓ 100% контроль над данными: всё хранится внутри корпоративного контура.
✓ Полное соответствие 152-ФЗ и внутренним политикам.
Эффективность
✓ Время создания протокола — -85%.
✓ Обработка 100% совещаний — онлайн и офлайн.
✓ Распознавание речи — 88–92%, а в сложной акустике — 82–86%.
✓ Более 50 часов офлайн-аудио обработано в первый месяц.
Функциональность
✓ Диаризация спикеров — ~90% точности.
✓ Выделение тем, решений, поручений — 95% релевантности.
✓ Быстрая доставка протоколов всем участникам.
Операционные улучшения
✓ 100% информации фиксируется, ничего не теряется.
✓ Прозрачная история решений — теперь можно вспомнить даже то, что все забыли.
✓ Экономия на лицензиях внешних платформ.
✓ Система работает стабильно: 99.5% доступности.
Безопасность
✓ 100% контроль над данными: всё хранится внутри корпоративного контура.
✓ Полное соответствие 152-ФЗ и внутренним политикам.
Эффективность
✓ Время создания протокола — -85%.
✓ Обработка 100% совещаний — онлайн и офлайн.
✓ Распознавание речи — 88–92%, а в сложной акустике — 82–86%.
✓ Более 50 часов офлайн-аудио обработано в первый месяц.
Функциональность
✓ Диаризация спикеров — ~90% точности.
✓ Выделение тем, решений, поручений — 95% релевантности.
✓ Быстрая доставка протоколов всем участникам.
Операционные улучшения
✓ 100% информации фиксируется, ничего не теряется.
✓ Прозрачная история решений — теперь можно вспомнить даже то, что все забыли.
✓ Экономия на лицензиях внешних платформ.
✓ Система работает стабильно: 99.5% доступности.
Итог
Мы создали для клиента систему, которую уже внутри компании называют чем-то вроде «ИИ-секретарша 2.0, которая лучше, чем живая».
Она документирует всё, что происходит на встречах, анализирует обсуждения, выделяет решения, назначает поручения и делает это быстрее, чем человек успеет налить себе кофе после совещания. И главное — теперь каждая встреча действительно заканчивается результатом, а не очередной записью, которую никто не пересмотрит.
Она документирует всё, что происходит на встречах, анализирует обсуждения, выделяет решения, назначает поручения и делает это быстрее, чем человек успеет налить себе кофе после совещания. И главное — теперь каждая встреча действительно заканчивается результатом, а не очередной записью, которую никто не пересмотрит.