Перейти к основному контенту

On-premise транскрибация на своих серверах: когда облако не подходит

On-premise транскрибация для банков, госструктур и медицины: ПО в контуре, без интернета. Как развернуть решение «Войси» — от пилота до внедрения.

On-premise транскрибация на своих серверах: когда облако не подходит

On-premise транскрибация — это развёртывание системы распознавания речи непосредственно в IT-контуре организации, без передачи данных в облако. Такое решение необходимо там, где регуляторные требования, режим тайны или внутренние политики безопасности запрещают обрабатывать конфиденциальные аудиозаписи на внешних серверах. «Войси» — резидент «Сколково», включён в реестр российского программного обеспечения Минцифры — предлагает on-premise версию, которая разворачивается в инфраструктуре компании и работает без доступа в интернет, включая air-gap окружения. Данные физически не покидают ваш периметр.

Когда облачная транскрибация небезопасна для конфиденциальных данных?

Облачные сервисы удобны: достаточно прислать файл — и через несколько минут вы получаете текст. Но для ряда организаций этот сценарий неприемлем. Как только данные покидают периметр компании, возникает регуляторный или репутационный риск — вне зависимости от надёжности провайдера.

Ситуации, при которых облако закрыто:

  • Персональные данные (152-ФЗ). Голосовые записи с биометрией или персональными данными субъектов требуют чёткого понимания того, где именно хранятся и обрабатываются данные. При облачной обработке оператор ПД обязан заключать договоры поручения обработки — это юридическая нагрузка и аудиторский риск.
  • Банковская тайна. Переговоры с клиентами, кредитные комитеты, записи звонков в колл-центрах — всё это охраняемая информация. Банки и МФО работают в жёстком регуляторном поле Банка России и обязаны контролировать движение данных.
  • Государственная и служебная тайна. Для органов государственной власти, силовых структур и организаций, работающих с государственными секретами, использование иностранной или публичной облачной инфраструктуры исключено.
  • Медицинская тайна. Записи консультаций, анамнез, диагнозы — всё охраняется законом. Медицинские организации несут прямую ответственность за утечку сведений о пациентах.
  • Требования к отечественному ПО. Для государственных структур и компаний с государственным участием приоритет при закупках отдаётся ПО из реестра российского программного обеспечения — это обязательное или ключевое условие тендера.

Если хотя бы один из этих пунктов относится к вашей организации, облачная транскрибация потребует отдельной правовой экспертизы — с привлечением юридической службы и согласованием с регулятором. On-premise снимает большую часть этих вопросов на уровне архитектуры: данные физически не выходят за периметр, договор поручения обработки ПД не нужен, прохождение аудита ИБ упрощается.

Что такое on-premise транскрибация и как она работает?

On-premise транскрибация — программное обеспечение для распознавания речи, установленное на серверах самой организации или в её частном облаке. Весь цикл обработки замкнут внутри инфраструктуры: аудиозаписи загружаются, распознаются и возвращаются как текст без обращения к внешним ресурсам.

Технически процесс выглядит так:

  1. Аудиофайл или поток с записью звонка поступает в систему через API или интеграцию с телефонией.
  2. ИИ-модели, развёрнутые на серверах компании, обрабатывают запись: определяют язык, применяют акустические фильтры, расшифровывают речь в текст.
  3. Результат — структурированный транскрипт с правильной пунктуацией, разбивкой по абзацам и, при необходимости, разметкой спикеров — возвращается в систему-источник или сохраняется в корпоративном хранилище.
  4. Всё это происходит без обращения к внешним серверам.

Ключевое отличие от облачного решения — ИИ-модели физически находятся на мощностях организации. Это требует начальных вложений в инфраструктуру, но даёт полный контроль над данными.

Нужна оценка соответствия вашим требованиям безопасности?

Команда «Войси» проведёт первичную консультацию: разберём регуляторные ограничения, оценим архитектуру под ваш контур и ответим на вопросы ИБ-службы. Без обязательств.

Обсудить требования безопасности →

Резидент «Сколково» • Реестр российского ПО • Данные не покидают ваш контур

Кому нужна on-premise транскрибация?

Запрос на развёртывание транскрибации в контуре возникает в нескольких отраслях, где безопасность данных — не опция, а требование.

Банки и финансовые организации

Колл-центры крупных банков ежедневно фиксируют тысячи звонков. Транскрибация этих записей помогает контролировать качество обслуживания, разбирать претензии и обучать операторов — но только если данные остаются внутри банка. On-premise решение даёт такую возможность при полном соответствии требованиям Банка России.

Государственные структуры

Аппараты министерств, региональные органы власти, государственные корпорации — все работают с информацией ограниченного доступа. Для них on-premise — единственный приемлемый сценарий. Дополнительный аргумент: «Войси» включён в реестр отечественного программного обеспечения, что упрощает закупочные процедуры.

Медицинские организации

Клиники, страховые медицинские компании, телемедицинские сервисы — везде, где голосовая запись содержит сведения о здоровье пациента, требуется строгий контроль. Транскрибация консультаций и перевод голосовых протоколов в текст для электронных медицинских карт (ЭМК) — всё это реализуемо в закрытом контуре.

Юридические и консалтинговые компании

Адвокатская тайна — серьёзный правовой институт. Записи переговоров с клиентом, материалы дел, стратегические консультации не должны обрабатываться ресурсами, доступ к которым компания не контролирует.

Оборонные предприятия и ОПК

Предприятия оборонно-промышленного комплекса работают с информацией, для которой использование публичных облачных сервисов полностью исключено. On-premise с поддержкой изолированных сетей — единственный реализуемый сценарий.

Как устроено on-premise решение «Войси»?

«Войси» — российский ИИ-сервис для транскрибации аудио и видео в текст (реестр Минцифры, резидент «Сколково»). On-premise версия разработана для корпоративного рынка с учётом 152-ФЗ, регуляторики Банка России и требований импортозамещения. Разворачивается в инфраструктуре заказчика, работает в изолированных сетях и air-gap окружениях.

Собственные ИИ-модели

В основе решения — ансамбль ИИ-моделей «Войси». Часть разработана командой с нуля, часть — open-source модели, лицензированные для коммерческого использования. Все модели оптимизированы под русский язык: не пропускают участки речи, корректно расставляют пунктуацию и разбивают текст на абзацы по смыслу, а не механически.

Точность распознавания — до 98% на русскоязычных записях, включая телефонные переговоры с шумом, разными акцентами и нестабильным качеством связи. Встроенный механизм самопроверки: 10+ нейросетей работают параллельно и сверяют результаты друг с другом. On-premise версия использует те же модели, что и облачная: качество идентично, разница только в месте развёртывания.

Работа без интернета

On-premise версия «Войси» рассчитана на изолированные сети и air-gap окружения. После развёртывания система не требует внешних соединений: все ИИ-модели установлены локально, обработка полностью происходит на мощностях заказчика. Исходящий трафик — ноль. Телеметрия и обратные вызовы на серверы «Войси» отсутствуют. Это проверяется на уровне сетевого периметра стандартными инструментами мониторинга.

Архитектура и интеграции

Система возвращает транскрипты через структурированный API: с правильной пунктуацией, разбивкой по предложениям и абзацам, опционально — с разметкой спикеров (диаризацией). Разработчикам не нужно дополнительно обрабатывать сырой текст — результат сразу готов к загрузке в CRM, системы документооборота или аналитические инструменты.

Варианты интеграции:

  • Прямая интеграция с телефонией через API
  • Пакетная обработка архивов записей
  • Подключение к системам речевой аналитики
  • Интеграция с CRM-системами (amoCRM, Bitrix24 и другие)

Серверы в России

Облачная версия «Войси» работает на российских серверах — данные хранятся и обрабатываются на территории РФ. On-premise версия идёт дальше: вся инфраструктура остаётся на стороне заказчика.

Облако или on-premise: как выбрать для своей ситуации?

Параметр Облачная транскрибация On-premise транскрибация
Безопасность данных Данные передаются на внешние серверы; требуется договор поручения обработки ПД Данные не покидают инфраструктуру компании; полный контроль
Соответствие регуляторике Требует юридической экспертизы; могут быть ограничения для госсектора и банков Упрощает соответствие 152-ФЗ, требованиям Банка России, режиму гостайны
Стоимость запуска Низкая: оплата за минуты или подписка Выше: серверы, лицензия, внедрение; рассчитывается индивидуально
Стоимость владения Растёт линейно с объёмом; при больших объёмах — значимые суммы При больших объёмах — фиксированные операционные расходы
Скорость запуска Минуты или часы (Telegram-бот или API) Недели: согласование, пилот, развёртывание, тестирование
Масштабирование Мгновенное: облако масштабируется автоматически Зависит от мощности серверов; требует планирования
Обслуживание Провайдер обновляет модели и инфраструктуру Обновления и поддержка — по договору с «Войси»
Работа без интернета Нет: требуется подключение Да: изолированные сети и air-gap окружения
Реестр российского ПО «Войси» — в реестре «Войси» — в реестре; применимо для госзакупок

Если объём транскрибации небольшой, данные не конфиденциальны, а скорость старта важнее контроля — облачная версия «Войси» на российских серверах даст результат уже сегодня. Если организация работает с данными под 152-ФЗ, требованиями Банка России или режимом гостайны — on-premise становится наиболее надёжным выбором с точки зрения комплаенса. При объёмах от нескольких тысяч часов в месяц фиксированные расходы на инфраструктуру, как правило, оказываются ниже переменных облачных.

Посмотреть тарифы облачной версии — на странице цен. Для on-premise стоимость рассчитывается индивидуально: запросите коммерческое предложение →

Как развернуть транскрибацию на своих серверах?

Развёртывание on-premise транскрибации — это проект с фиксированными этапами, а не покупка подписки. Типовой цикл внедрения занимает от нескольких недель до двух месяцев в зависимости от сложности инфраструктуры заказчика.

  1. Запрос демо и первичная консультация. Опишите задачу: объём записей, типы данных, текущую инфраструктуру, регуляторные ограничения. Команда «Войси» оценит соответствие и предложит архитектуру решения.
  2. Пилотный проект. На ограниченном объёме проверяется качество распознавания под ваши условия: тип записей, акустика, специфическая терминология. Пилот позволяет убедиться в качестве распознавания (до 98%) до полного развёртывания.
  3. Согласование технических требований. Обсуждаются серверные мощности, сетевая архитектура, способы интеграции с существующими системами, требования к SLA.
  4. Развёртывание. Установка ИИ-моделей и программного обеспечения в инфраструктуре заказчика. Команда «Войси» сопровождает весь процесс.
  5. Интеграция и тестирование. Подключение к телефонии, CRM или другим системам-источникам. Нагрузочное тестирование, проверка точности на рабочих записях.
  6. Поддержка и обновления. После запуска — сервисный договор: обновление моделей, техническая поддержка, мониторинг качества.

Стоимость рассчитывается индивидуально: она зависит от объёма записей, серверных требований и уровня необходимой интеграции. Пилотный проект позволяет оценить качество распознавания на ваших реальных записях до принятия решения о полном развёртывании.

Если вас интересует, как транскрибация работает в связке с CRM — читайте о подключении транскрибации звонков к amoCRM.

Частые вопросы об on-premise транскрибации

В: Работает ли on-premise версия «Войси» без доступа в интернет?
О: Да. Все ИИ-модели и зависимости устанавливаются локально — после развёртывания система не инициирует исходящих соединений. Телеметрия отсутствует, что подтверждается стандартными средствами сетевого мониторинга. Решение совместимо с air-gap окружениями.

В: Безопасна ли облачная транскрибация для конфиденциальных данных?
О: Это зависит от типа данных и регуляторных требований организации. Облачная версия «Войси» работает на российских серверах, данные не используются для обучения моделей и не передаются третьим лицам — это закрывает задачи большинства компаний. Однако для банков, госструктур, медицинских организаций и предприятий ОПК, где данные физически не должны покидать периметр по закону или внутренним политикам, необходим on-premise.

В: Какова точность распознавания в on-premise версии?
О: До 98% — как и в облачной версии. Те же модели, тот же механизм самопроверки из 10+ нейросетей. Точность на конкретных записях проверяется на этапе пилотного проекта.

В: «Войси» включён в реестр российского ПО?
О: Да. «Войси» — резидент «Сколково» и зарегистрирован в реестре отечественного программного обеспечения Минцифры. Это упрощает закупочные процедуры для государственных и окологосударственных структур.

В: Сколько стоит on-premise внедрение?
О: Цена зависит от трёх факторов: объём записей в месяц, требуемые серверные мощности и глубина интеграции с вашими системами. Точку безубыточности по сравнению с облаком обычно проходят при объёмах от нескольких тысяч часов в месяц. Начните с запроса демо — команда подготовит расчёт под вашу конфигурацию. Оставить заявку →

В: Как обновляются ИИ-модели в on-premise версии?
О: Обновления поставляются по сервисному договору и устанавливаются на серверы заказчика. Периодичность и процедура согласовываются при заключении договора.

В: Поддерживает ли on-premise версия диаризацию (разметку спикеров)?
О: Да. Диаризация — разделение транскрипта по говорящим — доступна в on-premise версии. Это важно для анализа звонков колл-центров, протоколов совещаний и переговоров.

В: Можно ли интегрировать on-premise транскрибацию с нашей CRM или телефонией?
О: Да. On-premise версия предоставляет API для интеграции с телефонными системами, CRM и другими корпоративными приложениями. Конкретные интеграции согласовываются при внедрении.

Ключевые выводы

  • On-premise транскрибация необходима организациям, которым регуляторика, режим тайны или внутренние политики ИБ запрещают передавать аудиоданные на внешние серверы: банкам и МФО (требования Банка России), госструктурам (152-ФЗ, гостайна), медицинским организациям (медицинская тайна), юридическим компаниям (адвокатская тайна) и предприятиям ОПК.
  • «Войси» предлагает on-premise версию, которая разворачивается в контуре организации и работает без доступа в интернет — включая air-gap окружения.
  • В основе — собственные ИИ-модели с точностью до 98%, оптимизированные под русский язык. Механизм самопроверки из 10+ нейросетей обеспечивает качество на телефонных переговорах и записях с шумом.
  • «Войси» — резидент «Сколково», включён в реестр российского программного обеспечения. Это упрощает закупочные процедуры для государственных структур.
  • On-premise выгоднее облака при больших объёмах: когда обрабатываются тысячи часов записей в месяц, фиксированные расходы на инфраструктуру оказываются ниже переменных облачных.
  • Внедрение начинается с запроса демо, включает пилотный проект и завершается развёртыванием с сервисной поддержкой.

Готовы обсудить внедрение? Опишите задачу, инфраструктуру и регуляторные ограничения — подготовим архитектуру решения и коммерческое предложение. Качество распознавания можно оценить на ваших записях ещё до заключения контракта.
Запросить коммерческое предложение →

Попробуйте «Войси» бесплатно

Просто отправьте аудио или видео в Telegram-бот — без регистрации, без карты, без подписки. 45 минут транскрибации в подарок для старта.