DeepScribe
СТАТЬЯ · 24 марта 2026 · listicle · ~7 мин чтения

5 главных ошибок при автоматической расшифровке встреч

Современный ASR на русском даёт 95%+ точность. Но 5% ошибок — это на час встречи 300-500 неправильно распознанных слов. Если не проверить — попадут в финальный документ и опубликуются. Разбираем 5 самых частых мест, где автоматика лажает, и как это поймать за 5 минут.

ОШИБКА 1

Не проверять имена собственные

Модель распознавания не знает, как зовут вашу коллегу Анастасию Иванову. Она запишет «настасья», «и Настя», «а Стая» — что угодно близкое по звуку. Если в тексте 10 раз упоминается «Анастасия», получите 10 разных написаний.

Плохо: Я обсудила это с настасьей, она согласна.
Плохо: Анастастя сказала что подготовит документы.
Правильно: Я обсудила это с Анастасией, она согласна.
Решение: в Word/Google Docs Ctrl+H (найти и заменить), пройти по всем именам собственным разом. На тарифе Business в DeepScribe можно загрузить свой словарь имён сотрудников — точность на них автоматически 95%+.
ОШИБКА 2

Доверять «галлюцинациям» на тишине

Whisper-семейство (включая WhisperX) известно багом — на длинных паузах модель «придумывает» текст. Чаще всего повторяет последнюю фразу или вставляет шаблонную «спасибо за просмотр», «спасибо что смотрели». Это артефакты обучения на YouTube-данных.

Плохо в конце встречи:
...договорились что Иван подготовит отчёт.
[Длинная пауза 30 секунд]
Спасибо за просмотр. Подписывайтесь на канал.
Решение: хорошие сервисы (DeepScribe, Faster-Whisper) используют VAD-фильтрацию — обнаруживают тишину и не дают модели «додумывать». Перед загрузкой можно обрезать в начале/конце пустые места. Финальный текст всегда сверяйте на наличие подозрительных шаблонных фраз.
ОШИБКА 3

Не проверять числа, даты и сокращения

Цифры — самое уязвимое место. «Двенадцать тридцать» может стать «12:30», «12.30», «двенадцать тридцать» — в зависимости от контекста. Даты «пятнадцатого мая» → «15.05», «15 мая» или «пятнадцатое мая». Аббревиатуры — отдельная боль.

Плохо: ФЗ сто пятьдесят два говорит что ПДн нужно...
Правильно: ФЗ-152 говорит, что ПДн нужно...
Решение: в конце редактуры пройдитесь по тексту с фильтром по цифрам и аббревиатурам. Регулярное выражение \d+|[А-Я]{2,} в Find в Word — все числа и аббревиатуры выделятся. На DeepScribe Pro работает Qwen polish — она частично нормализует написание чисел.
ОШИБКА 4

Игнорировать перебивания и одновременную речь

Когда два человека говорят одновременно, диаризация ломается. Модель присваивает их перекрывающимся репликам один голос, либо «склеивает» фразы. В итоге в транскрипте видно: «Голос 1: Привет, я хотел спросить, у нас встреча в субботу назначена через тет, спасибо да, я смогу», — а на самом деле это были два человека.

Решение: запишите интервью с правилом «по очереди — не перебиваем». Если запись уже есть с перебиваниями — на тарифе Pro в редакторе DeepScribe можно вручную разделить реплику кнопкой «+» внутри сегмента и присвоить разным спикерам.
ОШИБКА 5

Публиковать «как есть» без редактуры

Самое опасное — взять готовый DOCX и сразу опубликовать его как интервью или протокол. Даже при WER 5% — на час это 300-500 неточностей. Среди них могут оказаться смысловые искажения: «не согласен» → «согласен» (омонимы), путаница имён, неверные цифры в важных контекстах.

Реальный случай:
В оригинале клиент сказал: «Мы готовы заплатить триста тысяч».
Распознано: «Мы готовы заплатить три тысячи».
Цена ошибки — реальная сделка.
Решение: всегда выделяйте 15-30 минут на ревизию транскрипта перед публикацией. Слушайте по таймкодам места, где модель пометила низкую confidence (на тарифе Business видно в JSON-выводе). Перед публикацией важных интервью согласуйте текст с собеседником.

Главный принцип

Автоматическая расшифровка — это не «нажал кнопку и готово», а «ускоренный черновик». Она экономит 80-90% времени по сравнению с ручной расшифровкой, но 10-20% всё равно требуют человеческого глаза.

Сравните: 5 часов ручной расшифровки vs 15 минут обработки + 30 минут редактуры = 4 часа экономии на каждом часе встречи. Это всё равно невероятный выигрыш.

Попробуйте DeepScribe — 95%+ точность на чистой речи

Демо 2 минуты любого файла бесплатно без регистрации. Встроенный редактор с подсветкой низкой confidence — видно, где обязательно проверить.