Современный ASR на русском даёт 95%+ точность. Но 5% ошибок — это на час встречи 300-500 неправильно распознанных слов. Если не проверить — попадут в финальный документ и опубликуются. Разбираем 5 самых частых мест, где автоматика лажает, и как это поймать за 5 минут.
Модель распознавания не знает, как зовут вашу коллегу Анастасию Иванову. Она запишет «настасья», «и Настя», «а Стая» — что угодно близкое по звуку. Если в тексте 10 раз упоминается «Анастасия», получите 10 разных написаний.
Whisper-семейство (включая WhisperX) известно багом — на длинных паузах модель «придумывает» текст. Чаще всего повторяет последнюю фразу или вставляет шаблонную «спасибо за просмотр», «спасибо что смотрели». Это артефакты обучения на YouTube-данных.
Цифры — самое уязвимое место. «Двенадцать тридцать» может стать «12:30», «12.30», «двенадцать тридцать» — в зависимости от контекста. Даты «пятнадцатого мая» → «15.05», «15 мая» или «пятнадцатое мая». Аббревиатуры — отдельная боль.
\d+|[А-Я]{2,} в Find в Word — все числа и аббревиатуры
выделятся. На DeepScribe Pro работает Qwen polish — она частично
нормализует написание чисел.
Когда два человека говорят одновременно, диаризация ломается. Модель присваивает их перекрывающимся репликам один голос, либо «склеивает» фразы. В итоге в транскрипте видно: «Голос 1: Привет, я хотел спросить, у нас встреча в субботу назначена через тет, спасибо да, я смогу», — а на самом деле это были два человека.
Самое опасное — взять готовый DOCX и сразу опубликовать его как интервью или протокол. Даже при WER 5% — на час это 300-500 неточностей. Среди них могут оказаться смысловые искажения: «не согласен» → «согласен» (омонимы), путаница имён, неверные цифры в важных контекстах.
Автоматическая расшифровка — это не «нажал кнопку и готово», а «ускоренный черновик». Она экономит 80-90% времени по сравнению с ручной расшифровкой, но 10-20% всё равно требуют человеческого глаза.
Сравните: 5 часов ручной расшифровки vs 15 минут обработки + 30 минут редактуры = 4 часа экономии на каждом часе встречи. Это всё равно невероятный выигрыш.
Демо 2 минуты любого файла бесплатно без регистрации. Встроенный редактор с подсветкой низкой confidence — видно, где обязательно проверить.