Обзор сервисов
№1 DeepScribe
deepscribe.ru
от 490 ₽/мес · Pro 990 ₽/мес
Сервис для людей и небольших команд. Telegram-бот, MAX, веб-кабинет, REST API.
Выдаёт готовый DOCX с разделением голосов, кратким содержанием встречи и
списком задач. Сделан той же командой, что юрзвук.рф и deepverify.io.
Плюсы
- Готовый DOCX с спикерами + саммари + список задач
- Точность 95%+ (WhisperX large-v3 + Qwen polish)
- Автоматическая диаризация (PyAnnote 3.1)
- Редактор транскрипта в личном кабинете
- Демо 2 минуты любого файла бесплатно без регистрации без карты
- Серверы в РФ, ФЗ-152
Минусы
- Только async (не стрим в реальном времени)
- Бесплатный демо ограничен ~2 минутами файла
- На очень больших объёмах (500+ часов/мес)
корпоративные тарифы дороже SpeechKit
Кому подойдёт: психологам, журналистам, юристам, подкастерам,
бизнес-командам — любым, кому нужно «расшифровать встречу/интервью» и
получить готовый документ. Lite → Pro → Business: понятная
лестница подписок, никаких токенов и SDK.
№2 Yandex SpeechKit
cloud.yandex.ru/services/speechkit
0,72 ₽/мин (pay-as-you-go)
Низкоуровневый API распознавания речи от Яндекса. Часть Yandex Cloud, требует
регистрации и IAM-токенов. Поддерживает real-time stream и async-режим.
Плюсы
- Real-time stream API (задержка ~200ms)
- Дешёво на больших объёмах
- Серверы Yandex Cloud в РФ, ФЗ-152
- Хорошая точность на коротких командах
- Стабильный uptime 99.95%
Минусы
- Сырой JSON — нужно самому делать DOCX, диаризацию,
саммари
- Diarization — отдельный модуль в Premium-тарифе
- Сложная интеграция: IAM, SDK, документация
- Точность на длинных диалогах чуть ниже WhisperX
Кому подойдёт: разработчикам, которые строят свой продукт
с голосовым интерфейсом — IVR, ассистенты, мобильные приложения.
Не для прямого использования людьми.
№3 Voicereel
voicereel.ru
от 590 ₽/мес
Российский сервис, ориентированный на подкастеров и видео-контент. Веб-приложение
с уклоном на редактирование транскрипта и генерацию субтитров.
Плюсы
- Удобный веб-редактор
- Хорошие SRT/VTT для YouTube
- Серверы в РФ
- Поддержка нескольких языков
Минусы
- Нет автоматического саммари
- Нет Telegram-бота — только веб
- Нет API на младших тарифах
- Диаризация слабее (склонна к over-segmentation)
Кому подойдёт: подкастерам и YouTube-блогерам, которым нужны
субтитры и редактирование транскрипта прямо в браузере.
№4 Notta
notta.ai
$13.99/мес ≈ 1 300 ₽/мес
Зарубежный сервис, который частично работает в РФ через VPN (или оплату
иностранной картой). Поддерживает русский язык, есть мобильное приложение.
Плюсы
- Мобильные приложения iOS/Android
- Хорошая интеграция с Zoom/Google Meet/Teams
- Real-time транскрипция во время встречи
- AI-саммари в реальном времени
Минусы
- Серверы за рубежом → нарушение ФЗ-152 для российских компаний
- Оплата иностранной картой / через посредника
- Точность на русском ниже (модель ориентирована на английский)
- Нет чеков 54-ФЗ для бухгалтерии
Кому подойдёт: русскоязычным фрилансерам, которые живут за границей
и работают с иностранными клиентами. Для российских компаний — рискованно
из-за ФЗ-152.
№5 Speechpad
speechpad.ru
бесплатно (с лимитами)
Старый веб-сервис, основанный на распознавании речи через Google Chrome.
Бесплатный, но требует браузер с микрофоном и активной речи в реальном времени.
Плюсы
- Бесплатно
- Простой UX — только текст и микрофон
- Не требует регистрации
Минусы
- Работает только с активной речью в браузере (нельзя загрузить файл)
- Точность ниже коммерческих сервисов
- Нет диаризации — всё одним текстом
- Нет API, нет экспорта в DOCX
- Зависит от Google Speech API в браузере
Кому подойдёт: студентам и людям, которые иногда диктуют короткие тексты
в браузер. Для серьёзной работы (встречи, интервью) не подходит.