DeepScribe

Текст ваших встреч —
за 12 минут, а не за вечер.

Загрузите запись — получите готовый текст с разделением голосов и кратким содержанием. Час аудио → 12 минут обработки. В редакторе ЛК исправите спорные места разметки за 30 секунд. Telegram, MAX и веб. Хранение в РФ — ФЗ-152.

Демо 2 минуты · без регистрации
или
✓ Демо-фрагмент бесплатно — без регистрации и карты ✓ Редактор для финальной правки на всех платных тарифах ✓ Готовый DOCX с таймкодами и спикерами ✓ Исходный файл удаляется через 24 часа
4.9 средняя оценка
пользователей
351+ активных
пользователей
2 458+ часов
расшифровано
1 000+ файлов
расшифровано
Серверы в РФ · 152-ФЗ Не обучаем ИИ на файлах Авто-удаление аудио через 24 часа Чек 54-ФЗ · Тинькофф
interview_05_15.mp3 · 17 мин 23 сек ▶ Готов к запуску
[00:03] Голос 1 Добрый день! Сегодня обсуждаем запуск нового продукта на третий квартал.
[00:12] Голос 2 Хорошо. Я подготовила оценки по бюджету — пришлю в чат после встречи.
[00:34] Голос 1 Идея в том, чтобы выйти на рынок к сентябрю. Что нужно для этого?
[01:18] Голос 3 Со стороны технической команды нужно минимум 6 недель на разработку MVP.

Транскрибация аудио и видео в текст онлайн

DeepScribe — сервис автоматической расшифровки аудио- и видеозаписей в текст с разделением голосов, таймкодами, краткое содержание и экспортом в DOCX, SRT, VTT, TXT, JSON. Работает на русском и ещё нескольких языках. Серверы в РФ, соответствие ФЗ-152. Подходит для расшифровки интервью, встреч, подкастов, лекций, звонков и юридических аудиозаписей.

Аудио в текст
MP3, WAV, M4A, OGG → текст с таймкодами
Видео в текст
MP4, MOV, MKV → расшифровка и SRT
Разделение голосов
До 8 спикеров, переименование, точные границы
Субтитры SRT/VTT
Для YouTube, Rutube, видеомонтажа
Telegram-бот
Голосовые и аудио прямо в @DeepScribe_bot
API для разработчиков
REST + webhooks для CRM и аналитики
Для бизнеса и команд
Совещания, созвоны, CustDev — расшифровка и протоколы
Юридические аудиозаписи
Стенограммы для суда, дословно, с таймкодами
01

Как работает

Шесть этапов превращают любую аудиозапись в структурированный документ — от загрузки до готового файла. Всё на наших серверах в РФ.

01

Загрузка

MP3, WAV, MP4, MOV до 2 ГБ. Telegram, MAX или сайт.

02

Распознавание

Флагманская ИИ-модель Обучена под русскую разговорную речь. Дополнительный AI-проход исправляет оговорки и расставляет знаки препинания.

03

Разделение голосов

Тоже две модели Голосовые отпечатки + анализ контекста. «Голос 1», «Голос 2» или ваши имена.

04

Полировка

LLM расставляет пунктуацию и правит оговорки, сохраняя смысл.

05

Саммари + задачи

Темы, решения, action items. На тарифе Pro — структурированное.

06

Результат

TXT, DOCX, SRT, JSON, PDF. Редактор в ЛК. Скачать или REST API.

12 минут на час аудио Серверы в РФ · соответствие ФЗ-152 Исходный файл удаляется через 24 часа Без зарубежных сервисов
02

Редактируйте транскрипт прямо в браузере

Автоматика даёт хорошую базовую разметку. Оставшиеся спорные места правятся встроенным редактором за 30 секунд: переименовать всех «Голос 1» → «Иван» одним кликом, поменять голоса местами, объединить две реплики или разделить одну. Сохранили — пересобрался DOCX/PDF.

Готово

4 сегмента · 2 спикера · Длительность 00:01:00 · Правок 0

Уверенность разделения голосов: 100%
0:00 / 1:00
Правки видны в просмотрщике сразу, но в файлах для скачивания — только после нажатия.
00:00:00 — 00:00:08 Голос 1 conf: −0.07 + ×
Привет! Угадай где я — по заднему фону и звуку, а я тебе сейчас покажу знакомые места.
✓ Принять × Отклонить ⊘ Неразборчиво ✂ Разделить
00:00:09 — 00:00:10 Голос 2 conf: −0.13 + ×
Эээ… ну попробую.
✓ Принять × Отклонить ⊘ Неразборчиво ✂ Разделить
00:00:11 — 00:00:38 Голос 1 conf: −0.05 + ×
Вот твоя улочка, как ты домой ходил. В этом доме твоя квартира была. Особо ничего не поменялось за это время.
✓ Принять × Отклонить ⊘ Неразборчиво ✂ Разделить
00:00:42 — 00:00:48 Голос 2 conf: −0.09 + ×
Узнаёшь? Прямо ностальгия накатила.
✓ Принять × Отклонить ⊘ Неразборчиво ✂ Разделить
Полнофункциональный редактор — всё в одной странице

Правка текста и таймкодов

Кликнул на реплику — поменял текст или время. Сохраняется автоматически. Изменения применяются ко всем форматам (TXT, DOCX, SRT…).

Bulk-rename спикеров

Поменял «Голос 1» на «Иван» в одной реплике — одним кликом обновится во всех репликах того же голоса.

Split-speaker — разделить реплику

Сервис объединил двух людей под одним голосом? Поставьте курсор в точку разреза и нажмите «Разделить» — правая часть уйдёт другому спикеру.

Добавить / удалить реплики

Кнопки + и × справа каждого блока — вставить пропущенную фразу или удалить шум. Откат одним кликом.

Аудио-плеер с переходом

Кликнул на реплику — аудио перенеслось на её начало. Слушайте и правьте параллельно, подсветка активной реплики в реальном времени.

Accept / Reject / Неразборчиво

Помечайте реплики статусом — отклонённые исключатся из финальной выдачи. Удобно чистить запись от шума и побочных шумов.

Чат с транскриптом

Спросите AI «о чём встреча?», «кто что обещал?», «сроки» — ответит с цитатами из записи и таймкодами. Lite / Pro / Business.

Перевод на 6 языков

Транскрипт + перевод (en, es, de, fr, zh, kk). В одном DOCX-документе обе версии. Pro / Business.

Зайти в личный кабинет →

03

Скорость и качество

Реальные цифры с наших серверов. Без overpromise. Замеряли на 5 типичных записях разной длины (встречи 20–40 минут, диалоги, монологи).

~12мин
Обработка часа аудио

Обычно 12 минут на 1 час аудио. Короткие файлы — пропорционально быстрее. При высокой нагрузке возможны задержки; Business — приоритетная очередь.

30сек
Финализация в редакторе

Автоматика даёт хорошую базовую разметку. Оставшиеся спорные места правятся в редакторе личного кабинета за полминуты: переименовать спикеров, поменять голоса местами, объединить реплики, разделить одну на две.

100%в РФ
Локальная обработка

Все вычисления — на серверах внутри РФ. Никаких облаков OpenAI/Google/AWS. ФЗ-152 в порядке, данные не уходят за рубеж.

от 0,80₽/мин
Минимальная цена

На подписке Business — 0,97 ₽/мин (60 часов). На Pro — 1,10 ₽/мин, на Lite — 1,63 ₽/мин. Без подписки — разовая обработка файла от 99 ₽.

Замеры на реальных файлах — встречи, интервью, лекции. На длинных записях скорость сохраняется (обычно 12 минут на 1 час аудио). На больших нагрузках возможны задержки; Business — приоритетная очередь.

04

Чем мы отличаемся

Сравнение по тем критериям, на которые смотрят при выборе. Цены и факты на май 2026 года, можете проверить.

DeepScribe
Шопот
Mymeet
Yandex SpeechKit
Цена за минуту (подписка)
1,10 ₽
2 ₽
от $15/мес
0,65 ₽ (raw API)
Распознавание русской речи
Разделение голосов
Двойная проверка точности
✓ ансамбль + LLM-полировка ошибок
Час аудио обрабатывается за
10–15 мин
Редактор разметки спикеров
✓ переименовать · объединить · разделить · поменять местами
базовый
Оплата за один файл (без подписки)
Саммари + список задач
REST API для разработчиков
Локально в РФ (ФЗ-152)
Telegram-бот
Бот в MAX

Реальные замеры (май 2026): час аудио обрабатывается за 10–15 минут (на записях 20–40 мин — в 4–6 раз быстрее реального времени). Каждый сегмент проходит двойную проверку: распознавание ансамблем моделей + контекстная LLM-полировка ошибок (например, «суп → суд», «Около → Пулково»).

Не верьте на слово — сравнения легко проверить. Поэтому мы открыто пишем конкретные модели и цены. Что-то изменилось у конкурентов? Напишите в /support, обновим.

О сравнении и юридические замечания

Данные о сервисах «Шёпот», «Mymeet» и «Yandex SpeechKit» получены из публичных источников (официальные сайты, тарифные страницы, документация API) и актуальны на момент публикации — май 2026 г. Цены конкурентов приведены в рублях по курсу ЦБ РФ на дату сравнения. Сравнение проводится по объективным критериям (тариф, модель распознавания, наличие функций) и не преследует цели дискредитации иных сервисов. Все названия и товарные знаки принадлежат их правообладателям и используются исключительно в информационных целях по смыслу ст. 5 Федерального закона «О рекламе» (38-ФЗ). Если вы являетесь правообладателем и считаете информацию неточной — напишите на ceo@deepverify.io, мы внесём корректировку в течение 3 рабочих дней.

05

Тарифы

Прозрачное ценообразование без скрытых ограничений. Платите за минуты обработки, а не за «версию приложения». Чем больше период — тем выгоднее.

Калькулятор: сколько вы сэкономите
Двигайте ползунок · покажу тариф и выгоду
У меня
10 часов / мес
Подходящий тариф
Pro
990 ₽/мес
Ручная расшифровка
при 1 500 ₽/час
15 000 ₽
в месяц
Ваша экономия
14 010 ₽
−93%

Сравнение со средней ставкой на фрилансе по расшифровке встреч/интервью на русском (1 200 – 1 800 ₽/час, источник: Profi.ru / Kwork). DeepScribe обрабатывает 60 минут аудио примерно за 15 минут.

Lite

490 /мес
  • 5 часов обработки
  • Файлы до 4 часов
  • Форматы: TXT, DOCX, SRT
  • Полировка пунктуации
  • Краткое саммари встречи
  • Редактор транскрипта в ЛК

Business

3 490 /мес
  • 60 часов обработки
  • Приоритет в очереди
  • Форматы: TXT, DOCX, SRT, VTT, JSON, PDF
  • Расширенное саммари с деталями
  • Голосовые профили команды — DeepScribe запоминает голоса и подписывает их именами автоматически
  • Свой словарь терминов — загружайте имена сотрудников, продуктов и терминологию для точного распознавания
  • API-доступ (0,80 ₽/мин)

Что входит в каждый тариф

Сравните возможности построчно — выберите тариф под свой объём и сценарий. Все цены за месяц.

Возможность
Lite
490 ₽
Business
3 490 ₽
Минуты обработки / мес
5 ч
60 ч
Цена за минуту
1,63 ₽
0,97 ₽
Длина одного файла
4 ч
без ограничений
Форматы экспорта
TXT, DOCX, SRT
+ PDF, JSON
Разделение спикеров
Полировка пунктуации (AI)
Саммари встречи
краткое
детальное
Список задач и решений
Чат с транскриптом (Q&A)
Перевод на 6 языков
Редактор транскрипта в ЛК
Приоритет в очереди
Голосовые профили команды
Свой словарь терминов

На 3 / 6 / 12 месяцах действует скидка 10% / 15% / 25%. Овердрафт оплачивается из остатка кошелька — не блокирует работу.

Не подойдёт результат — вернём деньги в течение 7 дней. Без вопросов.
06

Как начать работу

Пять шагов от первого визита до готового транскрипта — сервис устроен так, чтобы пройти их за 2–3 минуты.

  1. 1

    Выберите канал

    DeepScribe работает в четырёх местах — выбирайте удобное:

    • Telegram-бот — самый быстрый старт. Подходит для файлов до 20 МБ.
    • Веб-кабинет — лимит до 5 ГБ, редактор, история, чат с транскриптом.
    • MAX-бот — тот же функционал в мессенджере MAX, лимит 250 МБ.
    • REST API — для разработчиков, multipart upload + polling.
  2. 2

    Попробуйте бесплатно

    Демо-фрагмент — 2-3 минуты бесплатно без регистрации. Мы выбираем участок с активной речью и показываем как сервис распознаёт вашу запись. Полный файл — разовая обработка от 99 ₽ или подписка от 490 ₽/мес.

    Поддерживаемые форматы: MP3, WAV, M4A, OGG, OPUS, FLAC, MP4, MOV, MKV, WEBM. Из видео аудио извлечём сами.

  3. 3

    Загрузите файл

    В боте — просто отправьте файл сообщением. В веб-кабинете — перетащите в зону загрузки или нажмите на неё.

    Принимаем аудио и видео. Если вы знаете число спикеров — укажите его в «Настройках записи»: диаризация будет точнее. Для специфичной лексики (юр. термины, медицина, продукты) можно подключить словарь.

  4. 4

    Дождитесь результата

    Обработка идёт в памяти GPU на наших серверах в РФ. Файл не уходит во внешние API. Среднее время — от 1 до 3 минут на каждую минуту аудио. Можете закрыть чат: когда транскрипт готов, бот или почта вам напишут.

    На всех платных тарифах генерируется ИИ-саммари: на Lite — краткое содержание, на Pro/Business — детальное (темы, решения, action items).

  5. 5

    Скачайте и работайте

    Результаты — в форматах под ваш тариф (TXT / DOCX / SRT / VTT / PDF / JSON). Редактор в личном кабинете доступен на всех платных тарифах (Lite, Pro, Business): переименовать спикеров, объединить лишних, исправить текст, послушать оригинал с подсветкой.

    После готовности транскрипта исходный аудиофайл удаляется с диска. Текстовый транскрипт остаётся в вашем кабинете до явного удаления вами.

07

Частые вопросы

Если ответа нет — напишите в бот, команда «/support».

Можно попробовать бесплатно?

Да. Загрузите файл на главной — получите демо-фрагмент 2-3 минуты с разделением спикеров, без регистрации и привязки карты. Этого достаточно чтобы оценить качество распознавания и диаризации на вашем типе записи.

Дальше выбор:

  • Разовая обработка одного файла — от 99 ₽ за весь файл (цена зависит от длительности).
  • Подписка: Lite 490 ₽/мес — 5 часов + краткое саммари, Pro 990 ₽/мес — 15 часов + детальное саммари с задачами, Business 3 490 ₽/мес — 60 часов + всё включено.
Сколько занимает обработка?

Обычно 12 минут на 1 час аудио. Короткие файлы — пропорционально быстрее. При высокой нагрузке или сложных файлах может потребоваться больше времени.

На тарифе Business — приоритетная очередь (ваш файл идёт вне общей очереди). Можно закрыть чат: бот напишет, когда транскрипт готов. Если указали email — придёт ещё и письмо.

Какие форматы файлов принимаются?

Аудио: MP3, WAV, M4A, OGG, OPUS, FLAC, AAC, WMA, AMR.
Видео: MP4, MOV, MKV, WEBM, AVI, FLV (аудио извлечём сами).
Голосовые сообщения Telegram — да, поддерживаем (OPUS под капотом).

Если ваш формат не в списке — попробуйте загрузить, обычно работает: внутри стоит ffmpeg, он понимает почти всё.

Какие языки поддерживаются?

Распознавание: основной — русский (под него настроены словари и пост-обработка). Наша ИИ-модель мультиязычная: английский, немецкий, испанский, китайский, французский, итальянский, португальский и другие распознаются автоматически — но качество на русском заметно выше.

Перевод (Pro и выше): готовый транскрипт можно перевести на английский, немецкий, испанский, французский, итальянский, китайский. Перевод делает локальная LLM — точность хорошая для деловой переписки и заметок.

Какую точность ожидать на моих записях?

Честно — зависит от качества записи. Не обещаем «95% всегда», потому что это зависит не от нас, а от микрофона, эха и количества одновременно говорящих.

Распознавание текста (слова):

  • Чистая студийная запись (петличка, тихая комната) — 93–96%
  • Запись с диктофона / в комнате — 88–94%
  • Видеозвонок (Zoom, Google Meet, Teams) — 85–92%
  • Телефонный звонок — 80–90%

Разделение голосов (диаризация):

  • Студийная запись, разные голоса (М/Ж) — 90–95%
  • Видеозвонок 2–4 человека — 85–92%
  • Телефонный звонок с близкими по тембру голосами — 70–85% (физический предел узкой полосы 8 кГц)

Для финальной правки разметки голосов есть встроенный редактор на всех платных тарифах: одним кликом переименовать «Голос 1» → «Иван», поменять голоса местами, объединить две реплики или разделить одну. Занимает ~30 секунд на час аудио.

Как определяются разные голоса (диаризация)?

Используем нейросеть для разделения голосов. Под капотом аудио делится на короткие сегменты, из каждого извлекается «отпечаток голоса», похожие отпечатки кластеризуются — это и есть «спикеры».

Точность хорошая, когда: запись приемлемого качества, голоса достаточно разные (мужчина + женщина — почти 100%), минимум одновременной речи. Возможные ошибки: один человек с разной интонацией = два «спикера», эхо может «размножить» голос. На любом платном тарифе можно объединить лишних спикеров в редакторе ЛК одним кликом.

Какое качество записи нужно?

Минимум: семплинг 8 кГц+, битрейт 16 kbps+ (для речи), соотношение сигнал/шум выше 10 дБ.

Хорошо: семплинг 16 кГц+ (мы сами ресэмплим), MP3 64 kbps+ или OPUS 24 kbps+. Записывайте близко к источнику — петличка / гарнитура. Тихая комната без эха. Чёткая дикция (но мы умеем и с акцентами, и с быстрой речью).

Что такое «краткое содержание»?

На всех платных тарифах автоматически генерируется саммари встречи через локальную LLM. На Lite — краткое содержание (3–5 предложений с ключевыми мыслями). На Pro и Business — детальное саммари: общее резюме, ключевые темы, принятые решения, action items с ответственными, открытые вопросы.

Сохраняется как summary.md рядом с транскриптом и показывается отдельным блоком в ЛК. На Business — расширенный анализ (тональность, потенциальные риски, цитаты). В бесплатном демо саммари не генерируется.

Что умеет редактор в личном кабинете?

На любом платном тарифе (Lite/Pro/Business) доступен полнофункциональный редактор:

  • Редактирование текста любого сегмента
  • Переименование спикеров («Голос 1» → «Иван»)
  • Bulk-merge — объединить лишних спикеров одним кликом
  • Воспроизведение оригинала с подсветкой текущего сегмента
  • Поиск по тексту с подсветкой
  • Чат с транскриптом — задайте вопрос «о чём договорились?» и ИИ ответит на основе содержания
  • Регенерация форматов после правок
Подписка продлится автоматически?

Да, если вы оплатили картой и не отключили авто-продление (включено по умолчанию). За 3 дня до окончания напомним письмом и в боте. В день списания спишем сумму такого же тарифа на тот же период.

Отключить — в личном кабинете → Настройки или через /support. Данные карты у нас не хранятся, только токен (через рекуррентные платежи Тинькофф).

Скидки на 3/6/12 месяцев — как работают?

При оплате любого тарифа (Lite/Pro/Business) можно выбрать период подписки:

  • 1 месяц — обычная цена
  • 3 месяца — −10%
  • 6 месяцев — −15%
  • 12 месяцев — −25%

Минуты начисляются помесячно (Pro на 12 мес = 15 часов каждый месяц, а не 180 часов сразу) — чтобы не сгорали и не было соблазна «использовать всё за раз». Расчёт скидки виден прямо в окне оплаты.

Есть ли промокоды?

Иногда выпускаем в рамках акций. Применяются в окне оплаты — есть отдельное поле «Промокод». Дают либо процентную скидку, либо бонусные минуты. Подписаться на анонсы — TG-канал @deepscribe_news.

Что делать, если файл больше 20 МБ?

Telegram-боты не могут скачивать файлы больше 20 МБ — это лимит Telegram. Варианты:

  • Откройте веб-кабинет — там лимит до 5 ГБ: deepscribe.ru/webapp/
  • Сожмите файл: MP3 128 kbps (~1 МБ/мин) или OPUS 24 kbps (~0,3 МБ/мин). Качество распознавания почти не страдает.
  • Разбейте на части по 15–20 минут.
  • MAX-бот — там лимит выше (250 МБ).
Качество распознавания плохое — что делать?

Чек-лист:

  1. Послушайте запись сами — если шумно/глухо, моделям тоже сложно. Особенно плохо: телефонные записи через плохую сеть, эхо в большой комнате, далеко поставленный микрофон.
  2. Битрейт MP3 ниже 64 kbps — качество страдает. OPUS лучше MP3 на низких битрейтах.
  3. На Pro+ работает ИИ-полировка пунктуации и опечаток + редактор для ручного исправления.
  4. Если речь сильно специфичная (юр. термины, медицина) — напишите /support, подключим словари.

Не помогло — пришлите ID задания через /support, разберём конкретный случай.

Оплатил, но минуты не зачислились

Чаще всего:

  • Задержка обработки — Тинькофф иногда уведомляет нас с задержкой до 5 минут. Подождите.
  • Не пришёл webhook — редко, но бывает. Напишите /support, приложите чек или номер транзакции — проверим вручную и начислим за час.
  • Возврат банком — иногда банк блокирует платёж после успешного списания (антифрод). Деньги вернутся на карту через 1–3 дня.

Никакая оплата у нас не «пропадает» — разберёмся.

Как подключить API?

REST API доступен на Business и API-Developer тарифах. Шаги:

  1. Купите Business (3 490 ₽/мес) или API-Developer тариф
  2. В боте: /api → «Создать ключ» → сохраните dsk_live_...
  3. Документация — deepscribe.ru/api/docs

Основные endpoints: POST /v1/jobs (загрузить файл), GET /v1/jobs/{id} (статус), GET /v1/jobs/{id}/download/{format} (скачать), GET /v1/balance. Rate limit — 60 req/min (можно увеличить — пишите /support).

Как обеспечивается конфиденциальность?

Аудио хранится только на время обработки. Когда транскрипт готов, исходный файл сразу удаляется с сервера. Само распознавание идёт в памяти GPU на наших российских серверах — файл не уходит во внешние API, не индексируется, не передаётся третьим лицам и не используется для обучения моделей. Текстовый транскрипт (TXT/DOCX/SRT...) хранится в вашем личном кабинете до явного удаления вами. Все процессы соответствуют требованиям ФЗ-152.

Можно ли использовать стенограмму в суде?

DeepScribe выдаёт информационную стенограмму — она подходит для подготовки к делу, согласования формулировок с клиентом, работы с цитатами. Для приобщения к материалам дела требуется заключение лицензированного эксперта по фоноскопической экспертизе. Такие заключения мы не делаем.

Какие способы оплаты?

Российские карты, СБП, Mir — через Тинькофф Эквайринг. Электронный чек по 54-ФЗ автоматически приходит на email. Для юр. лиц — счёт и закрывающие документы через /support.

Возможен ли возврат денег?

Да, в течение 14 дней по запросу через /support — возвращаем деньги за неиспользованные минуты согласно ст. 32 закона о защите прав потребителей.

Есть ли API для разработчиков?

Да. OpenAPI-документация, multipart upload, polling статуса, rate limit от 60 req/min. Цена для разработчиков — 0,80 ₽/мин. Создание API-ключа — через команду «/api» в Telegram-боте.

Кто стоит за DeepScribe?

За DeepScribe — команда с многолетним опытом в речевых технологиях и судебной фоноскопии. Те же инженеры разработали:

  • юрзвук.рф — сервис подготовки фоноскопических материалов для адвокатов и юристов
  • deepverify.io — forensic-grade платформа для верификации аудио и видео доказательств

Тот же ASR-движок, что используется в наших экспертных продуктах, мы переупаковали в массовый сервис DeepScribe — для подкастеров, журналистов, психологов, HR и команд, которым нужна быстрая и точная транскрипция без юридической бюрократии.

Юридическое лицо: ИП Степин Иван Геннадьевич, ИНН 772172955804, Москва. Заявка на товарный знак DeepScribe подана в Роспатент. Серверы в РФ, чеки 54-ФЗ, соответствие ФЗ-152.