Текст ваших встреч —
за 12 минут, а не за вечер.
Загрузите запись — получите готовый текст с разделением голосов и кратким содержанием. Час аудио → 12 минут обработки. В редакторе ЛК исправите спорные места разметки за 30 секунд. Telegram, MAX и веб. Хранение в РФ — ФЗ-152.
Загружая файл, вы соглашаетесь с офертой и политикой ПДн. Файл удаляется через 24 часа.
пользователей
пользователей
расшифровано
расшифровано
Краткое содержание
Встреча посвящена запуску нового продукта в третьем квартале. Команда обсуждала бюджет, сроки и распределение задач. Главный итог — целевая дата запуска 1 сентября.
Ключевые темы
- Согласование бюджета на Q3
- Сроки разработки MVP — 6 недель
- Маркетинговый план и каналы привлечения
- Распределение зон ответственности
Что нужно сделать
- Голос 2: прислать оценки по бюджету в чат (сегодня)
- Голос 3: подготовить план разработки MVP (до 20.05)
- Голос 1: согласовать дату запуска с маркетингом (на следующей встрече)
- Голос 2: запросить смету от подрядчика (до конца недели)
Транскрибация аудио и видео в текст онлайн
DeepScribe — сервис автоматической расшифровки аудио- и видеозаписей в текст с разделением голосов, таймкодами, краткое содержание и экспортом в DOCX, SRT, VTT, TXT, JSON. Работает на русском и ещё нескольких языках. Серверы в РФ, соответствие ФЗ-152. Подходит для расшифровки интервью, встреч, подкастов, лекций, звонков и юридических аудиозаписей.
Для кого мы — выберите свой сценарий:
Как работает
Шесть этапов превращают любую аудиозапись в структурированный документ — от загрузки до готового файла. Всё на наших серверах в РФ.
Загрузка
MP3, WAV, MP4, MOV до 2 ГБ. Telegram, MAX или сайт.
Распознавание
Флагманская ИИ-модель Обучена под русскую разговорную речь. Дополнительный AI-проход исправляет оговорки и расставляет знаки препинания.
Разделение голосов
Тоже две модели Голосовые отпечатки + анализ контекста. «Голос 1», «Голос 2» или ваши имена.
Полировка
LLM расставляет пунктуацию и правит оговорки, сохраняя смысл.
Саммари + задачи
Темы, решения, action items. На тарифе Pro — структурированное.
Результат
TXT, DOCX, SRT, JSON, PDF. Редактор в ЛК. Скачать или REST API.
Редактируйте транскрипт прямо в браузере
Автоматика даёт хорошую базовую разметку. Оставшиеся спорные места правятся встроенным редактором за 30 секунд: переименовать всех «Голос 1» → «Иван» одним кликом, поменять голоса местами, объединить две реплики или разделить одну. Сохранили — пересобрался DOCX/PDF.
Готово
Правка текста и таймкодов
Кликнул на реплику — поменял текст или время. Сохраняется автоматически. Изменения применяются ко всем форматам (TXT, DOCX, SRT…).
Bulk-rename спикеров
Поменял «Голос 1» на «Иван» в одной реплике — одним кликом обновится во всех репликах того же голоса.
Split-speaker — разделить реплику
Сервис объединил двух людей под одним голосом? Поставьте курсор в точку разреза и нажмите «Разделить» — правая часть уйдёт другому спикеру.
Добавить / удалить реплики
Кнопки + и × справа каждого блока — вставить пропущенную фразу или удалить шум. Откат одним кликом.
Аудио-плеер с переходом
Кликнул на реплику — аудио перенеслось на её начало. Слушайте и правьте параллельно, подсветка активной реплики в реальном времени.
Accept / Reject / Неразборчиво
Помечайте реплики статусом — отклонённые исключатся из финальной выдачи. Удобно чистить запись от шума и побочных шумов.
Чат с транскриптом
Спросите AI «о чём встреча?», «кто что обещал?», «сроки» — ответит с цитатами из записи и таймкодами. Lite / Pro / Business.
Перевод на 6 языков
Транскрипт + перевод (en, es, de, fr, zh, kk). В одном DOCX-документе обе версии. Pro / Business.
Скорость и качество
Реальные цифры с наших серверов. Без overpromise. Замеряли на 5 типичных записях разной длины (встречи 20–40 минут, диалоги, монологи).
Обычно 12 минут на 1 час аудио. Короткие файлы — пропорционально быстрее. При высокой нагрузке возможны задержки; Business — приоритетная очередь.
Автоматика даёт хорошую базовую разметку. Оставшиеся спорные места правятся в редакторе личного кабинета за полминуты: переименовать спикеров, поменять голоса местами, объединить реплики, разделить одну на две.
Все вычисления — на серверах внутри РФ. Никаких облаков OpenAI/Google/AWS. ФЗ-152 в порядке, данные не уходят за рубеж.
На подписке Business — 0,97 ₽/мин (60 часов). На Pro — 1,10 ₽/мин, на Lite — 1,63 ₽/мин. Без подписки — разовая обработка файла от 99 ₽.
Замеры на реальных файлах — встречи, интервью, лекции. На длинных записях скорость сохраняется (обычно 12 минут на 1 час аудио). На больших нагрузках возможны задержки; Business — приоритетная очередь.
Чем мы отличаемся
Сравнение по тем критериям, на которые смотрят при выборе. Цены и факты на май 2026 года, можете проверить.
Реальные замеры (май 2026): час аудио обрабатывается за 10–15 минут (на записях 20–40 мин — в 4–6 раз быстрее реального времени). Каждый сегмент проходит двойную проверку: распознавание ансамблем моделей + контекстная LLM-полировка ошибок (например, «суп → суд», «Около → Пулково»).
Не верьте на слово — сравнения легко проверить. Поэтому мы открыто пишем конкретные модели и цены. Что-то изменилось у конкурентов? Напишите в /support, обновим.
О сравнении и юридические замечания
Данные о сервисах «Шёпот», «Mymeet» и «Yandex SpeechKit» получены из публичных источников (официальные сайты, тарифные страницы, документация API) и актуальны на момент публикации — май 2026 г. Цены конкурентов приведены в рублях по курсу ЦБ РФ на дату сравнения. Сравнение проводится по объективным критериям (тариф, модель распознавания, наличие функций) и не преследует цели дискредитации иных сервисов. Все названия и товарные знаки принадлежат их правообладателям и используются исключительно в информационных целях по смыслу ст. 5 Федерального закона «О рекламе» (38-ФЗ). Если вы являетесь правообладателем и считаете информацию неточной — напишите на ceo@deepverify.io, мы внесём корректировку в течение 3 рабочих дней.
Тарифы
Прозрачное ценообразование без скрытых ограничений. Платите за минуты обработки, а не за «версию приложения». Чем больше период — тем выгоднее.
при 1 500 ₽/час
Сравнение со средней ставкой на фрилансе по расшифровке встреч/интервью на русском (1 200 – 1 800 ₽/час, источник: Profi.ru / Kwork). DeepScribe обрабатывает 60 минут аудио примерно за 15 минут.
Lite
- 5 часов обработки
- Файлы до 4 часов
- Форматы: TXT, DOCX, SRT
- Полировка пунктуации
- Краткое саммари встречи
- Редактор транскрипта в ЛК
Business
- 60 часов обработки
- Приоритет в очереди
- Форматы: TXT, DOCX, SRT, VTT, JSON, PDF
- Расширенное саммари с деталями
- Голосовые профили команды — DeepScribe запоминает голоса и подписывает их именами автоматически
- Свой словарь терминов — загружайте имена сотрудников, продуктов и терминологию для точного распознавания
- API-доступ (0,80 ₽/мин)
Что входит в каждый тариф
Сравните возможности построчно — выберите тариф под свой объём и сценарий. Все цены за месяц.
490 ₽
990 ₽
3 490 ₽
На 3 / 6 / 12 месяцах действует скидка 10% / 15% / 25%. Овердрафт оплачивается из остатка кошелька — не блокирует работу.
Как начать работу
Пять шагов от первого визита до готового транскрипта — сервис устроен так, чтобы пройти их за 2–3 минуты.
-
1
Выберите канал
DeepScribe работает в четырёх местах — выбирайте удобное:
- Telegram-бот — самый быстрый старт. Подходит для файлов до 20 МБ.
- Веб-кабинет — лимит до 5 ГБ, редактор, история, чат с транскриптом.
- MAX-бот — тот же функционал в мессенджере MAX, лимит 250 МБ.
- REST API — для разработчиков, multipart upload + polling.
-
2
Попробуйте бесплатно
Демо-фрагмент — 2-3 минуты бесплатно без регистрации. Мы выбираем участок с активной речью и показываем как сервис распознаёт вашу запись. Полный файл — разовая обработка от 99 ₽ или подписка от 490 ₽/мес.
Поддерживаемые форматы: MP3, WAV, M4A, OGG, OPUS, FLAC, MP4, MOV, MKV, WEBM. Из видео аудио извлечём сами.
-
3
Загрузите файл
В боте — просто отправьте файл сообщением. В веб-кабинете — перетащите в зону загрузки или нажмите на неё.
Принимаем аудио и видео. Если вы знаете число спикеров — укажите его в «Настройках записи»: диаризация будет точнее. Для специфичной лексики (юр. термины, медицина, продукты) можно подключить словарь.
-
4
Дождитесь результата
Обработка идёт в памяти GPU на наших серверах в РФ. Файл не уходит во внешние API. Среднее время — от 1 до 3 минут на каждую минуту аудио. Можете закрыть чат: когда транскрипт готов, бот или почта вам напишут.
На всех платных тарифах генерируется ИИ-саммари: на Lite — краткое содержание, на Pro/Business — детальное (темы, решения, action items).
-
5
Скачайте и работайте
Результаты — в форматах под ваш тариф (TXT / DOCX / SRT / VTT / PDF / JSON). Редактор в личном кабинете доступен на всех платных тарифах (Lite, Pro, Business): переименовать спикеров, объединить лишних, исправить текст, послушать оригинал с подсветкой.
После готовности транскрипта исходный аудиофайл удаляется с диска. Текстовый транскрипт остаётся в вашем кабинете до явного удаления вами.
Частые вопросы
Если ответа нет — напишите в бот, команда «/support».
Можно попробовать бесплатно?
Да. Загрузите файл на главной — получите демо-фрагмент 2-3 минуты с разделением спикеров, без регистрации и привязки карты. Этого достаточно чтобы оценить качество распознавания и диаризации на вашем типе записи.
Дальше выбор:
- Разовая обработка одного файла — от 99 ₽ за весь файл (цена зависит от длительности).
- Подписка: Lite 490 ₽/мес — 5 часов + краткое саммари, Pro 990 ₽/мес — 15 часов + детальное саммари с задачами, Business 3 490 ₽/мес — 60 часов + всё включено.
Сколько занимает обработка?
Обычно 12 минут на 1 час аудио. Короткие файлы — пропорционально быстрее. При высокой нагрузке или сложных файлах может потребоваться больше времени.
На тарифе Business — приоритетная очередь (ваш файл идёт вне общей очереди). Можно закрыть чат: бот напишет, когда транскрипт готов. Если указали email — придёт ещё и письмо.
Какие форматы файлов принимаются?
Аудио: MP3, WAV, M4A, OGG, OPUS, FLAC, AAC, WMA, AMR.
Видео: MP4, MOV, MKV, WEBM, AVI, FLV (аудио извлечём сами).
Голосовые сообщения Telegram — да, поддерживаем (OPUS под капотом).
Если ваш формат не в списке — попробуйте загрузить, обычно работает: внутри стоит ffmpeg, он понимает почти всё.
Какие языки поддерживаются?
Распознавание: основной — русский (под него настроены словари и пост-обработка). Наша ИИ-модель мультиязычная: английский, немецкий, испанский, китайский, французский, итальянский, португальский и другие распознаются автоматически — но качество на русском заметно выше.
Перевод (Pro и выше): готовый транскрипт можно перевести на английский, немецкий, испанский, французский, итальянский, китайский. Перевод делает локальная LLM — точность хорошая для деловой переписки и заметок.
Какую точность ожидать на моих записях?
Честно — зависит от качества записи. Не обещаем «95% всегда», потому что это зависит не от нас, а от микрофона, эха и количества одновременно говорящих.
Распознавание текста (слова):
- Чистая студийная запись (петличка, тихая комната) — 93–96%
- Запись с диктофона / в комнате — 88–94%
- Видеозвонок (Zoom, Google Meet, Teams) — 85–92%
- Телефонный звонок — 80–90%
Разделение голосов (диаризация):
- Студийная запись, разные голоса (М/Ж) — 90–95%
- Видеозвонок 2–4 человека — 85–92%
- Телефонный звонок с близкими по тембру голосами — 70–85% (физический предел узкой полосы 8 кГц)
Для финальной правки разметки голосов есть встроенный редактор на всех платных тарифах: одним кликом переименовать «Голос 1» → «Иван», поменять голоса местами, объединить две реплики или разделить одну. Занимает ~30 секунд на час аудио.
Как определяются разные голоса (диаризация)?
Используем нейросеть для разделения голосов. Под капотом аудио делится на короткие сегменты, из каждого извлекается «отпечаток голоса», похожие отпечатки кластеризуются — это и есть «спикеры».
Точность хорошая, когда: запись приемлемого качества, голоса достаточно разные (мужчина + женщина — почти 100%), минимум одновременной речи. Возможные ошибки: один человек с разной интонацией = два «спикера», эхо может «размножить» голос. На любом платном тарифе можно объединить лишних спикеров в редакторе ЛК одним кликом.
Какое качество записи нужно?
Минимум: семплинг 8 кГц+, битрейт 16 kbps+ (для речи), соотношение сигнал/шум выше 10 дБ.
Хорошо: семплинг 16 кГц+ (мы сами ресэмплим), MP3 64 kbps+ или OPUS 24 kbps+. Записывайте близко к источнику — петличка / гарнитура. Тихая комната без эха. Чёткая дикция (но мы умеем и с акцентами, и с быстрой речью).
Что такое «краткое содержание»?
На всех платных тарифах автоматически генерируется саммари встречи через локальную LLM. На Lite — краткое содержание (3–5 предложений с ключевыми мыслями). На Pro и Business — детальное саммари: общее резюме, ключевые темы, принятые решения, action items с ответственными, открытые вопросы.
Сохраняется как summary.md рядом с транскриптом и показывается отдельным блоком в ЛК. На Business — расширенный анализ (тональность, потенциальные риски, цитаты). В бесплатном демо саммари не генерируется.
Что умеет редактор в личном кабинете?
На любом платном тарифе (Lite/Pro/Business) доступен полнофункциональный редактор:
- Редактирование текста любого сегмента
- Переименование спикеров («Голос 1» → «Иван»)
- Bulk-merge — объединить лишних спикеров одним кликом
- Воспроизведение оригинала с подсветкой текущего сегмента
- Поиск по тексту с подсветкой
- Чат с транскриптом — задайте вопрос «о чём договорились?» и ИИ ответит на основе содержания
- Регенерация форматов после правок
Подписка продлится автоматически?
Да, если вы оплатили картой и не отключили авто-продление (включено по умолчанию). За 3 дня до окончания напомним письмом и в боте. В день списания спишем сумму такого же тарифа на тот же период.
Отключить — в личном кабинете → Настройки или через /support. Данные карты у нас не хранятся, только токен (через рекуррентные платежи Тинькофф).
Скидки на 3/6/12 месяцев — как работают?
При оплате любого тарифа (Lite/Pro/Business) можно выбрать период подписки:
- 1 месяц — обычная цена
- 3 месяца — −10%
- 6 месяцев — −15%
- 12 месяцев — −25%
Минуты начисляются помесячно (Pro на 12 мес = 15 часов каждый месяц, а не 180 часов сразу) — чтобы не сгорали и не было соблазна «использовать всё за раз». Расчёт скидки виден прямо в окне оплаты.
Есть ли промокоды?
Иногда выпускаем в рамках акций. Применяются в окне оплаты — есть отдельное поле «Промокод». Дают либо процентную скидку, либо бонусные минуты. Подписаться на анонсы — TG-канал @deepscribe_news.
Что делать, если файл больше 20 МБ?
Telegram-боты не могут скачивать файлы больше 20 МБ — это лимит Telegram. Варианты:
- Откройте веб-кабинет — там лимит до 5 ГБ: deepscribe.ru/webapp/
- Сожмите файл: MP3 128 kbps (~1 МБ/мин) или OPUS 24 kbps (~0,3 МБ/мин). Качество распознавания почти не страдает.
- Разбейте на части по 15–20 минут.
- MAX-бот — там лимит выше (250 МБ).
Качество распознавания плохое — что делать?
Чек-лист:
- Послушайте запись сами — если шумно/глухо, моделям тоже сложно. Особенно плохо: телефонные записи через плохую сеть, эхо в большой комнате, далеко поставленный микрофон.
- Битрейт MP3 ниже 64 kbps — качество страдает. OPUS лучше MP3 на низких битрейтах.
- На Pro+ работает ИИ-полировка пунктуации и опечаток + редактор для ручного исправления.
- Если речь сильно специфичная (юр. термины, медицина) — напишите /support, подключим словари.
Не помогло — пришлите ID задания через /support, разберём конкретный случай.
Оплатил, но минуты не зачислились
Чаще всего:
- Задержка обработки — Тинькофф иногда уведомляет нас с задержкой до 5 минут. Подождите.
- Не пришёл webhook — редко, но бывает. Напишите /support, приложите чек или номер транзакции — проверим вручную и начислим за час.
- Возврат банком — иногда банк блокирует платёж после успешного списания (антифрод). Деньги вернутся на карту через 1–3 дня.
Никакая оплата у нас не «пропадает» — разберёмся.
Как подключить API?
REST API доступен на Business и API-Developer тарифах. Шаги:
- Купите Business (3 490 ₽/мес) или API-Developer тариф
- В боте:
/api→ «Создать ключ» → сохранитеdsk_live_... - Документация — deepscribe.ru/api/docs
Основные endpoints: POST /v1/jobs (загрузить файл), GET /v1/jobs/{id} (статус), GET /v1/jobs/{id}/download/{format} (скачать), GET /v1/balance. Rate limit — 60 req/min (можно увеличить — пишите /support).
Как обеспечивается конфиденциальность?
Аудио хранится только на время обработки. Когда транскрипт готов, исходный файл сразу удаляется с сервера. Само распознавание идёт в памяти GPU на наших российских серверах — файл не уходит во внешние API, не индексируется, не передаётся третьим лицам и не используется для обучения моделей. Текстовый транскрипт (TXT/DOCX/SRT...) хранится в вашем личном кабинете до явного удаления вами. Все процессы соответствуют требованиям ФЗ-152.
Можно ли использовать стенограмму в суде?
DeepScribe выдаёт информационную стенограмму — она подходит для подготовки к делу, согласования формулировок с клиентом, работы с цитатами. Для приобщения к материалам дела требуется заключение лицензированного эксперта по фоноскопической экспертизе. Такие заключения мы не делаем.
Какие способы оплаты?
Российские карты, СБП, Mir — через Тинькофф Эквайринг. Электронный чек по 54-ФЗ автоматически приходит на email. Для юр. лиц — счёт и закрывающие документы через /support.
Возможен ли возврат денег?
Да, в течение 14 дней по запросу через /support — возвращаем деньги за неиспользованные минуты согласно ст. 32 закона о защите прав потребителей.
Есть ли API для разработчиков?
Да. OpenAPI-документация, multipart upload, polling статуса, rate limit от 60 req/min. Цена для разработчиков — 0,80 ₽/мин. Создание API-ключа — через команду «/api» в Telegram-боте.
Кто стоит за DeepScribe?
За DeepScribe — команда с многолетним опытом в речевых технологиях и судебной фоноскопии. Те же инженеры разработали:
- юрзвук.рф — сервис подготовки фоноскопических материалов для адвокатов и юристов
- deepverify.io — forensic-grade платформа для верификации аудио и видео доказательств
Тот же ASR-движок, что используется в наших экспертных продуктах, мы переупаковали в массовый сервис DeepScribe — для подкастеров, журналистов, психологов, HR и команд, которым нужна быстрая и точная транскрипция без юридической бюрократии.
Юридическое лицо: ИП Степин Иван Геннадьевич, ИНН 772172955804, Москва. Заявка на товарный знак DeepScribe подана в Роспатент. Серверы в РФ, чеки 54-ФЗ, соответствие ФЗ-152.
Попробуйте без регистрации
DeepScribe превращает в текст разговорную речь — интервью, лекции, встречи, подкасты, голосовые сообщения. Длинные файлы обрезаются до 2 минут (демо). Ссылка на результат живёт 24 часа.
⚠ Музыкальные треки, караоке и записи без речи мы расшифровать не сможем — в них нет того, что нужно распознать.
Говорите естественно. Тишина и музыкальный фон ухудшают точность.
Загружая, вы соглашаетесь с офертой и политикой ПДн. Файл удаляется через 24 часа.
Обрабатываем ваш файл
Распознаём речь, разделяем голоса, готовим саммари.
- Загрузка
- Распознавание речи
- Разделение голосов
- Полировка и саммари
- Готовим результат
Работает. Это первые 2 минуты вашей записи
Посмотрите качество расшифровки и разделение голосов — дальше полная версия файла.
В редакторе на платных тарифах: правка одной кнопкой, объединение/разделение спикеров, переименование «Голос 1» → «Иван Петров», поиск по тексту с переходом к аудио-моменту.
Редактор открывается прямо в браузере — не нужно выгружать в Word и обратно. Всё сохраняется автоматически, можно поделиться ссылкой.
Список спикеров с количеством реплик. Загрузите файл — и здесь появится список голосов из вашей записи.
На Lite — краткое содержание встречи. На Pro и Business — детальное саммари: ключевые темы, принятые решения и список задач с указанием ответственных — автоматически в каждой расшифровке.
Идеально для совещаний, CustDev-интервью, лекций и звонков продаж — не нужно пересматривать запись, всё главное уже выписано.
AI вытаскивает action items из обсуждения: «Иван — подготовить отчёт к пятнице», «Маша — связаться с подрядчиком до среды». Можно сразу разнести по календарю или Trello.
Action items доступны на Pro и Business — на Lite только краткое саммари, без списка задач.
Вы видите первые 2 минуты. Ещё мин речи, разделение голосов до конца, саммари и список задач — в полной версии файла.
Нажимая кнопку, вы соглашаетесь с офертой и политикой конфиденциальности. build 2026-05-27-v33 paid-poll-404-fix
Файл готов!
Полная транскрипция с разделением голосов готова. Скачайте в нужном формате ниже.
Переименуйте спикеров, объедините реплики, исправьте текст, скачайте обновлённую версию.
Нужна проверка подлинности самой записи — на признаки монтажа, подмены голоса или дипфейка? Это другая задача, её решает DeepVerify — отдельный экспертный сервис с заключением специалиста по ст. 188 ГПК / 58 УПК / 55.1 АПК.
Узнать про проверку подлинности →Не получилось
—
- Интервью / разговор — два человека говорят по очереди
- Лекция или подкаст — один человек рассказывает
- Встреча / Zoom-запись — несколько спикеров
- Голосовое сообщение — диктофонная запись
Мы расшифровываем именно разговорную речь. Песни, музыка, вокал из MDX-сепаратора, тишина — не подходят. Примеры подходящих сценариев →