DeepScribe

Расшифровка интервью с разделением голосов журналиста и спикера

Часовое интервью → готовый DOCX с цитатами и таймкодами за 10-20 минут. DeepScribe автоматически распознаёт речь, разделяет голоса корреспондента и эксперта, расставляет пунктуацию. Готовая основа для статьи, без 5 часов ручной расшифровки.

5 часов
экономия на час интервью
95%+
точность распознавания
DOCX
готов к редактированию
ФЗ-152
серверы в РФ

Кому нужна автоматическая расшифровка интервью

Журналист на одно интервью тратит 1-2 часа на запись и 3-5 часов на расшифровку. Это непродуктивно: пока вы расшифровываете, конкуренты публикуют материал. Профессиональные транскрибаторы берут 1 500 – 1 800 ₽ за час аудио, что ощутимо съедает гонорар. DeepScribe автоматизирует процесс: загрузили запись — через 10-20 минут получили текст с цитатами, готовый к редактированию.

Подходит для:

Как расшифровать интервью за 4 шага

ШАГ 1

Запишите интервью

Любой диктофон (Android/iOS приложение, Zoom-запись, диктофон смартфона). Чем чище звук — тем выше точность. Идеально: оба собеседника говорят чётко, без перебиваний.

ШАГ 2

Откройте DeepScribe

Личный кабинет на deepscribe.ru/webapp/ или Telegram-бот @DeepScribe_bot. Вход через Telegram — отдельная регистрация не нужна.

ШАГ 3

Загрузите файл

MP3, M4A, WAV, OGG — все основные диктофонные форматы. В веб-кабинете до 5 ГБ, в Telegram до 250 МБ. Видео-интервью (MP4) — аудио извлечётся автоматически.

ШАГ 4

Скачайте текст

Через 10-20 минут готов DOCX с цитатами, разделёнными по спикерам. Открывается в Word и LibreOffice. Каждая реплика помечена временем — удобно проверять цитаты по аудио.

Разделение голосов журналиста и спикера

Главная проблема ручной расшифровки — постоянно прокручивать запись, чтобы вспомнить «кто это сказал». DeepScribe решает это автоматически через диаризацию (определение голосов).

В транскрипте выглядит так:

[00:00:03] Голос 1: Спасибо что согласились на интервью. С чего бы хотели начать?

[00:00:12] Голос 2: Давайте с истории — как вообще пришла эта идея.

[00:00:18] Голос 1: Расскажите, какой у вас был первоначальный опыт?

[00:00:25] Голос 2: Я работал в крупной компании 8 лет. И всё это время
           видел одну и ту же проблему — никто не знает, что обсуждалось
           на встречах через 2 недели после них.
        

На тарифе Pro+ в редакторе ЛК одним кликом переименуйте «Голос 1» в «Анна Иванова» — это применится ко всем её репликам сразу. Готовый именованный транскрипт идёт в DOCX для публикации в журнале.

Точность диаризации:

Что вы получаете на выходе

📝 Транскрипт DOCX

Готовый документ Word с цитатами, разделёнными по спикерам, с таймкодами для каждой реплики. Открывается в любом редакторе.

📋 Краткое содержание

На Pro+ автоматически: общее резюме интервью, ключевые темы, важные цитаты — основа для лида статьи.

🎯 Цитаты с таймкодами

Каждая реплика помечена временем (00:14:23). Легко вернуться к аудио для уточнения формулировки или интонации.

💬 Чат с транскриптом

На Pro+ можно спросить: «о чём договорились?» — ИИ ответит на основе содержания интервью. Удобно для быстрых фактчеков.

Часто задаваемые вопросы

Сколько стоит расшифровка часового интервью?

Без регистрации можно попробовать демо первых 2 минут бесплатно. Часовое интервью на Lite (490 ₽/мес, 5 часов) или Pro (990 ₽/мес, 15 часов + краткое содержание + цитаты с таймкодами + редактор). Без подписки — pay-as-you-go от 2,50 ₽/минуту (час = 150 ₽). При оплате года вперёд — скидка 25%, Pro фактически стоит 742 ₽/мес.

Можно ли расшифровать интервью с разделением голосов журналиста и спикера?

Да. DeepScribe автоматически определяет «кто когда говорит» через open-source модель PyAnnote 3.1. В транскрипте видно: Голос 1, Голос 2. На тарифе Pro в редакторе личного кабинета можно одним кликом переименовать «Голос 1» в «Анна Иванова», «Голос 2» в «Иван Петров» — для всех его реплик сразу. Готовый именованный транскрипт идёт в DOCX.

Какая точность распознавания на русском языке?

95%+ на чистой студийной записи (отдельные микрофоны, тихая комната, чёткая дикция). 85-90% на полевых интервью с шумом, отдалённым микрофоном или с акцентами. Используем WhisperX large-v3 — лучшую open-source модель распознавания речи на русском. На тарифе Pro+ работает автоматическая полировка пунктуации через Qwen 3 8B.

Можно ли получить готовый DOCX для редактирования?

Да, DOCX доступен на тарифах Lite, Pro и Business. Документ открывается в Microsoft Word, LibreOffice, Google Docs. Каждая реплика помечена спикером и временем. Удобно для оформления статьи: верифицируйте цитаты по таймкодам, выделите ключевые моменты, отправьте редактору.

Как защищены конфиденциальные интервью?

Все серверы DeepScribe находятся в РФ. Распознавание выполняется локально (наша GPU, не Google/AWS/Azure). Соответствие ФЗ-152 о персональных данных. Аудио хранится только на время обработки и удаляется автоматически через 30 дней. Для журналистов работающих с источниками это критично — записи не должны утекать через иностранные сервера.

Что делать с длинным интервью (2-3 часа)?

DeepScribe принимает файлы любой длины (в веб-кабинете до 5 ГБ). 3-часовое интервью обработается за 30-60 минут. На тарифе Pro квота 15 часов/мес, на Business — 60 часов. Если нужно ещё больше — overdraft по 2,50 ₽/минуту включается автоматически.

Часовое интервью → готовый DOCX за 10 минут

Демо — первые 2 минуты файла бесплатно. Без карты. Без обязательств. Российская юрисдикция, ФЗ-152, чеки 54-ФЗ.