Расшифровка интервью с разделением голосов

Q: Сколько стоит расшифровка часового интервью?

Без регистрации можно попробовать демо — первые 2 минуты любого файла бесплатно. Часовое интервью обрабатывается на Lite (490 ₽/мес, 5 часов) или Pro (990 ₽/мес, 15 часов + цитаты с таймкодами). Без подписки — pay-as-you-go от 690 ₽ за час аудио. При оплате 12 месяцев — скидка 25%.

Q: Какая точность распознавания на русском языке?

95%+ на чистой студийной записи. На полевых интервью (шум, отдалённый микрофон) — 85-90%. Используем WhisperX large-v3 — лучшую open-source модель распознавания речи. На тарифе Pro+ автоматическая полировка пунктуации через Qwen 3.

Q: Можно ли получить готовый DOCX для редактирования?

Да, DOCX доступен на тарифах Lite, Pro и Business. Документ открывается в Word, LibreOffice, Google Docs. Каждая реплика помечена спикером и временем — удобно для оформления статьи или верификации цитат при подготовке материала.

Q: Как защищены конфиденциальные интервью?

Серверы DeepScribe в РФ. Распознавание локально, без передачи аудио в Google/AWS. Соответствие ФЗ-152. Исходный аудио-файл удаляется через 24 часа после обработки, текст хранится в кабинете до удаления пользователем. Для подкастов и журналистов это особенно важно: интервью с источниками не должны попадать на иностранные сервера.

Кому нужна автоматическая расшифровка интервью

Журналист на одно интервью тратит 1-2 часа на запись и 3-5 часов на расшифровку. Это непродуктивно: пока вы расшифровываете, конкуренты публикуют материал. Профессиональные транскрибаторы берут 1 500 – 1 800 ₽ за час аудио, что ощутимо съедает гонорар. DeepScribe автоматизирует процесс: загрузили запись — через 10-20 минут получили текст с цитатами, готовый к редактированию.

Подходит для:

Журналистов и редакторов — расшифровка интервью с экспертами для статей, репортажей, очерков
Подкастеров — разговор с гостем → текст для блог-поста и шоу-нот
UX-исследователей — глубинные интервью с пользователями, кодирование цитат
HR и рекрутёров — собеседования с кандидатами, сохранение ключевых ответов
Социологов и антропологов — полевые интервью для научных работ, фокус-группы
Документалистов — расшифровка съёмочных интервью для подготовки нарратива

Как расшифровать интервью за 4 шага

ШАГ 1

Запишите интервью

Любой диктофон (Android/iOS приложение, Zoom-запись, диктофон смартфона). Чем чище звук — тем выше точность. Идеально: оба собеседника говорят чётко, без перебиваний.

ШАГ 2

Откройте DeepScribe

Личный кабинет на deepscribe.ru/webapp/ или Telegram-бот @DeepScribe_bot. Вход через Telegram — отдельная регистрация не нужна.

ШАГ 3

Загрузите файл

MP3, M4A, WAV, OGG — все основные диктофонные форматы. В веб-кабинете до 5 ГБ, в Telegram до 250 МБ. Видео-интервью (MP4) — аудио извлечётся автоматически.

ШАГ 4

Скачайте текст

Через 10-20 минут готов DOCX с цитатами, разделёнными по спикерам. Открывается в Word и LibreOffice. Каждая реплика помечена временем — удобно проверять цитаты по аудио.

Разделение голосов журналиста и спикера

Главная проблема ручной расшифровки — постоянно прокручивать запись, чтобы вспомнить «кто это сказал». DeepScribe решает это автоматически через диаризацию (определение голосов).

В транскрипте выглядит так:

[00:00:03] Голос 1: Спасибо что согласились на интервью. С чего бы хотели начать?

[00:00:12] Голос 2: Давайте с истории — как вообще пришла эта идея.

[00:00:18] Голос 1: Расскажите, какой у вас был первоначальный опыт?

[00:00:25] Голос 2: Я работал в крупной компании 8 лет. И всё это время
           видел одну и ту же проблему — никто не знает, что обсуждалось
           на встречах через 2 недели после них.

На тарифе Pro+ в редакторе ЛК одним кликом переименуйте «Голос 1» в «Анна Иванова» — это применится ко всем её репликам сразу. Готовый именованный транскрипт идёт в DOCX для публикации в журнале.

Точность диаризации:

Студийная запись (микрофон у каждого) — 95%+ правильности
Запись одним микрофоном в тихой комнате — 85-90%
Полевая запись с шумом — 75-85%, иногда требует ручной правки в редакторе
Телефонное интервью — голоса разделяются хорошо если каналы стерео; если моно — точность ниже

Что вы получаете на выходе

📝 Транскрипт DOCX

Готовый документ Word с цитатами, разделёнными по спикерам, с таймкодами для каждой реплики. Открывается в любом редакторе.

📋 Краткое содержание

На Pro+ автоматически: общее резюме интервью, ключевые темы, важные цитаты — основа для лида статьи.

🎯 Цитаты с таймкодами

Каждая реплика помечена временем (00:14:23). Легко вернуться к аудио для уточнения формулировки или интонации.

💬 Чат с транскриптом

На Pro+ можно спросить: «о чём договорились?» — ИИ ответит на основе содержания интервью. Удобно для быстрых фактчеков.

Часто задаваемые вопросы

Сколько стоит расшифровка часового интервью?

Без регистрации можно попробовать демо первых 2 минут бесплатно. Часовое интервью на Lite (490 ₽/мес, 5 часов) или Pro (990 ₽/мес, 15 часов + краткое содержание + цитаты с таймкодами + редактор). Без подписки — разовая обработка одного файла — от 99 ₽. При оплате года вперёд — скидка 25%, Pro фактически стоит 742 ₽/мес.

Можно ли расшифровать интервью с разделением голосов журналиста и спикера?

Да. DeepScribe автоматически определяет «кто когда говорит» через open-source модель PyAnnote 3.1. В транскрипте видно: Голос 1, Голос 2. На тарифе Pro в редакторе личного кабинета можно одним кликом переименовать «Голос 1» в «Анна Иванова», «Голос 2» в «Иван Петров» — для всех его реплик сразу. Готовый именованный транскрипт идёт в DOCX.

Какая точность распознавания на русском языке?

95%+ на чистой студийной записи (отдельные микрофоны, тихая комната, чёткая дикция). 85-90% на полевых интервью с шумом, отдалённым микрофоном или с акцентами. Используем WhisperX large-v3 — лучшую open-source модель распознавания речи на русском. На тарифе Pro+ работает автоматическая полировка пунктуации через Qwen 3 8B.

Можно ли получить готовый DOCX для редактирования?

Да, DOCX доступен на тарифах Lite, Pro и Business. Документ открывается в Microsoft Word, LibreOffice, Google Docs. Каждая реплика помечена спикером и временем. Удобно для оформления статьи: верифицируйте цитаты по таймкодам, выделите ключевые моменты, отправьте редактору.

Как защищены конфиденциальные интервью?

Все серверы DeepScribe находятся в РФ. Распознавание выполняется локально (наша GPU, не Google/AWS/Azure). Соответствие ФЗ-152 о персональных данных. Аудио хранится только на время обработки и удаляется автоматически через 30 дней. Для журналистов работающих с источниками это критично — записи не должны утекать через иностранные сервера.

Что делать с длинным интервью (2-3 часа)?

DeepScribe принимает файлы любой длины (в веб-кабинете до 5 ГБ). 3-часовое интервью обработается за 30-60 минут. На тарифе Pro квота 15 часов/мес, на Business — 60 часов. Если нужно ещё больше — разовая обработка файла от 99 ₽ включается автоматически.

Часовое интервью → готовый DOCX за 10 минут

Демо — первые 2 минуты файла бесплатно. Без карты. Без обязательств. Российская юрисдикция, ФЗ-152, чеки 54-ФЗ.

Войти в личный кабинет Telegram-бот

Расшифровка интервью с разделением голосов журналиста и спикера