Некоторые сервисы-транскрибаторы заточены только под преобразование аудио в текст, поэтому их мало заботит, как и для чего этот контент будет использоваться.
Работа Descript больше построена на понятии «продакшн». Например, с ним можно сделать транскрибацию подкаста с онлайн-мероприятия. Помимо этого, это неплохой инструмент для редактирования звука, создания многослойных аудиозаписей (овердаббинг) и управления большими объёмами контента.
Descript будет полезен тем, кто создаёт подкасты, контент на YouTube и тому подобное. Давайте познакомимся поближе с этим сервисом.
Тарифные планы и цены
Есть три плана: Free, Producer и Team. Первый (бесплатный) — пробная версия, которая даёт всего три часа транскрибации. Два других (платные) имеют более расширенные возможности.
План PRO позволит нескольким пользователям работать с биллингами и над совместными проектами, но в остальном он ничем не отличается от Creator.
Создатели сервиса не забыли и о корпоративных клиентах, студентах, преподавателях и некоммерческих организациях, предлагая им скидки на свой продукт.
Что умеет
Descript предлагает пользователям для работы как веб-версию, так и десктопное приложение. Функции у них практически одинаковые, и обоим требуется подключение к интернету, чтобы загружать аудиофайлы из облака.
Descript немного отличается от других инструментов тем, что он организует аудиоконтент в коллективные проекты, а не делает из каждого файла проект. Это идеальный вариант в ситуации, когда несколько треков необходимо объединить в один проект.
Но главная фишка Descript в том, что он умеет быстро и легко удалять из аудиозаписи всё лишнее (например, слишком длинные паузы в речи).
Кроме того, можно наложить несколько треков друг на друга, если нужно сделать вступительную мелодию, звуковые эффекты или переходы.
Работа с записями
Редактор Descript по своему принципу работы с аудио- и видеофайлами похож на Google Doc.
Я видел, как многие вставляли текст в простой текстовый редактор вверху, а аудиосигнал — внизу.
Descript расширяет эту концепцию, помещая произнесённые слова в области аудиосигнала, позволяя вам быстро перейти к той части записи, с которой вы хотите работать.
В редакторе есть два режима — Edit media (редактура медиа) и Correct Text (коррекция текста).
Первый режим позволяет разделять аудиозапись на части, а также удалять из неё ненужные слова, речевые паузы и слова-паразиты. В любой момент вы можете записать дополнительный звук или вставить его из медиатеки.
Второй режим позволяет редактировать расшифрованный текст, исправляя неточности или добавляя имена говорящих.
Что интересно, если вы удалите слово или фразу, изменения сразу же отразятся в аудиозаписи. Минусом является то, что можно удалить только 40 символов за раз.
В целом, Descript может гордиться своим редактором, которому не хватает всего пары незначительных функций.
Проверка на точность
Я потестил сервис, и должен сказать, что это была не самая точная транскрибация, но далеко не худшая.
Descript использует технологию Google Cloud Speech-to-Text, поэтому уровень точности во многом такой же, как у Google Home или у Text-to-speech в Google Docs. Но есть Rev (другой провайдер) — для более качественной транскрибации.
Чего не хватает сервису, так это специального инструмента, где можно было бы помечать и сохранять слова или целые фрагменты, чтобы исправить их позже.
Но самым большим недочётом Descript является то, что он работает только с английским языком, поэтому если ты не нейтив, то проходи мимо.
Overdub
В настоящее время функция «Овердаб» доступна только в бета-версии (по требованию), но на момент написания статьи я так и не получил к ней доступа.
Как я понял, это AI (искусственный интеллект), который обрабатывает запись и извлекает из неё модель речи для формирования ваших недосказанных слов и предложений. По словам тех, кто экспериментировал с этим инструментом, результаты впечатляют — смоделированная роботом-программой речь имеет ту же интонацию голоса, что и оригинал.
Насколько хорошим получится результат, зависит от количества и качества записанной речи. Но многих беспокоит другое — как это могут использовать те, кто плевать хотел на этические нормы.
Пока что Overdub позволяет сэмплировать только собственный голос. Но эти границы скоро расширятся, открывая новые возможности в различных сферах… Например, это бы помогло сэкономить кучу времени и денег при озвучке фильмов.
Безопасность
Чтобы обеспечить безопасную работу, Descript использует сложную цепочку из нескольких сторонних технологий, что иногда усложняет работу с сервисом.
Так, например, Auth0 используется для проверки личности. Zendesk — для поддержки клиентов. Stripe — для обработки платежей. Amazon — для хранения. Rev — для транскрибации. Customer.io и Mailchimp — для электронной почты.
С таким «винегретом» общая проблема безопасности рассредоточена. Но самый большой прокол сервиса даже не в этом, а в том, что здесь нет метода двухфакторной аутентификации.
Успокаивает только то, что транскрибируемый контент не используется в маркетинговых целях внешними компаниями. Только определённая информация передаётся в Google, Amazon и Stripe (какая именно, можно узнать на сайте Descript). Кроме того, все данные защищены HTTPS-шифрованием, хранящиеся на серверах — тоже.
Что в итоге
Мне понравилось, как Descript чётко понимает то, что необходимо пользователю, который создаёт подкасты и подобный контент.
Чего ему действительно не хватает, так это способности работать с другими языками, а не только с английским. Также нет инструмента для автокоррекции ошибок.
Поэтому если вы из тех людей, кто работает с аудиоподкастами исключительно на английском языке, то Descript может стать тем решением, которое вы ищете.