Обзор superwhisper. Перевод голоса в текст с помощью ИИ

Константин Докучаев
Константин Докучаев
Обзор superwhisper. Перевод голоса в текст с помощью ИИ
Оглавление
Оглавление

Способов быстро создать текстовую заметку — множество. Но некоторые предпочитают быстро надиктовать что-то, а потом разбираться с проблемами преобразования голоса в текст. И с приходом нейросетей сделать это стало намного проще.

Супер шептун с поддержкой нейронки

Например, можно воспользоваться приложением superwhisper, которое позволяет быстро записать голосовую заметку, а затем превратить в текст и очистить его от мусора.

Приложение доступно на macOS и iOS, и возможности между ними немного различаются. Поэтому ниже я расскажу о каждом из них по отдельности.

Десктопная версия

Версию для macOS можно скачать с сайта разработчика, если слить email. После этого вы получите файл установщика. Либо можете скачать актуальную версию по прямой ссылке.

Первый запуск superwhisper потребует небольшой настройки. Вам нужно выбрать язык общения с нейронкой (русский — в комплекте), а также выбрать языковую модель.

В целом можно обойтись настройками по умолчанию и просто нажимать Далее. Единственное, что стоит учесть — языковая модель скачивается на компьютер (где-то 1,5 Гб), что позволяет обрабатывать все ваши запросы локально.

После чего вызвать приложение можно из Строки меню. Где у вас есть доступ к записи в реальном времени, транскрибации файла и просмотру истории.

Начать запись также можно по горячей клавише. В самом окне записи нет ничего особенного, только кнопки старта и остановки.

От вас требуется просто надиктовать свои мысли в удобном для вас виде, и через пару секунд после окончания записи вы получите их расшифровку.

Результат можно скопировать в буфер обмена и быстро выставить в любое нужное приложение.

Транскрибация и история

Аналогичным образом работает пункт транскрибации аудиофайла. Его можно загрузить, и superwhisper через некоторое время выдаст его текстовый вариант.

В истории распознавания можно прослушать записанное в оригинале аудио и увидеть результат транскрибации. При этом доступен просмотр по сегментам и подробной информации об использованной нейронке.

Ещё настройки

В настройках superwhisper кроется множество интересных параметров, в которые я рекомендую заглянуть ещё до начала работы с приложением.

Первый из разделов — Modes, где можно настраивать предустановленные режимы и создавать свои собственные. В обоих случаях вы можете поменять любой параметр работы режима: модель нейронки, какой промпт применить к тексту, язык и многие другие параметры.

В разделе AI Models можно загрузить дополнительные голосовые и аудиомодели, либо даже загрузить свою с помощью API-ключа. К сожалению, подробного описания плюсов и минусов той или иной модели нет.

Text Replacements и Vocabulary — тоже полезно будет настроить. В первом случае вы можете заставить модель заменять определённые слова на нужные вам. Например, сказать «почта», а в распознанном тексте вместо этого будет ваш адрес email.

В словаре, соответственно, можно настроить какие-то ваши особенные слова, с которыми нейронка должна взаимодействовать наиболее аккуратно. Честно говоря, я не понял, как это должно работать.

Мобильная версия

Первый запуск iOS-версии аналогичен десктопу. Поэтому запаситесь парой гигабайт свободного места на устройстве.

А вот сам процесс работы с superwhisper меня поставил в тупик, и я вообще не уверен, что он работает. Как и на десктопе, вы можете надиктовать что-то, а приложение приведёт всё это в более или менее вменяемый текст. Вся история аналогично сохраняется в соответствующем разделе.

Чего я не понял, так это то, зачем есть опция процессинга текста с помощью одного из режимов и вкладка AI в записи. При применении любого режима к тексту по факту вообще ничего не меняется, и ИИ говорит, что он ничего не делал.

При этом, как и на macOS, вы вольны полностью настраивать и создавать свои режимы обработки голоса и текста.

Автозамены в мобильной версии нет. Зато полученный текст можно быстро отправить в любое другое приложение на устройстве.

Стоимость

Десктопная и мобильная версия продаются отдельно, а вот стоимость у них одинаковая и немаленькая. В месяц с вас попросят $8.49, либо можно оплатить пожизненную подписку стоимостью $249.99.

Конечно, можно остаться на бесплатной версии, которая по возможностям не сильно отличается от платной. Основное ограничение — 15 минут записей в день и кастомные промпты.

Выводы

superwhisper — приложение явно не для всех, особенно учитывая стоимость. Но при правильной настройке, по крайней мере, на десктопе от него можно ждать многого.

Если вы часто диктуете заметки голосом и умеете работать с промтами, то вы наверняка сможете найти массу крутых применений подобному приложению. Для остальных это будет способ распознать короткую голосовую заметку и сохранить её на потом для использования в нормальных приложениях для ведения заметок.



Great! Next, complete checkout for full access to All-In-One Person
Welcome back! You've successfully signed in
You've successfully subscribed to All-In-One Person
Success! Your account is fully activated, you now have access to all content
Success! Your billing info has been updated
Your billing was not updated