Способов быстро создать текстовую заметку — множество. Но некоторые предпочитают быстро надиктовать что-то, а потом разбираться с проблемами преобразования голоса в текст. И с приходом нейросетей сделать это стало намного проще.
Супер шептун с поддержкой нейронки
Например, можно воспользоваться приложением superwhisper, которое позволяет быстро записать голосовую заметку, а затем превратить в текст и очистить его от мусора.
Приложение доступно на macOS и iOS, и возможности между ними немного различаются. Поэтому ниже я расскажу о каждом из них по отдельности.
Десктопная версия
Версию для macOS можно скачать с сайта разработчика, если слить email. После этого вы получите файл установщика. Либо можете скачать актуальную версию по прямой ссылке.
Первый запуск superwhisper потребует небольшой настройки. Вам нужно выбрать язык общения с нейронкой (русский — в комплекте), а также выбрать языковую модель.
В целом можно обойтись настройками по умолчанию и просто нажимать Далее. Единственное, что стоит учесть — языковая модель скачивается на компьютер (где-то 1,5 Гб), что позволяет обрабатывать все ваши запросы локально.
После чего вызвать приложение можно из Строки меню. Где у вас есть доступ к записи в реальном времени, транскрибации файла и просмотру истории.
Начать запись также можно по горячей клавише. В самом окне записи нет ничего особенного, только кнопки старта и остановки.
От вас требуется просто надиктовать свои мысли в удобном для вас виде, и через пару секунд после окончания записи вы получите их расшифровку.
Результат можно скопировать в буфер обмена и быстро выставить в любое нужное приложение.
Транскрибация и история
Аналогичным образом работает пункт транскрибации аудиофайла. Его можно загрузить, и superwhisper через некоторое время выдаст его текстовый вариант.
В истории распознавания можно прослушать записанное в оригинале аудио и увидеть результат транскрибации. При этом доступен просмотр по сегментам и подробной информации об использованной нейронке.
Ещё настройки
В настройках superwhisper кроется множество интересных параметров, в которые я рекомендую заглянуть ещё до начала работы с приложением.
Первый из разделов — Modes, где можно настраивать предустановленные режимы и создавать свои собственные. В обоих случаях вы можете поменять любой параметр работы режима: модель нейронки, какой промпт применить к тексту, язык и многие другие параметры.
В разделе AI Models можно загрузить дополнительные голосовые и аудиомодели, либо даже загрузить свою с помощью API-ключа. К сожалению, подробного описания плюсов и минусов той или иной модели нет.
Text Replacements и Vocabulary — тоже полезно будет настроить. В первом случае вы можете заставить модель заменять определённые слова на нужные вам. Например, сказать «почта», а в распознанном тексте вместо этого будет ваш адрес email.
В словаре, соответственно, можно настроить какие-то ваши особенные слова, с которыми нейронка должна взаимодействовать наиболее аккуратно. Честно говоря, я не понял, как это должно работать.
Мобильная версия
Первый запуск iOS-версии аналогичен десктопу. Поэтому запаситесь парой гигабайт свободного места на устройстве.
А вот сам процесс работы с superwhisper меня поставил в тупик, и я вообще не уверен, что он работает. Как и на десктопе, вы можете надиктовать что-то, а приложение приведёт всё это в более или менее вменяемый текст. Вся история аналогично сохраняется в соответствующем разделе.
Чего я не понял, так это то, зачем есть опция процессинга текста с помощью одного из режимов и вкладка AI в записи. При применении любого режима к тексту по факту вообще ничего не меняется, и ИИ говорит, что он ничего не делал.
При этом, как и на macOS, вы вольны полностью настраивать и создавать свои режимы обработки голоса и текста.
Автозамены в мобильной версии нет. Зато полученный текст можно быстро отправить в любое другое приложение на устройстве.
Стоимость
Десктопная и мобильная версия продаются отдельно, а вот стоимость у них одинаковая и немаленькая. В месяц с вас попросят $8.49, либо можно оплатить пожизненную подписку стоимостью $249.99.
Конечно, можно остаться на бесплатной версии, которая по возможностям не сильно отличается от платной. Основное ограничение — 15 минут записей в день и кастомные промпты.
Выводы
superwhisper — приложение явно не для всех, особенно учитывая стоимость. Но при правильной настройке, по крайней мере, на десктопе от него можно ждать многого.
Если вы часто диктуете заметки голосом и умеете работать с промтами, то вы наверняка сможете найти массу крутых применений подобному приложению. Для остальных это будет способ распознать короткую голосовую заметку и сохранить её на потом для использования в нормальных приложениях для ведения заметок.