Обзор Parseur. Сервис для парсинга почты и документов

Константин Докучаев
Константин Докучаев
Обзор Parseur. Сервис для парсинга почты и документов
Capital

Когда ваша работа заточена на обработку сотен писем или документов, рано или поздно в голову приходит мысль автоматизировать этот процесс. В таком случае на помощь приходят различные инструменты парсинга, то есть для извлечения данных из писем и документов.

Parseur — онлайн-сервис для автоматической обработки и извлечения данных из электронных писем и документов в реальном времени.

Как это работает

Сразу после регистрации в сервисе будет предложено создать так называемый почтовый ящик. В него будут собираться все данные для парсинга.

На первом этапе нужен один ящик, но при дальнейшей работе можно создать несколько ящиков для различных параметров обработки.

Затем нужно выбрать тип данных, которые будут попадать в создаваемый ящик. От выбора зависит шаблон обработки, который будет использоваться при дальнейшей настройке и работе.

Можно выбрать настраиваемые шаблоны почты и вложений. А также почти готовые к употреблению шаблоны для обработки заказов еды, резюме, Google Alerts и многого другого.

Для обзора я выбрал шаблон по обработке почты и вложений. Parseur на входе поддерживает практически любые типы документов (abw, csv, djvu, doc, docm, docx, html, htm, lwp, md, odt, pages, pages.zip, pdf, rst, rtf, sdw, tex, txt, wpd, wps, xls, xlsx, xlsm, zabw) и любые почтовые провайдеры. Данные можно отправлять не только через почту и поддерживаемые сервисы (Grubhub, LinkedIn и прочее), но и через Zapier, Microsoft Flow или с помощью открытого API.

В моём случае для скармливания данных в Parseur был выдан почтовый адрес сервиса, на который нужно было переслать первый email для завершения настройки.

Благодаря этому, кстати, можно настроить автоматизацию обработки почты. Для этого в почтовом клиенте нужно просто настроить соответствующие фильтры.

Когда письмо получено, нужно настроить шаблон обработки. Для этого открывается превью полученного письма, где вам нужно выбрать, какие поля нужно обрабатывать.

Для этого их достаточно выбрать в самом письме и указать необходимые над ним действия: обработать, пропустить, удалить или обработать и удалить.

После того как вы укажете действия для всех необходимых полей, Parseur сможет создавать списки с информацией из этих полей.

Аналогичные действия следует проделать и для вложений из письма. А результат парсинга можно сохранить в виде xlsx, csv или json таблицы.

Когда всё настроено, все письма, приходящие в созданный почтовый ящик, будут автоматически обрабатываться согласно настроенным правилам, и вы сможете получать результат в удобном для вас формате. Также есть поддержка пары десятков сторонних инструментов и сервисов, куда Parseur может автоматически высылать результат обработки.

Для обработки другого формата данных или писем нужно создать новый почтовый ящик и повторить весь процесс ещё раз. При нежелании создавать новый ящик можно создать новый шаблон обработки, если формат полей входных данных отличается.

Стоимость

В Parseur есть бесплатный тариф, в котором заблокирована возможность постпроцессинга данных с помощью Python-скриптов. А также вы сможете обрабатывать не более 20 документов в месяц.

Платные тарифы начинаются от $59 в месяц, и они увеличивают количество обрабатываемых в месяц документов. Разблокировать постобработку данных можно только на Pro-тарифе за $299 в месяц.


Когда я готовился писать обзор на Parseur, я ждал какого-то сложного интерфейса и долгого вникания в процесс работы. На практике оказалось, что работать с сервисом очень легко, и уже буквально через пять минут настройка шаблонов происходит на полном автомате.

Конечно, в зависимости от количества полей для парсинга, настройка шаблона может занять как несколько минут, так и несколько дней. Но сам сервис вас не будет тормозить, а лишь помогать.

Попробовать Parseur



Great! Next, complete checkout for full access to All-In-One Person
Welcome back! You've successfully signed in
You've successfully subscribed to All-In-One Person
Success! Your account is fully activated, you now have access to all content
Success! Your billing info has been updated
Your billing was not updated