При создании контента более 70% времени тратится на поиск и сбор необходимой информации. И не важно, какой тип контента вы создаете — товары в интернет-магазине, статьи или обзоры. К счастью, процесс сбора можно автоматизировать с помощью парсеров.
Парсер — специальная программа или скрипт, которая собирает данные с веб-сайтов по заданным параметрам. Парсер может быть рукописным — когда программист пишет его под конкретную задачу. Такие парсеры, как правило, собирают данные с какого-то конкретного сайта, их нельзя использовать для других задач.
Бывают парсера специализированные. Например, Key Collector — программа, которая работает с ключевыми словами. Но наиболее интересная группа — универсальные парсеры, об одном из которых пойдет речь в данном обзоре.
Datacol 7 Easy Action — универсальный парсер с обширными возможностями. Он позволяет собирать товары интернет-магазинов, объявления, новости и статьи, отчеты, ключевые слова, SEO параметры и любую другую информацию, которая есть на сайтах.
Из основных преимуществ программы можно выделить:
- Готовые настройки парсинга — больше 60 парсеров, настроенных под самые популярные площадки и задачи.
- Возможность эмулировать действия пользователя и выполнять сценарии. Например, можно имитировать клик по кнопке или авторизацию на сайте.
- Визуальные инструменты настройки. Настройка парсера под свою площадку — довольно непростая задача. Визуальный пошаговый мастер настройки парсера значительно ее упрощает.
- Автоматическая обработка данных. В программе есть плагины, которые могут дополнительно обрабатывать результаты парсинга — например, перевести на другой язык, уникализировать и т.д.
- Возможность запускать программу по расписанию. Можно передать параметры запуска Datacol в планировщик Windows и она будет запущена в указанное время.
Но давайте посмотрим как работает Datacol на конкретном примере.
Один из основных методов интернет-маркетинга — анализ. Сюда относится анализ посещаемости и посетителей сайта, что помогает понять их потребности, выявить возможные направления по расширению бизнеса, перспективные направления SEO-продвижения, текущие тенденции.
Для анализа отчетов можно использовать одну из последних наработок Datacol — кластеризатор.
Кластеризатор — специальная настройка парсинга данных из файла, которая помогает сгруппировать ключевые запросы из файла по определенному ключу. В один кластер мы можем добавлять как совершенно разные запросы, так и синонимы одного и того же ключевого слова. Помимо группировки ключевых слов, кластеризатор сможет подсчитать сумму какого либо параметра (например, визитов, уникальных посетителей, показов) в целом по кластеру, а также найти среднее значение параметра.
При настройке важно что бы в первом столбце были ключевые запросы. Если при следующей кластеризации структура файла поменяется, то кампанию придется корректировать или создавать заново. при этом плагин с настройками кластеров можно предварительно сохранить и импортировать в новую кампанию.
Подробнее о настройке кластеризации смотрите в этом видео:
Как видите, Datacol успешно справился с поставленной задачей.
Освоить программу не составит большого труда — разработчики записали серию видеоуроков, в которых пошагово рассматривают различные особенности настройки программы. Видео разбиты по сложности и по тематике. Помимо видео есть справка по работе с программой и официальный форум. На форуме проконсультируют по общим вопросам, а покупателей в закрытом разделе ждет дополнительная помощь от команды поддержки.
Также разработчики помогут настроить парсер для нужного сайта, напишут плагин, который будет автоматически обрабатывать данные, проконсультируют или научат работе с программой, однако все это за отдельную плату.
Лицензия на программу ограничена по времени, и ее можно купить на любой период, начиная с одного месяца. Ежемесячная оплата зависит от объема пакета, который вы покупаете. Так один месяц обойдется в 1200 рублей, три месяца стоят 2400 рублей (800 рублей в месяц) а стоимость месяца в годовом пакете 459 рублей.
Для желающих просто попробовать программу есть бесплатная демо-версия. По функционалу она ничем не отличается от обычной, но сохраняет только первые 25 результатов парсинга.