Парсинг сайтов (веб скраппинг)

Парсинг сайтов на английском языке называется web scrapping - веб скрапинг. Это сбор и систематизация данных с сайтов. Парсер выполняет две основные задачи: первое это получение данных с сайта, второе это разбор полученных данных (непосредственно парсинг) и занесение их в какую-то базу данных.

Для создания парсеров я использую язык программирования Python с библиотекой BeautifulSoup. Но в некоторых случаях (например отсутствия языка Python на хостинге клиента) приходится использовать язык PHP.

Возможны следующие варианты создания и дальнейшей работы парсера:

Перед тем как звонить мне, пожалуйста ознакомьтесь с памяткой для желающих заказать парсинг. в любом случае буду вынужден задать вам все перечисленные там вопросы, поэтому будет гораздо продуктивнее если вы заранее обдумаете эти детали.

Запрос на парсинг веб-сайта

Почта нужна для того что бы я с вами связался
Телефон нужен для оперативной связи. Или телефон, или почта должны быть указаны обязательно.
Опишите какие именно страницы необходимо обрабатывать. Требуется ли обновлять список обрабатываемых страниц (искать новые, удалять отсутствующие)
Какие именно данные надо собирать со страницы. Например "Заголовок", "Цена", "Описание". Если данные имеют вид списков (например "характеристики") опишите, в каком виде вам бы хотелось их получить.
Периодичность, с которой планируется выполнять парсинг. Это может быть единовреммное сканирование, регулярное сканирование (например раз в неделю), или например "по запросу"
captcha Подтвердите что вы Homo sapiens а не бот какой-то. Решите эту простенькую арифметическую задачку и напишите ответ (число).