ru24.pro
Все новости
Ноябрь
2024

Парсинг динамических сайтов без API каждый час

0
Парсинг билетных операторов (Яндекс Афиша, Кассир ру и т.д.) для отслеживания динамики продаж билетов у конкурентов.

Нужно:
1. Парсить количество проданных билетов в час
2. Раз в день парсить заполнение ценовых сегментов (
3. Парсить все номера мест и номер ряда с пометкой продан он или нет
4. Придумать какую-то визуализацию для (если можно настроить в гугл таблицах, то отлично - графики, дашборды в идеале) - просто excel \ csv с данными для нас не релевантен.
5. Предусмотреть отсутствие дублей. Все сайты работают через 1 шлюз, поэтому не имеет смысл парсить одно мероприятие и с Афиши и с Кассир ру) - тот, что проще парсится, тот и используйте
6. Парсер должен работать стабильно и не блокироваться (т.к. запросов будет много, потому что сканировать нужно более 10 городов, то необходимо предусмотреть прокси)

Дедлайн 10 дней