ru24.pro
«Фрилансим»
Ноябрь
2024
1 2 3 4 5 6 7 8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Парсинг динамических сайтов без API каждый час

0
Парсинг билетных операторов (Яндекс Афиша, Кассир ру и т.д.) для отслеживания динамики продаж билетов у конкурентов.

Нужно:
1. Парсить количество проданных билетов в час
2. Раз в день парсить заполнение ценовых сегментов (
3. Парсить все номера мест и номер ряда с пометкой продан он или нет
4. Придумать какую-то визуализацию для (если можно настроить в гугл таблицах, то отлично - графики, дашборды в идеале) - просто excel \ csv с данными для нас не релевантен.
5. Предусмотреть отсутствие дублей. Все сайты работают через 1 шлюз, поэтому не имеет смысл парсить одно мероприятие и с Афиши и с Кассир ру) - тот, что проще парсится, тот и используйте
6. Парсер должен работать стабильно и не блокироваться (т.к. запросов будет много, потому что сканировать нужно более 10 городов, то необходимо предусмотреть прокси)

Дедлайн 10 дней