ru24.pro
«Фрилансим»
Январь
2025

Парсер сайта

0
Приветствую всех

Цель: Собрать информацию по бизнесам из США (Штат Масачусетс), чтобы потом выяснить их контактную бизнес информацию (телефоны/емейлы)

Сайт: corp.sec.state. ma.us/CorpWeb/CorpSearch/CorpSearch.aspx

Необходимо спарсить компании:
1) 1 скрипт должен вводить поочередно 2 первые буквы (aa, ab, ac...zz), далее переходить к поиску с показом 100 items
И там он должен парсить со всех страниц: Имя компании + Cсылка на компанию (её можно найти в href) + ID номер + Адрес в ексель
После того, как он спарсил информацию на первой странице, он должен переходить ко второй и так далее
Скорее всего так же потребуется подключение к прокси (его я выдам), но это не точно
2) 2 скрипт обсуждается лично, ибо сейчас не понятно потребуется ли прокси и прочие вещи

Сразу пишите цену + сроки для первого скрипта + оставляйте свои контакты