Разработать парсер сайта egrul.itsoft.ru обработать данные
На сайте https://egrul.itsoft.ru/ в открытом доступе через csv, xml, json (API) можно скачать выборку компаний. Необходимо разработать скрипт, который парсит все компании с выручкой более 800 млн руб в базу данных (таких компаний будет 20-30 тыс).
Примерная структура SQL базы это 3 таблицы: companies (список компаний), owners (список учредителей), data (данные по выручке и прибыли за разные годы).
Представить вывод данных вот в такую таблицу по идее должно получиться 100-300 тыс записей.
Итоговую таблицу отдавать в формате XLSX.
После выполнения задачи необходимо передать как сформированную таблицу, так и исходники скрипта.
Требования:
Примерная структура SQL базы это 3 таблицы: companies (список компаний), owners (список учредителей), data (данные по выручке и прибыли за разные годы).
Представить вывод данных вот в такую таблицу по идее должно получиться 100-300 тыс записей.
Итоговую таблицу отдавать в формате XLSX.
После выполнения задачи необходимо передать как сформированную таблицу, так и исходники скрипта.
Требования:
- База данных PostgreSQL
- Бизнес-логика PHP или NodeJS или Python (на выбор исполнителя)
- Интерфейс отсутствует, выводом служит таблица