Парсинг с ВК по API
Необходимо написать на Python парсер ВК по официальному API.
Необходимо получать новости по запросу.
Пример УРЛ: https://vk.com/search/statuses?c%5Bq%5D=%D0%BA%D0%...
У ВК есть для этого специальный метод.
У каждой новости получаем:
- ссылку на пост
- описание
- количество просмотров
- количество лайков
- ссылку на аккаунт, его опубликовавший
- аватарку аккаунта
Проверяем, чтобы в описании поста содержалось наше ключевое слово (иногда ВК подсовывает левые результаты).
Если в описании ключевое слово есть, то парсим саму группу (автора).
Там получаем количество подписчиков.
Сохраняем в БД Mysql всю информацию.
Скрипт должен быстро работать и обрабатывать большое количество поисковых запросов.
Насколько я знаю, при использовании этого метода необходима авторизация через токен. Скрипт должен сам получать нужный токен по логину и паролю. Также нужно предусмотреть параллельную работу с несколькими аккаунтами.
---------
Также вопрос, можно ли реализовать парсинг клипов?
Необходимо получать новости по запросу.
Пример УРЛ: https://vk.com/search/statuses?c%5Bq%5D=%D0%BA%D0%...
У ВК есть для этого специальный метод.
У каждой новости получаем:
- ссылку на пост
- описание
- количество просмотров
- количество лайков
- ссылку на аккаунт, его опубликовавший
- аватарку аккаунта
Проверяем, чтобы в описании поста содержалось наше ключевое слово (иногда ВК подсовывает левые результаты).
Если в описании ключевое слово есть, то парсим саму группу (автора).
Там получаем количество подписчиков.
Сохраняем в БД Mysql всю информацию.
Скрипт должен быстро работать и обрабатывать большое количество поисковых запросов.
Насколько я знаю, при использовании этого метода необходима авторизация через токен. Скрипт должен сам получать нужный токен по логину и паролю. Также нужно предусмотреть параллельную работу с несколькими аккаунтами.
---------
Также вопрос, можно ли реализовать парсинг клипов?