Пасинг библиотеки - 650 000 книг
Мне нужно спарсить архив библиотеки flibusta.isСоставить базу книг, и существительных в этих книгах.
Архив библиотеки тут http://flibusta.is/node/64756Базу создать на моем сервереСрока 5 дней.
Интересны только книги формата fb2/fb2.zipКниги нужны на русском языкеСтихи и словари не нужны
Результат нужен в виде базы данных структуры:
две таблицы
Книги: ИД, Автор + названиеСлова(существителные}: ИД, Слово, количество этих слов, ИД книги