书网

xpath+多进程爬取全书网纯爱耽美类别的所有小说。

# 需要的库 import requests from lxml import etree from multiprocessing import pool import os # 请求头 headers = { 'user-agent': 'mozilla/5.0 (windows nt 6.1; wow64) applewebkit/537.36 (khtml, l...
2022-10-17技术教程书网,小说,类别,进程
使用scrapy框架爬取全书网书籍信息。

爬取的内容：书籍名称，作者名称，书籍简介，全书网5041页大约16万条数据,写入mysql数据库和.txt文件 1，创建scrapy项目 scrapy startproject numberone 2，创建爬虫主程序 cd numberone scrapy genspider quans...
2022-10-17技术教程scrapy,书籍,书网,信息,框架