bootstrap菜鸟教程_中央农村工作会议精神内容_北京到安阳_大连网络营销咨询 from time import sleepclass WangyicrawlingDownloaderMiddleware:@classmethoddef from_crawler(cls, crawler):# This method is used by Scrapy to create your spiders.s = cls()crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)return sdef process_request(self, request, spider):return Nonedef process_response(self, request, response, spider):# 获得爬虫类中定义的浏览器对象bro = spider.bro# 判断请求对象中的url是不是在指定的列表中if request.url in spider.module_urls:# 使用selenium 对URL重新发起请求,获得动态数据bro.get(request.url)sleep(3)# 获得请求的 html数据html_data = bro.page_source# 重新封装响应对象(篡改)# 使用HtmlResponse() 类对响应数据进行封装 (需要导包)# 需要传入4个参数# url 参数为该响应对象的请求url# body 参数为修改后的响应数据体# encoding 参数为编码格式# request 为该响应对象对应的请求对象new_response = HtmlResponse(url=request.url, body=html_data, encoding='utf-8', request=request)# 将新的响应对象返回给爬虫主程序的数据封装方法return new_responseelse:# 如果不是要处理的URL,直接返回响应对象给爬虫主程序的数据封装方法return responsedef process_exception(self, request, exception, spider):passdef spider_opened(self, spider):spider.logger.info("Spider opened: %s" % spider.name)">

个性网页制作

客户管理系统技术、抖音壁纸小程序怎么赚钱、永久使用、不限域名、企点通

空间设计案例?

bootstrap菜鸟教程_中央农村工作会议精神内容_北京到安阳_大连网络营销咨询

商城图标摄影网站推荐知乎有谁知道哪个网站可以看兰州做网站哪家最好设计之家数字图书馆有哪些好网站制作公司注册公司的流程及所需材料设计制作心得体会150字宁波做网站价格最新免费源码网络科技有限公司注册资金普象工业设计成都网站设计公司推来客网站李沧做网站公司b2c电子商务企业有哪些微信公众号怎么创建社区怎样做国外推广的平台环境艺术设计公司排名最新国内新闻游戏开发需要什么专业贸易公司logo设计图片第二次疫情最新消息深圳这边建站的大型公司深圳企业网站建站平台企业信用信息公示系统江苏自建网站开店的优劣势深圳什么公司做网站好深圳建设工程信息网官网郑州注册公司代理软件开发培训学校机构微盟销氪

猜你喜欢

  • 友情链接:
  • c浏览器极速版 信息流广告投放工作内容 浙江疫情最新消息数据 中国现货交易平台 网站运营与维护论文 小游戏在线玩