Scrapy返回空列表问题的解决办法
今天学习Scrapy框架时,调用下面的方法发送请求时返回的居然是一个空列表。
-
import scrapy
-
-
-
class Test01Spider(scrapy.Spider):
-
name = "test01"
-
allowed_domains = ["https://baike.百度.com/item/百度/6699?fromModule=lemma_search-box"]
-
start_urls = ["https://baike.百度.com/item/百度/6699?fromModule=lemma_search-box"]
-
-
-
def parse(self, response):
-
pass
-
get_text = response.xpath("/html/body/div[3]/div[2]/div/div[1]/div[4]/div[3]/text()").extract()
-
print(get_text)
在我尝试很多遍,并且检查发现xpath没错的情况下还是返回空列表。
后面上网搜了很多解决方案,发现是头信息里的cookie没有设置,Scrapy默认用了它内部设置的头信息。于是对setting里面的内容进行修改就可以了 :
1、取消注释COOKIES_ENABLE = False:
2、取消注释DEFAULT_REQUEST_HEADERS并且增加Cookie信息:
这样再请求就可以获取到相应的信息了:
这篇好文章是转载于:学新通技术网
- 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
- 本站站名: 学新通技术网
- 本文地址: /boutique/detail/tanhfighia
系列文章
更多
同类精品
更多
-
photoshop保存的图片太大微信发不了怎么办
PHP中文网 06-15 -
Android 11 保存文件到外部存储,并分享文件
Luke 10-12 -
《学习通》视频自动暂停处理方法
HelloWorld317 07-05 -
word里面弄一个表格后上面的标题会跑到下面怎么办
PHP中文网 06-20 -
photoshop扩展功能面板显示灰色怎么办
PHP中文网 06-14 -
微信公众号没有声音提示怎么办
PHP中文网 03-31 -
excel下划线不显示怎么办
PHP中文网 06-23 -
excel打印预览压线压字怎么办
PHP中文网 06-22 -
怎样阻止微信小程序自动打开
PHP中文网 06-13 -
TikTok加速器哪个好免费的TK加速器推荐
TK小达人 10-01