• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

scrapy数据没办法导出的几种情况

武飞扬头像
weixin_45753080
帮助2

控制台正常输出爬取结果但不生成导出文件

(1)程序中引入了scrapy.cmdline.execute导致无法导出

  1.  
    from scrapy.cmdline import execute
  2.  
     
  3.  
    """
  4.  
    代码段
  5.  
    """
  6.  
     
  7.  
    execute(['scrapy', "crawl", "xxx_spider"])

解决办法:execute用来debug,当命令行执行命令时删掉,否则不会导出数据。

控制台不输出爬取结果,生成导出文件但没有数据

(1)items程序中字段出现问题

  1.  
    # items.py
  2.  
     
  3.  
    import scrapy
  4.  
     
  5.  
     
  6.  
    class Item(scrapy.Item):
  7.  
    # define the fields for your item here like:
  8.  
    # name = scrapy.Field()
  9.  
    company_regions = scrapy.Field() #公司区域
  10.  
    company_name = scrapy.Field() #公司名称
  11.  
    # company_description = scrapy.Field() #公司介绍
  12.  
    company_url = scrapy.Field() #网站地址
  1.  
    # xx_spider.py
  2.  
     
  3.  
    """
  4.  
    代码段
  5.  
    """
  6.  
    huangye_item['company_region'] ......
  7.  
    ......

解决办法:字段名保持一致

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhgcefge
系列文章
更多 icon
同类精品
更多 icon
继续加载