【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）-白红宇

【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）

阅读量：669 次

发布时间：2019-03-15

本文共 826 字，大约阅读时间需要 2 分钟。

第二种方式：参考链接：

pycharm调试scrapy常用的命令配置：

scrapy crawl <scrapy_name> （scrapy_name不是文件名，而是Spider的属性name的值）

scrapy runspider scrapy_first/spider/book.py

第一种模式（常用模式）.使用scrapy.cmdline的execute方法

首先，在项目文件scrapy.cfg的同级建立main.py文件（注意，必须是同级建立），在其中键入如下代码：

在其余爬虫文件中设置断点后，运行main.py,即可实现在pycharm中的调试。

from scrapy.cmdline import executeimport sysimport ossys.path.append(os.path.dirname(os.path.abspath(__file__)))单文件调试模式一：runspider+需要执行的spider的name.py文件execute(['scrapy', 'runspider', 'scrapy_first/spiders/book.py'])单文件调试模式二：crawl+需要执行的spider_name！！这里的spider_name不是文件名,而是继承scrapy.spiders.Spider子类的name属性名字(必须是唯一的)# execute(['scrapy', 'crawl', "spider_name"])execute(['scrapy', 'crawl', 'test'])

class Test1Spider(Spider):    name属性就是spider_name,【scrapy crawl spider_name】执行的文件名(必须是唯一)    name = 'test'     def parse(self, response):        pass

转载地址：http://pimmz.baihongyu.com/

你可能感兴趣的文章

No resource identifier found for attribute 'srcCompat' in package的解决办法

查看>>

no session found for current thread

查看>>

No static resource favicon.ico.

查看>>

no such file or directory AndroidManifest.xml

查看>>

No toolchains found in the NDK toolchains folder for ABI with prefix: mips64el-linux-android

NO32 网络层次及OSI7层模型--TCP三次握手四次断开--子网划分

查看>>

NOAA（美国海洋和大气管理局）气象数据获取与POI点数据获取

查看>>

NoClassDefFoundError: org/springframework/boot/context/properties/ConfigurationBeanFactoryMetadata

Node JS： < 一> 初识Node JS

查看>>

Node JS： < 二> Node JS例子解析

查看>>

Node Sass does not yet support your current environment: Linux 64-bit with Unsupported runtime（93）解决

查看>>

Node Sass does not yet support your current environment: Windows 64-bit with Unsupported runtime（72）

查看>>

Node 裁切图片的方法

查看>>

node+express+mysql 实现登陆注册

查看>>

Node+Express连接mysql实现增删改查

查看>>