2025年3月24日星期一甲辰(龙)年月廿三设为首页加入收藏

进入网站首页面

掌上城东书院
定制您的专属资源库
m.cdsy.xyz

掌上城东书院
随时随地，想看就看

关注我们

首页

您当前的位置：首页 > 计算机 > 软件应用 > 开发工具(IDE)

PyCharm调试运行Scrapy教程

时间：06-05来源：作者：点击数：48

一、使用scrapy创建一个项目

这里使用scrapy官方第一个示例

scrapy startproject tutorial

使用PyCharm打开项目，在tutorial/tutorial/spiders目录下创建quotes_spider.py文件并写入，以下代码

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"

    def start_requests(self):
        urls = [
            'http://quotes.toscrape.com/page/1/',
            'http://quotes.toscrape.com/page/2/',
        ]
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'quotes-%s.html' % page
        with open(filename, 'wb') as f:
            f.write(response.body)
        self.log('Saved file %s' % filename)

二、复制cmdline.py到项目主目录

找到scrapy下的cmdline.py文件（比如我这里是D:\Language\Miniconda3\envs\default\Lib\site-packages\scrapy\cmdline.py）

复制一份到tutorial项目的根目录下（scrapy.cfg文件的同一目录下）

三、编缉文件调试运行配置

Name--和上边创建的spider文件相同，我这里叫quotes_spider

Script path--选择当前项目下的cmdline.py，我这里是F:\PycharmProjects\tutorial\cmdline.py

Parameters--crawl+要调试运行的spider名称，我这里是crawl quotes

Working directory--填项目所在主目录，我这里是F:\PycharmProjects\tutorial

最后要注意点“Apply”，不要直接点“OK”

四、调示和运行演示

选择调试，程序成功停在断点处

选择运行，程序也成功通行

方便获取更多学习、工作、生活信息请关注本站微信公众号 城东书院微信服务号

城东书院微信服务号

城东书院微信订阅号

3

上一篇:Android Studio打包生成APK教程下一篇:Miniconda安装scrapy教程

推荐内容

高考生入学注意：这些大	【健康】纯净水、天然
14种竞赛生升学路径盘	excel后缀xls和xlsx有

相关内容

栏目更新

栏目热门

关于我们 | 联系我们 | 用户协议 | 广告服务 | 申请链接 | 网站地图 | 版权声明 | 用户留言 | 招聘信息 | 帮助中心 | 社区讨论 | 下载服务

中国文明网传播文明

Copyright ©2019-2024 CDSY Corporation, All Rights Reserved

城东书院^® CDSY.XYZ 版权所有湘ICP备19021508号-1 公安网备案

公安网备案

湘公网安备 43102202000103号

※学习、工作、生活信息平台※

天地万古，人生百年。生生世世、轮轮回回几个秋？期待已久，只为今朝，机缘斯地找。 —Google英文

本网大部分资源来源于会员上传，除本网组织的资源外，版权归原作者所有，如有侵犯版权，请立刻和本网联系并提供证据，本网将在三个工作日内改正。