博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
第三百四十节,Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器
阅读量:6494 次
发布时间:2019-06-24

本文共 554 字,大约阅读时间需要 1 分钟。

第三百四十节,Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器

 

css选择器

1、

 

2、

 

3、

 ::attr()获取元素属性,css选择器

::text获取标签文本

 

举例:

extract_first('')获取过滤后的数据,返回字符串,有一个默认参数,也就是如果没有数据默认是什么,一般我们设置为空字符串

extract()获取过滤后的数据,返回字符串列表

 

# -*- coding: utf-8 -*-import scrapyclass PachSpider(scrapy.Spider):    name = 'pach'    allowed_domains = ['blog.jobbole.com']    start_urls = ['http://blog.jobbole.com/all-posts/']    def parse(self, response):        asd = response.css('.archive-title::text').extract()  #这里也可以用extract_first('')获取返回字符串        # print(asd)        for i in asd:            print(i)

 

转载地址:http://eekyo.baihongyu.com/

你可能感兴趣的文章
mysql开启远程连接权限
查看>>
关于商米D1S,USB默认权限在关机后丢失的FAQ
查看>>
css3 text-transform变形动画
查看>>
scikit-learn中文api
查看>>
一个完整的大作业--广州市社会保障(市民)卡服务网
查看>>
迭代器和生成器
查看>>
STM32 内存管理实验
查看>>
python注释、脚本参数、字节码
查看>>
Vue 组件之间传值
查看>>
使用pupperlabs yum repo
查看>>
指向方法之委托(一)
查看>>
2013 Multi-University Training Contest 3 部分解题报告
查看>>
Linux 网桥配置命令:brctl
查看>>
jQuery中异步操作对象Deferred
查看>>
源码解析Android中View的measure量算过程
查看>>
MVC设计模式
查看>>
在团队项目遇到的问题及解决方法。
查看>>
springcloud demo---config-client
查看>>
Django设置联合唯一约束 -- migrate时报错处理
查看>>
Java LeetCode 1.Two Sum
查看>>