scrapy框架开发爬虫实战——css语法

编程知识更新时间:2023-04-06 06:55:21

css选择器

CSS即层叠样式表，其选择器是一种用来确定HTML文档中某部分位置的语言。
CSS选择器的语法比XPath更简单一些，但功能不如XPath强大。实际上，当我们调用Selector对象的CSS方法时，在其内部会使
用Python库cssselect将CSS选择器表达式翻译成XPath表达式，然后调用Selector对象的XPATH方法。

css基本语法表

css用法例子

E：选中E元素。

# 选中所有的img
>>> response.css('img')

E1,E2：选中E1和E2元素。

# 选中所有base和title
>>> response.css('base,title')

E1 E2：选中E1后代元素中的E2元素。

# div 后代中的img
>>> response.css('div img')

E1>E2：选中E1子元素中的E2元素

# body 子元素中的div
>>> response.css('body>div')

[ATTR]：选中包含ATTR属性的元素。

# 选中包含style属性的元素
>>> response.css('[style]')

[ATTR=VALUE]：选中包含ATTR属性且值为VALUE的元素。

# 选中属性id值为images-1的元素
>>> response.css('[id=images-1]')

E:nth-child(n)：选中E元素，且该元素必须是其父元素的第n个子元素。

# 选中每个div的第一个a
>>> response.css('div>a:nth-child(1)')

# 选中第二个div的第一个a
>>> response.css('div:nth-child(2)>a:nth-child(1)')

E:first-child：选中E元素，该元素必须是其父元素的第一个子元素。
E:last-child：选中E元素，该元素必须是其父元素的倒数第一个子元素。

# 选中第一个div的最后一个a
>>> response.css('div:first-child>a:last-child')

E::text：选中E元素的文本节点。

# 选中所有a的文本
>>> sel = response.css('a::text')

更多详细内容可以参看CSS选择器文档： https://www.w3/TR/css3-selectors/

更多推荐

scrapy框架开发爬虫实战——css语法

本文发布于:2023-04-06 06:55:00，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/3a36c83dc45fee3231e5a0cdb6b1ce9f.html

爬虫语法实战框架 scrapy

上一篇： css怎么做响应式布局,用CSS实现响应式布局
下一篇：返回列表

发布评论取消回复

评论列表（有 0 条评论）

scrapy框架开发爬虫实战——css语法

css选择器

css基本语法表

css用法例子

发布评论取消回复

最近发表

热门文章

标签列表

scrapy框架开发爬虫实战——css语法

css选择器

css基本语法表

css用法例子

相关文章

发布评论取消回复

最近发表

热门文章

标签列表