Python爬虫编程思想(64): 在pyquery中使用CSS选择器
source link: https://blog.csdn.net/nokiaguy/article/details/121069577
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
Python爬虫编程思想(64): 在pyquery中使用CSS选择器
pyquery的CSS选择器用于指定CSS代码,并通过CSS代码选取HTML文档中对应的节点。创建一个CSS选择器需要创建一个PyQuery对象,PyQuery类的构造方法需要传入一个HTML文档(可以是字符串、URL或文件形式)。由于PyQuery类重载了函数调用运算符(实现了__call__函数),所以可以按下面的代码使用PyQuery类的实例。
下面的例子用PyQuery对象解析了字符串形式的HTML代码和京东商城首页的HTML代码,并通过CSS选择器提取字符串形式的HTML代码中的节点信息,以及京东商城首页导航条链接的文本。
京东商城导航条的样式如图1所示。我们要提取的就是这一行文本,如“秒杀”、“优惠券”等。
Recommend
-
3
Python爬虫编程思想(56):Beautiful Soup方法选择器之find方法 ...
-
9
Python爬虫编程思想(55):Beautiful Soup方法选择器之find_all方法 ...
-
5
Python爬虫编程思想(57): Beautiful Soup中CSS选择器的基本用法 ...
-
3
Python爬虫编程思想(59): 用Beautiful Soup CSS选择器获取属性值与文本 ...
-
3
Python爬虫编程思想(58): 用Beautiful Soup CSS选择器嵌套选择节点 ...
-
4
目录 1 安装pyquery
-
4
Python爬虫编程思想(66): 使用pyquery获取节点信息 ...
-
3
Python爬虫编程思想(65): 使用pyquery查找节点 ...
-
9
Python爬虫编程思想(67): 使用pyquery修改节点_一个被知识诅咒的人-CSDN博客
-
3
Python爬虫编程思想(68): 在pyquery中使用伪类选择器
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK