0

Python爬虫编程思想(64): 在pyquery中使用CSS选择器

 2 years ago
source link: https://blog.csdn.net/nokiaguy/article/details/121069577
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Python爬虫编程思想(64): 在pyquery中使用CSS选择器

        pyquery的CSS选择器用于指定CSS代码,并通过CSS代码选取HTML文档中对应的节点。创建一个CSS选择器需要创建一个PyQuery对象,PyQuery类的构造方法需要传入一个HTML文档(可以是字符串、URL或文件形式)。由于PyQuery类重载了函数调用运算符(实现了__call__函数),所以可以按下面的代码使用PyQuery类的实例。

        下面的例子用PyQuery对象解析了字符串形式的HTML代码和京东商城首页的HTML代码,并通过CSS选择器提取字符串形式的HTML代码中的节点信息,以及京东商城首页导航条链接的文本。

        京东商城导航条的样式如图1所示。我们要提取的就是这一行文本,如“秒杀”、“优惠券”等。


Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK