Python爬虫编程思想（91）：项目实战--支持搜索功能的图片爬虫

2 years ago

source link: https://blog.csdn.net/nokiaguy/article/details/121666307
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

Python爬虫编程思想（91）：项目实战--支持搜索功能的图片爬虫

本文会使用requests库抓取百度图像搜索API返回的JSON数据，并根据图像URL下载图像文件。由于API返回的是JSON格式的数据，所以不需要使用任何HTML分析库，只需要将数据转换为JSON对象即可。

抓取API数据的第一步就是要确定网站的数据是否是通过异步的方式获取的。判断方式有多种，如果是显示图像的网站，而且是在一页上显示所有的图像，只需要将网页不断向下拉，如果在浏览器页面，随着滚动条向下拉动，不断显示新的图像，那么可以肯定，这个网址的图片数据是通过异步获取的。通常会首先获取一个包含图片信息的列表（JSON格式），然后会从列表中提取出图像相关的信息，如图像名称，图像URL等，最后会将这个新的图像显示在页面上。

现在来分析百度图像搜索，读者可以通过http://image.baidu.com进入百度图像搜索首页，在搜索框中输入一个关键字，如“外星人”。会搜索出类似图13-9所示的结果。

Recommend

Python爬虫编程思想（91）：项目实战--支持搜索功能的图片爬虫

Python爬虫编程思想（91）：项目实战--支持搜索功能的图片爬虫

Recommend

和 .project 文件说“再见”—— VS Code Java 1.1.0 背后的故事

FFmpeg filters 分析：af_volumedetect

Glassnode：加密市场暴跌致BTC未平仓合约创今年第二大单日变化记录

SBI控股子公司与瑞士数字交易所SIX合作，将于新加坡成立加密合资企业

wordpress 忘记密码的一种解决方法

钟薛高日记短片，充满了童稚的烟火气

俄伊尔库茨克供电公司提高加密货币矿场电价，并对私宅挖矿者提起诉讼

WePiggy 已正式登陆 Moonriver 主网

Bangle.js App Loader

Two (3!) new old bitmap fonts

About Joyk