
6

Python爬虫编程思想(49):Beautiful Soup环境搭建
source link: https://blog.csdn.net/nokiaguy/article/details/120692121
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

Python爬虫编程思想(49):Beautiful Soup环境搭建
专栏收录该内容
50 篇文章
2 订阅
¥29.90
¥99.00
目录
1. Beautiful Soup简介
Beautiful Soup是一个强大的基于Python语言的XML和HTML解析库,可以用它来方便地从网页中提取数据,那么Beautiful Soup到底有什么功能呢?先看一段对Beautiful Soup的标准解释。
Beautiful Soup提供了一些简单的函数来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,由于Beautiful Soup非常简单,所以可以用非常少的代码写出一个完整的HTML分析程序,再加上requests库,可以写出非常简洁且强大的爬虫应用。
Beautiful Soup自动将输入的文档转换为Unicode编码,输出文档转换为UTF-8编码,所以在使用Beautiful Soup的过程中并不需要考虑编码问题,除非文档没有指定编码方式,这时只需要指出输入文档的编码方式即可。
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK