当前位置：首页 > 编程笔记 > 正文

已解决

04、Python 爬取免费小说思路

来自网友在路上 167867提问提问时间：2023-10-22 23:08:57阅读次数： 67

最佳答案问答题库678位专家为你答疑解惑

Python 爬取免费小说思路
- 代码解析
- - 爬取东西基本的四行代码：
  - - user-agent
  - 安装模块
  - 从 bs4 导入 BeautifulSoup ，
  - 查询某个标签开头的数据
  - 筛选
  - 遍历
  - - 获取小说的章节名称
    - 每章小说的链接
    - 获取请求网址的响应
    - 获取小说的内容
  - 筛选内容
  - - 整理内容
  - 爬取下载到指定文件夹
完整代码：

Python 爬取免费小说思路

代码解析

爬取东西基本的四行代码：

在这里插入图片描述

user-agent

在这里插入图片描述

安装模块

cmd 打开小黑窗，执行安装模块命令

模块的作用：完成具体的某一个功能

pip install bs4 -i https://mirrors.aliyun.com/pypi/simple/pip install lxml -i https://mirrors.aliyun.com/pypi/simple/

从 bs4 导入 BeautifulSoup ，

把 res.text 解析成 ‘lxml’ ，相当于把文本原本 text的格式整理成 lxml格式
在这里插入图片描述

查询某个标签开头的数据

解释这行代码的作用：

soup.find_all('x')-->  参数: 'x'   -->   就能查找获取所有 <x> xxxxxx </x> 的数据

在这里插入图片描述

筛选

筛选小说：思路是从大到小筛选，实际先筛选小的，找不到再扩大范围筛选

查看全文

99%的人还看了

相似问题

CATTI考试，拿证必看篇：CATTI备考，你不可不知的东西都在这里！

猜你感兴趣

版权申明

本文"04、Python 爬取免费小说思路"：http://eshow365.cn/6-21977-0.html 内容来自互联网，请自行判断内容的正确性。如有侵权请联系我们，立即删除！

晴海小常识分享

晴海小常识分享

04、Python 爬取免费小说思路

最佳答案问答题库678位专家为你答疑解惑

目录

Python 爬取免费小说思路

代码解析

爬取东西基本的四行代码：

user-agent

安装模块

从 bs4 导入 BeautifulSoup ，

查询某个标签开头的数据

筛选

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

晴海小常识分享

晴海小常识分享

04、Python 爬取免费小说思路

最佳答案 问答题库678位专家为你答疑解惑

目录

Python 爬取免费小说思路

代码解析

爬取东西基本的四行代码：

user-agent

安装模块

从 bs4 导入 BeautifulSoup ，

查询某个标签开头的数据

筛选

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

最佳答案问答题库678位专家为你答疑解惑