Python网络爬虫与信息提取（17）—— 题库爬取与整理+下载答案

article/2025/11/8 13:11:56

前言

上一节实现了题目的整理，没整理答案是不完整的，所以这一节加上答案的爬取。
上一节地址：Python网络爬虫与信息提取（16）—— 题库爬取与整理

效果

思路

爬答案有点难搞，像这种题库的答案都是要么要会员，要么要登陆账号才能看答案，这种就比较费劲了，解决方案有两种：

用控制台看点击查看答案会请求哪些接口，然后看看发送请求的格式以及返回response的格式来模拟查看答案。这个方法比较麻烦，因为你不是网站的开发人员，你需要猜他是个什么情况，而且有些会对数据加密，更看不出来了…
第二种比较万精油，控制浏览器自动化的处理然后检索数据就好了。

难点

答案的存储格式不唯一，因为题型有单选、多选、简答和填空，整理答案比较麻烦
网站有反扒，访问快了网页会404，再快了会封IP
网站的答案要登录才能看到，selenium每次控制浏览器会新起一个这样需要重新登陆，可以控制指定端口的谷歌浏览器来解决这个问题。

解决

http://chatgpt.dhexx.cn/article/kycv5a7M.shtml

相关文章

Python 网络爬虫及数据可视化

Python 网络爬虫及数据可视化

网络爬虫及数据可视化 1 项目背景1.1Python的优势1.2网络爬虫1.3数据可视化1.4Python环境介绍1.4.1简介1.4.2特点 1.5扩展库介绍1.5.1安装模块1.5.2主要模块介绍 2 需求分析2.1 网络爬虫需求2.2 数据可视化需求 3 总体设计3.1 网页分析3.2 数据可视化设计 4 方案实施4.1 网络爬…

阅读更多...

python网络爬虫权威指南百度云-Python网络爬虫权威指南 PDF 第2版

python网络爬虫权威指南百度云-Python网络爬虫权威指南 PDF 第2版

给大家带来的一篇关于Python爬虫相关的电子书资源，介绍了关于Python、网络爬虫方面的内容，本书是由人民邮电出版社出版，格式为PDF，资源大小5.54 MB，瑞安米切尔编写，目前豆瓣、亚马逊、当当、京东等电子书综…

阅读更多...

【python】基础网络爬虫教程

【python】基础网络爬虫教程

1.爬虫目的用通俗易懂的话来说,是对多种类型数据(如文字,图片,音频,视频等)进行批量式的采集与存储。本文为个人一些学习心得,举例对网页进行信息爬取操作,使用python中基础的方法进行爬取,便于理解学习。2.爬虫准备需要对python有一些基础,对字符串,列表,循环结构等有了解。…

阅读更多...

python网络爬虫及数据可视化

python网络爬虫及数据可视化

广东某学校的期末python作业一、设计内容及要求设计内容：对中国大学专业排名网站中2021年，计算机科学与技术专业，进行数据爬取和数据可视化。 URL： https://www.shanghairanking.cn/rankings/bcmr/2021/080901 设计要求&am…

阅读更多...

python网络爬虫的流程图_Python 网络爬虫程序架构及运行流程

python网络爬虫的流程图_Python 网络爬虫程序架构及运行流程

1 前言 Python开发网络爬虫获取网页数据的基本流程为：发起请求通过URL向服务器发起request请求，请求可以包含额外的header信息。获取响应内容服务器正常响应，将会收到一个response，即为所请求的网页内容，或许包含HTML，Json字符串或者二进制的数据（视频、图片）…

阅读更多...

python网络爬虫－－网页登录

python网络爬虫－－网页登录

１、前言主要用到python的selenium库，通过模仿浏览器行为定位登录所需的标签位置，实现网页登录功能．最后在码云(gitee)上测试自动登录功能． 2、selenium定位网页元素关于selenium的使用前准备可以看到我之前的一篇…

阅读更多...

python网络爬虫可以干什么,python网络爬虫有什么用

python网络爬虫可以干什么,python网络爬虫有什么用

python爬虫能做什么世界上80%的爬虫是基于Python开发的，学好爬虫技能，可为后续的大数据分析、挖掘、机器学习等提供重要的数据源。什么是爬虫？ （推荐学习：Python视频教程）网络爬虫（又被称为网…

阅读更多...

python网络爬虫技术课后答案_尔雅《Python网络爬虫技术（2020年秋季学期）》网课答案...

python网络爬虫技术课后答案_尔雅《Python网络爬虫技术（2020年秋季学期）》网课答案...

尔雅《Python网络爬虫技术(2020年秋季学期)》网课答案法律的一般含义是() 答：法律是由国家创制并保证实施的行为规范下列属于急症手术的是答：肝破裂脾气统摄血液的功能，实际上是()的固摄作用的体现答：气中国古代南北争战中&…

阅读更多...

（一）python网络爬虫（理论+实战）——爬虫的初步认识

（一）python网络爬虫（理论+实战）——爬虫的初步认识

小白都能学会的python网络爬虫专栏： https://blog.csdn.net/c1007857613/category_12127982.html 序言本人从事爬虫相关工作已8年以上，从一个小白到能够熟练使用爬虫，中间也走了些弯路，希望以自身的学习经历，让大家能…

阅读更多...

Python网络爬虫经典书籍推荐

Python网络爬虫经典书籍推荐

1. Python编程：从入门到实践 - 2016 本书是一本针对所有层次的Python 读者而作的Python 入门书。全书分两部分：第一部分介绍用Python 编程所必须了解的基本概念，包括matplotlib、NumPy 和Pygal 等强大的Python 库和工具介绍，以及…

阅读更多...

（二）python网络爬虫（理论+实战）——爬虫分类和基本流程

（二）python网络爬虫（理论+实战）——爬虫分类和基本流程

小白都能学会的python网络爬虫专栏： https://blog.csdn.net/c1007857613/category_12127982.html 序言本人从事爬虫相关工作已8年以上，从一个小白到能够熟练使用爬虫，中间也走了些弯路，希望以自身的学习经历，让大家能…

阅读更多...

python网络爬虫实验报告_Python网络爬虫实例讲解

python网络爬虫实验报告_Python网络爬虫实例讲解

聊一聊Python与网络爬虫。 1、爬虫的定义爬虫：自动抓取互联网数据的程序。 2、爬虫的主要框架爬虫程序的主要框架如上图所示，爬虫调度端通过URL管理器获取待爬取的URL链接，若URL管理器中存在待爬取的URL链接，爬虫调度器调用网…

阅读更多...

Python网络爬虫简介与环境配置

Python网络爬虫简介与环境配置

第一章 Python网络爬虫简介与环境配置 1.1 网络爬虫简介随着互联网的快速发展越来越多的信息被发布到互联网上，这些信息被嵌入到各种各样的网页结构及样式中。虽然搜索引擎可以辅助用户搜索这些网页信息，但是通用的搜索引擎的目标是尽可能覆盖全网络&…

阅读更多...

五分钟学会Python网络爬虫

五分钟学会Python网络爬虫

但不管怎样，爬虫技术是无罪的，还是值得我们开发人员去学习了解一下的。在学习之前，我们还是要先了解一下相关概念。什么是爬虫网络爬虫：又被称为网页蜘蛛，网络机器人，是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本。大数据时代，要进行数据分析，首先…

阅读更多...

python爬虫简介

python爬虫简介

python爬虫是收集互联网数据的常用工具，近年来随着互联网的发展而快速发展。使用网络爬虫爬取网络数据首先要了解网络概念和主要分类，各类爬虫的系统结构、运作方式，常用策略，以及主要的应用场景，同时，出于…

阅读更多...

python爬虫入门教程(非常详细),超级简单的Python爬虫教程

python爬虫入门教程(非常详细),超级简单的Python爬虫教程

一、基础入门 1.1什么是爬虫爬虫(spider，又网络爬虫)，是指向网站/网络发起请求，获取资源后分析并提取有用数据的程序。从技术层面来说就是通过程序模拟浏览器请求站点的行为，把站点返回的HTML代码/JSON数据/二进制数据&…

阅读更多...

python简单实现网络爬虫

python简单实现网络爬虫

前言在这一篇博客中，我会用python来实现一个简单的网络爬虫。简单的爬取一下一些音乐网站、小说网站的标题、关键字还有摘要！所以这个爬虫并不是万能爬，只针对符合特定规则的网站使用。（只使用于爬标题、关键字和摘要的&#xff…

阅读更多...

【海岛吉他1】全面认识吉他谱

【海岛吉他1】全面认识吉他谱

调号拍号 1G 4/4 休止符：

阅读更多...

【海岛吉他2】一网打尽吉他基础乐理

【海岛吉他2】一网打尽吉他基础乐理

阅读更多...

新手小白学吉他，如何掌握基础快速入门

新手小白学吉他，如何掌握基础快速入门

吉他弹唱是非常快乐，非常浪漫，非常酷的一件事。俗话说“不怕流氓有文化，就怕流氓有吉他”，大家也都知道吉他是把妹的神器。相信很多人的床底下，角落里，都扔了一把布满了灰尘的吉他，因为学不会而…

阅读更多...

推荐文章