采集网页数据保存到MYSQL数据库

article/2025/11/10 23:52:07

一、直接采集一个本地网页文件

1.创建一个网页文件date413.html(注:文件的路径后面还会用到)

2.网页文件date413.html中的内容为:

<html>
<head><title>搜索指数</title>
</head>
<body><table><tr><td>排名</td><td>关键词</td><td>搜索指数</td></tr><tr><td>1</td><td>大数据</td><td>187767</td></tr><tr><td>2</td><td>云计算</td><td>178856</td></tr><tr><td>3</td><td>物联网</td><td>122376</td></tr></table>
</body>
</html>

二、 在Windows操作系统中启动MySQL服务进程,创建webdb数据库和search_index表

1.win+r打开小黑窗---->输入cmd

2.输入mysql -u root -p  密码是自己安装mysql时设置的

(注:显示图中的内容表示成功进入mysql命令行窗口)

3.创建webdb数据库和选择使用webdb数据库

create database webdb;

use webdb;

 4.创建search_index表

create table search_index(id int,keyword char(20) , number int);

 三、在PyCharm 中编写网络爬虫程序,读取网页内容进行解析,并把解析后的数据保存到mysql数据库中

 (注:这里需要填你前面创建的网页文件的地址)

import requests
from bs4 import BeautifulSoup
# 读取本地HTML文档
def get_html():path = 'D:/vue/vueproject/date413.html'htmlfile = open(path,'r',encoding='utf-8')html = htmlfile.read()return html
# 解析HTML文档
def parse_html(html):soup = BeautifulSoup(html,'html.parser')all_tr = soup.find_all('tr')[1:]all_tr_list = []info_list = []for i in range(len(all_tr)):all_tr_list.append(all_tr[i])for element in all_tr_list:all_td = element.find_all('td')all_td_list = []for j in range(len(all_td)):all_td_list.append(all_td[j].string)info_list.append(all_td_list)return info_list
# 保存数据
def save_mysql(info_list):import pymysql.cursorsfor item in info_list:# 连接数据库connect = pymysql.Connect(host='localhost',port=3306,user='root',passwd='123456',db='webdb',charset='utf8')# 获取游标cursor = connect.cursor()# 插入数据id = int(item[0])keyword = item[1]number = int(item[2])sql = "insert into search_index(id,keyword,number) values ('%d', '%s','%d')"data = (id,keyword,number)cursor.execute(sql % data)connect.commit()print('成功插入数据')# 关闭数据库连接connect.close()if __name__ == '__main__':html = get_html()info_list = parse_html(html)save_mysql(info_list)


四、运行

1.在PyCharm 中单机右键Run(运行)

控制台出现3次成功插入数据

2.在mysql命令行窗口中查看数据

select * from search_index;

(看到有三条数据被成功插入了数据库,那么恭喜你,表示我们成功了!)


http://chatgpt.dhexx.cn/article/7fdRWWFA.shtml

相关文章

用简单,易懂的方法将数据库和网页连接起来(例:登陆注册页面)

PHP技术&#xff0c;远比用java写代码连接数据库简单得多&#xff0c;下面看我的详细介绍&#xff1a; 1.首先要下载&#xff1a;phpstudy_pro&#xff08;关注我可以免费下载哦&#xff01;&#xff09; 2.然后打开phpstudy_pro&#xff0c;启动Apache服务器&#xff08;每次…

网页展示数据库内容

目的&#xff1a;写一个JSP访问Access数据库的user表&#xff0c;将所有的记录显示出来&#xff1b;ODBC数据源名为test&#xff0c;驱动类名为&#xff1a;“driverClassNamecom.mysql.jdbc.Driverr”&#xff0c;连接数据库的url为&#xff1a;”urljdbc:mysql://localhost:3…

[VS]网页连接数据库

工具&#xff1a; 1、Visual Studio(我使用的是vs2019) 2、SQL server(我使用的是sql2008) 3、网页运行框架&#xff1a;.Net2.0 目录 一、网站以windows身份验证连接数据库 二、网站以sql server身份验证连接数据库 三、使用工具Visual Studio中自带的连接数据库功能 一…

网页开发(十四)—数据库管理

书接上回&#xff1a; 7、MySQL指令 MySQL普通认知数据库文件夹数据表文件&#xff08;Excel文件&#xff09; 7.1 数据库管理&#xff08;文件夹&#xff09; &#xff08;1&#xff09;查看已有的数据库&#xff08;文件夹&#xff09;&#xff1a;show databases; &…

每周一品 · 音圈电机(VCM)中的磁性材料

音圈电机 (Voice coil motor, VCM) 是一种特殊形式的直驱电机&#xff0c;能将电能直接转化为直线运动机械能&#xff0c;其原理是在均匀气隙磁场中放入一个圆筒绕组&#xff0c;绕组通电产生磁场&#xff0c;带动负载设备做直线往复运动&#xff0c;改变电流的强弱和流向&…

VCM音圈马达的一些特点

VCM(Voice Coil Motor)&#xff1a;中文名称为音圈马达&#xff0c;亦称音圈电机&#xff0c;原理是在一个固定的磁场内&#xff0c;通过改变VCM线圈电流的大小&#xff0c;来控制VCM马达移动的位置&#xff0c;从而改变镜片之间的距离来达到对焦的功能。基本上在所有手机上均有…

vcm驱动芯片原理_每周一品 · 音圈电机(VCM)中的磁性材料

音圈电机 (Voice coil motor, VCM) 是一种特殊形式的直驱电机&#xff0c;能将电能直接转化为直线运动机械能&#xff0c;其原理是在均匀气隙磁场中放入一个圆筒绕组&#xff0c;绕组通电产生磁场&#xff0c;带动负载设备做直线往复运动&#xff0c;改变电流的强弱和流向&…

Camera基础知识

物理结构 一、手机Camerade的物理结构 FPC&#xff08;flexible printed circuit&#xff09;可挠性印刷电路板Sensor图像传感器IR红外i滤波片holder基座lens镜头 通常&#xff0c;一个摄像头硬件上包括5个部分&#xff1a;外壳&#xff08;马达&#xff09;、镜头&#xff…

MPEG VCM

传统是视频编码是针对人眼视觉进行优化的&#xff0c;目的是在保持人的主观失真不增加的情况下降低码率。而现在越来越多的视频需要进行机器分析&#xff0c;而人只需要看机器分析的结果。因此MPEG成立VCM&#xff08;Video Coding for Machines&#xff09;工作组探索新的标准…

VCM基本原理和主要性能指标

VCM(Voice Coil Motor)音圈马达是一种将电能转化为机械能的装置,实现直线型及有限摆角的运动,实现运动的力来源于通电线圈在磁场中受到的作用力。VCM 的精确控制需要通过外部的驱动IC 来实现。按功能分为开环VCM,中置VCM,闭环VCM,光学防抖VCM。 VCM(Voice Coil Motor)音…

camera基础知识(1)

目录 camera module 镜头lens 光圈快门 音圈马达VCM 滤光片 image sensor: 摄像头工作原理大致如下 camera作为android系统中庞大的一个模块之一&#xff0c;camera框架包含的知识十分多&#xff0c;作为一名camera工程师&#xff0c;我们不仅要熟悉代码&#xff0c;也要…

VCM绕线机的功能参数

VCM的全称是Voice Coil Motor&#xff0c;我们也叫音圈马达和音圈电机&#xff0c;是手机中比较常用的配件&#xff0c;也广泛应用于电脑、网络摄像头、扫描仪等&#xff0c;因为原理和扬声器类似&#xff0c;所以叫做音圈电机。它与我们常见的电机不一样&#xff0c;具有结构简…

【camera】1. 相机硬件组成

相机—光照测量设备 图像—辐射能量测量 Lens:镜头 VCM:音圈马达 IR Filter:滤光片 Sensor:感光元件CCD\CMOS, Substrate PCB:基片电路 DSP(option):数字信号处理器 ISP(option):图像信号处理器 CCD 电耦合器件 CMOS 互补性金属氧化物半导体 无论是ccd还是cmos都是光…

VCM驱动IC--close loop

VCM驱动IC&#xff1a; 正从幕后走向台前 作为与VCM&#xff08;音圈马达&#xff09;匹配的driver IC一直被产业链当做一个小器件&#xff0c;故而默默无闻&#xff0c;较少为人所认知和谈论。其实小小的driver IC&#xff0c;是摄像模组实现自动对焦功能不可或缺的一部分…

vcm驱动芯片原理_技术科普 | 一文了解音圈马达的驱动原理

原标题:技术科普 | 一文了解音圈马达的驱动原理 第11期 庄子云: “鲲之大,不知其几千里也。化而为鸟,其名为鹏。鹏之背,不知其几千里也,怒而飞,其翼若垂天之云。”大鹏鸟展翅高飞借助的是风带来的动力。 可见,在一个运转的系统中,动力是多么的重要。我们的手机摄像头系…

手机相机接口介绍

原文来自公众号&#xff1a;工程师看海 相机是手机中非常重要的模组之一&#xff0c;已成为智能手机的标配&#xff0c;其按布局可以分为前摄和后摄&#xff0c;按功能可以分为自拍相机、主相机、超广角、长焦和微距等。 不同功能的相机有不同功能的结构和电气特性&#xff0c;…

音圈电机工作原理与直线电机的对比

图片来自&#xff1a;什么是音圈电机&#xff1f;如何工作的&#xff1f;如何应用于相机镜头调焦&#xff1f; - 知乎 目录 1. 什么是音圈&#xff1f; 2&#xff0e;音圈电机(VCM,Voice Coil Motor)结构及原理 2.1 音圈电机工作原理 2.2 音圈电机结构 2.3 音圈电机的特点 …

【转】VCM驱动IC--close loop

VCM驱动IC&#xff1a; 正从幕后走向台前 作为与VCM&#xff08;音圈马达&#xff09;匹配的driver IC一直被产业链当做一个小器件&#xff0c;故而默默无闻&#xff0c;较少为人所认知和谈论。其实小小的driver IC&#xff0c;是摄像模组实现自动对焦功能不可或缺的一部分…

Camera简介(一):摄像头模组CCM的结构和原理简述

我们常说的Sensor也就是图像传感器只是整个摄像头模组的一部分&#xff0c;主要负责将接收到的光信号转换成电信号&#xff0c;实际上整个摄像头模组(Camera Compact Module&#xff0c;CCM)由很多部分组成&#xff0c;除Sensor以外的其他模块会负责完成对焦、滤光、减震、数据…

【camera】【摄像头模组】摄像头模组简单介绍

摄像头模组 1. 摄像头介绍 摄像头模组的结构大致如下&#xff1a; camera模组工作原理&#xff1a;景物通过镜头lens生成光学图像信号投射到图像传感器image sensor表面上&#xff0c;由sensor感光像素点转换为电信号&#xff0c;经过图像传感器的A/D数模转换变为数字图像信号…