【python】采集每日必看黄色软件数据~

article/2025/9/22 12:15:30

前言

大家早好、午好、晚好吖 ❤ ~欢迎光临本文章

环境使用:

  • Python 3.8

  • Pycharm

模块使用:

  • requests >>> pip install requests

  • re

  • csv

安装模块:win + R 输入cmd 输入安装命令 pip install 模块名

如果出现爆红 可能是因为 网络连接超时 切换国内镜像源

基本思路:

  1. 明确需求:

    采集网站以及数据是什么?

    店铺数据

    PS: 一定要清楚, 数据是请求那个链接可以获取

    通过开发者工具进行抓包分析

    • 打开开发者工具: F12 / fn+F12 / 鼠标右键点击检查选择network

    • 点击第二页, 第一个数据包就是我们要的链接地址

      <通过关键词进行搜索,找到对应的数据包 [请求链接] >

代码怎么实现?

  1. 发送请求, 模拟浏览器对url地址发送请求 <为了得到数据>

  2. 获取数据, 获取服务器返回响应数据 --> response <得到所有数据>

  3. 解析数据, 提取我们想要的数据内容 <得到想要的数据>

  4. 保存数据, 保存表格文件

代码展示

导入模块

# 导入数据请求模块 --> 第三方模块, 需要安装 pip install requests
import requests
# 导入格式化输出模块
from pprint import pprint
# 导入csv模块
import csv

创建文件

f = open('烤肉.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['店名','评分','评论','店铺类型','商圈','人均','最低消费','经度','纬度','详情页',
])
csv_writer.writeheader()

“”"
1. 发送请求

模拟浏览器对url地址发送请求 <为了得到数据>

<Response [403]>

403 状态码 没有访问权限 一定要加防盗链

模拟浏览器 为了防止被反爬

cookies host referer UA

“”"
请求链接

url = 'https://*****/group/v4/poi/pcsearch/70?uuid=1191c166b23545adaef7.1679637144.1.0.0&userid=266252179&limit=32&offset=32&cateId=-1&q=%E7%83%A4%E8%82%89&token=AgEcI8MGJ-mKhr9oT4VY_zjPV_oFYDXfbo9sEAaWhz5Ud0ZxeKhBNbm--AOvOEMZfMX1X8atA5u22QAAAABsFwAA631DsS1KNwy05foi_83hOjAmFHyzNkrbtWhFRpR9MOAObuDNmNMpKOe8SdRaRJ_n'

伪装模拟 --> 请求头

headers = {# Referer 防盗链, 告诉服务器请求链接, 是从哪里跳转过来'Referer': 'https://*****/',# User-Agent 用户代理 表示浏览器基本身份信息'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}

发送请求

response = requests.get(url=url, headers=headers)
# <Response [403]>
print(response)

“”"

2. 获取数据

获取服务器返回响应数据 --> response <得到所有数据>

response.json() 获取响应json字典数据

3. 解析数据

提取我们想要的数据内容 <得到想要的数据>

字典取值 get

键值对取值 --> 根据冒号左边的内容[键], 提取冒号右边的内容[值]

Json字典数据, 一层一层提取

print(index) --> json数据, 呈现一行

pprint(index) --> json数据, 呈现多行 展开效果

“”"

for循环遍历, 把列表里面元素一个一个提取出来

for index in response.json()['data']['searchResult']:

详情页链接:

    link = f'https://*****/meishi/{index["id"]}/'

创建字典 --> 方便后续保存数据

    dit = {'店名': index['title'],'评分': index['avgscore'],'评论': index['comments'],'店铺类型': index['backCateName'],'商圈': index['areaname'],'人均': index['avgprice'],'最低消费': index['lowestprice'],'经度': index['longitude'],'纬度': index['latitude'],'详情页': link,}csv_writer.writerow(dit)print(dit)

尾语 💝

好了,今天的分享就差不多到这里了!

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

对下一篇大家想看什么,可在评论区留言哦!看到我会更新哒(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇👇


http://chatgpt.dhexx.cn/article/SxByN9ty.shtml

相关文章

HTML5游戏化互动学习平台,h5游戏平台_触摸型互动slg黄油手游

乐趣H5游戏平台是目前中国最大的H5手机网页游戏平台&#xff0c;提供在线玩的H5手机小游戏&#xff0c;最火爆的微信小游戏&#xff0c;最好玩的手机小游戏排行榜&#xff0c;让您能结识到H5游戏玩家和H5小游戏里的朋友&#xff0c;无需下载&#xff0c;点击马上玩&#xff01;…

中国十大最狠的流氓网站曝光!送查杀流氓的工具

推动了流氓软件的发展?谁又从流氓软件中获利,揭开流氓软件背后的始佣者,网易科技独家选出中国十大流氓网站. 以下是网易科技评选的十大流氓网站: 1、3721.com(中文实名) 这个是流氓软件的开山鼻祖,就是因它将中国互联网带入到一个流氓时代,这里就不作再多说,相信大多数人…

注意了!浏览色情网站被短信通知检讨?可能是诈骗!

来源 | 澎湃新闻、九派视频等 针对“网传有学生用校园网浏览色情网站被学校学工部短信通知深刻检讨”一事&#xff0c;9月23日&#xff0c;电子科技大学党委学生工作部相关工作人员告诉记者&#xff0c;已关注到网络上传播的图片&#xff0c;经查&#xff0c;该校学工部未发过此…

宠物网站

宠物网站 文章目录 宠物网站1.宠物网站需求分析2.宠物网站设计3.宠物网站实现1.创建HTML文件2.网页布局设计3.网页布局实现3.1共有部分&#xff1a;3.2.不同的模块&#xff1a;3.2.1.首页页面设计3.2.2.萌宠页面设计3.2.3.萌宠医院页面设计3.2.4萌宠食品页面设计3.2.5萌宠资讯页…

10大免费的白嫖网站

作者&#xff1a;pk哥 来源&#xff1a;Python知识圈 本次给大家分享下 pk 哥常用的 10个白嫖网站。 万能命令 https://wanneng.run/cn/在你浏览任意网页时&#xff0c;在网址前面输入这个万能命令 wn.run/ 就会展示出用于该网页的各种附加在线工具&#xff0c;方便快捷&#x…

刚刚,我顺藤摸瓜端了知名色情网站的老窝,并劝他从良

来自公众号&#xff1a;Hack 感谢凌云给我的启发 大家好&#xff0c;我是九歌 前几天无意发现了一个色情网站&#xff0c;本着除暴安良的心态&#xff0c;直接开始对这个网站开始了调查 这个网站的域名是.cn结尾的 【.cn是国内域名,无法隐藏注册人的信息】 我去站长之家里面对这…

Java旅游网站源码+页面

旅游网站[源码前后端页面] 在线预览&#xff1a;旅游网站TourismPro 账号&#xff1a;朱利尔&#xff0c;密码&#xff1a;123 管理员账号&#xff1a;admin&#xff0c;密码&#xff1a;123456 Github开源地址&#xff1a;https://github.com/jwwam/tourismPro下载 or 部署问…

哪些你朝思暮想的动漫网站-搜嗖工具箱

AcFun是国内首家弹幕视频网站&#xff0c;这里有全网独家动漫新番&#xff0c; 友好的弹幕氛围&#xff0c;有趣的UP主&#xff0c;好玩有科技感的虚拟偶像&#xff0c;年轻人都在用www.acfun.cn 哔哩哔哩是国内知名的视频弹幕网站&#xff0c;这里有及时的动漫新番&#xff0c…

很有意思的几个网站

BiJint 在线美女时间展示网 速戳&#xff1a;BIJIN-TOKEI(美人時計) BiJint是一个基于互联网的在线时间提醒网站&#xff0c;它的独特之处在于该网站采用美女举牌提醒的方式来吸引用户的眼球。它们每一分钟都显示一张美女拿着时间牌拍的照片&#xff0c;然后每分钟都自动更新。…

临沧黄衣阿佤-中国佤民族中一支穿黄色衣服的佤族群体

云南黄衣阿佤介绍、临沧耿马黄衣阿佤村、云南大寨少数民族黄佤、临沧黄衣佤族寨 一、黄衣阿佤简介&#xff1a; 《佤族》是一个在祖国西南边疆分布较广的民族之一&#xff0c;也是云南临沧特有的少数民族。除阿佤山中心区的沧源和西盟两个自治县外&#xff0c;在德宏州梁河、保…

高级Java开发人员最常访问的几个网站

这是高级Java开发人员最常访问的几个网站。 这些网站提供新闻&#xff0c;一般问题或面试问题的答案&#xff0c;精彩的讲座等。质量是优秀网站的关键因素&#xff0c;这此网站都有较高的质量内容。下面逐一介绍&#xff1a; 1. Stackoverflow Stackoverflow.com可能是编程世界…

爬虫爬取二次元网站美女图片

爬虫爬取二次元网站美女图片 前言xpath解析需求分析代码编写总代码 前言 本次需要爬取二次元网站cos板块下的图片 需要用到request模块与lxml模块&#xff0c;所以请提前安装好这两个模块,打开cmd程序输入 requestlxmlpip install requestpip install lxml xpath解析 xpath解…

小爬虫sitemap网站seo优化(黄梦岚)

其实关于SEO优化网络有什么多种的方法&#xff0c;可以通过自己提交链接给百度让网络蜘蛛爬到,也可以使用我这种方法.下面给大家介绍一下小爬虫sitemap网站的seo优化,在这里申明我喜欢的人是黄梦岚(湖南永州东安)一辈子都喜欢话不多说我们开讲吧&#xff01;&#xff01;&#…

与虫子尾交3d动画网站_这六款好用的3D建模软件,总有一款是你想要的!

在现在这个科技迅速发展的时代,各种3D模型以及在我们的学习和生活中随处可见。立体的三维模型能让我们对展示的对象有着更直观的认知。那么,那些炫酷的3D模型究竟是怎么做出来的呢? 3D模型的制作和呈现最离不开的就是3D建模软件了,今天,小奇就要为大家介绍几款主流好用的…

六款堪称神器的网站

导读网站是通往互联网世界的一大工具,在这片信息的海洋上,总有那么几款产品,如海岛般骄傲伫立,带给人不一样的感觉。当然,本文的标题是有失公允的,世界是优秀的产品不计其数,要分类罗列出来简直不够写,所以本文所列举的网站仅作个人意见,方便阅读。1. 花蜜 | 不一样的…

2017年最受欢迎的10大商城网站

在电商和线上购物快速发展的今天&#xff0c;拥有一个商城网站很是必要&#xff0c;关于试水独立商城的好处大家可以浏览《有了淘宝京东&#xff0c;为什么还要自建商城网站?》查看。但是&#xff0c;搭建商城网站并不简单&#xff0c;庆幸的是目前市面上涌现了不少建站平台&a…

漂亮的带搜索框蓝黄拼色网站404页面源码

简介&#xff1a; 蓝黄拼凑起来的两种底色的404页面&#xff0c;比较少见&#xff0c;还别说&#xff0c;这样一搭配还是比较靓丽。 着404页面犹如我们穿的衣服&#xff0c;还是要合理打扮和搭配&#xff0c;这个就是百搭。 同时&#xff0c;页面还有一个搜索框&#xff0c;但…

艰难提权某黄色网站服务器

手提liu百多个黄色网站De服务器。 #继昨晚之后再一次提下一个08r2服务器,这次实属不易从下午一两点到方才现在约晚上十一点,学到新姿势了,心情还是很不错的。故事是这样的,六点多钟睡觉的我,到了九点钟,还是翻来覆去想日站。行吧,起床!日站走起。 逼装完了,说过程吧。…

在橙黄色网站设计中寻找灵感

在千变万化的色彩世界中&#xff0c;人们视觉感受到的色彩非常丰富&#xff0c;所以配色至关重要&#xff0c;网站设计的关键是选择正确的配色方案&#xff0c;配色的好坏可以直接影响网站的整体设计&#xff0c;好的配色可以通过改变空间的舒适程度和环境气氛来满足人们的各方…

20个黄色网页设计,激发你的灵感

当设计一个网站时&#xff0c;最常见的一个挑战是研发一种有效的配色方案。enqoo收集了20个黄色为主的网页&#xff0c;看看有没有你喜欢的。 Kim The Movie 1pooya Desyn Artigianasud Marlin Jackson RS Mehra elless michik Multimedios cldesignz Rillusion School of Medi…