看ChatGPT是如何教我爬取上千家上市公司的股票代码

article/2024/12/22 15:32:21

现在有一个这样的需求,要爬取雪球网上A股的股票名称、代码和总市值这些信息并把它保存到execl表格中。对于一个新手想学习爬虫,如何通过chatGPT来完成这个任务呢? alt

首先,我们把自己的需求详细的描述向ChatGPT提问,问题描写的越详细越好,例如: alt 然后,我们把代码复制到编辑器运行,如下图: alt 没有任何返回值,估计是出错了,我们先打印一下content的值看看,如下图: alt 的确是出错了。我在把出错的问题进行描述,再向ChatGPT进行提问。如下图: alt 上述的回答中解析了为什么会出现这种错误,并给出了解决方法。我们采用第一种方式,为代码添加请求头,再次执行。 alt 这次就成功把网页的内容返回了。但是页面中的内容并没有我们想要的信息。 alt

通过观察爬取的页面,刚打开页面是没有我们想要的信息,当我们点击了开始选股,才加载数据。

没有点击的
没有点击的
点击后的结果
点击后的结果

通过浏览器开发者工具,发现点击后,是请求以下这个地址,获取结果进行加载的。 alt alt

弄清楚了请求地址,我们再次向chatGPT提问。 alt

上述代码,它没有添加请求头,所以,我们要自行添加请求头

关键代码如下:

import requests

url = 'https://xueqiu.com/service/screener/screen?category=CN&exchange=sh_sz&areacode=&indcode=&order_by=symbol&order=desc&page=1&size=30&only_count=0&current=&pct=&mc=&volume=&_=1684212843562'

# 发送 HTTP 请求获取 JSON 数据
headers = {
    'User-Agent''Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
response = requests.get(url, headers=headers)
data = response.json()




# 提取股票信息
stocks = data['data']['list']

# 遍历股票信息并输出股票名称和代码
for stock in stocks:
    name = stock['name']
    code = stock['symbol']
    print(name, code)

执行结果如下: alt

上述代码只是爬取单页的,现在我们要爬取多页的数据,把这个需求描述发给chatGPT,看它是如何解决的。 alt

上述代码,它没有添加请求头,所以,我们要自行添加请求头

关键代码:

import requests

def crawl_stock_data(page_num):
    url = f'https://xueqiu.com/service/screener/screen?category=CN&exchange=sh_sz&areacode=&indcode=&order_by=symbol&order=desc&page={page_num}&size=30&only_count=0&current=&pct=&mc=&volume=&_=1684212843562'

    # 发送 HTTP 请求获取 JSON 数据
    response = requests.get(url)
    data = response.json()

    # 提取股票信息
    stocks = data['data']['list']

    # 遍历股票信息并输出股票名称和代码
    for stock in stocks:
        name = stock['name']
        code = stock['symbol']
        print(name, code)

# 执行多页爬取数据
total_pages = 10  # 假设要爬取10页的数据
for page in range(1, total_pages + 1):
    crawl_stock_data(page)

下面就是把爬取的数据保存到execl中,再次把需求描述给chatGPT,看它是如何回复的: alt 这次又忘记添加请求头,于是,我提示它加上请求头。 alt 关键代码如下:

import requests
import pandas as pd

def crawl_stock_data(page_num):
    url = f'https://xueqiu.com/service/screener/screen?category=CN&exchange=sh_sz&areacode=&indcode=&order_by=symbol&order=desc&page={page_num}&size=30&only_count=0&current=&pct=&mc=&volume=&_=1684212843562'

    headers = {
        'User-Agent''Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
    }
    
    # 发送 HTTP 请求获取 JSON 数据
    response = requests.get(url, headers=headers)
    data = response.json()

    # 提取股票信息
    stocks = data['data']['list']
    stocks_list =[{'name': item.get("name"),'symbol':item.get("symbol"), 'volume':item.get("volume")} for item in stocks ]
    # 创建DataFrame保存股票数据
    df = pd.DataFrame(stocks_list, columns=['name''symbol',"volume"])
    return df


# 执行多页爬取数据
total_pages = 50  # 假设要爬取10页的数据
dfs = []
for page in range(1, total_pages + 1):
    df = crawl_stock_data(page)
    print(df)
    dfs.append(df)

result_df = pd.concat(dfs, ignore_index=True)
# 保存数据到Excel文件
result_df.to_excel('stock_data.xlsx', index=False)

执行成功的结果如下: alt

代码是完成了我们的需求,但是代码缺乏异常捕捉,如果代码出现错误后,会整个代码停止执行。

总结

利用chatGPT学习爬虫是一个非常好的办法,只要我们把需求和问题向它描述,它都能分析错误和给出解决方法。大大的节省了收集资料的时间,提高了学习的效率。

本文由 mdnice 多平台发布


http://chatgpt.dhexx.cn/article/m4lNEeFu.shtml

相关文章

零代码量化投资:用ChatGPT获取新浪财经上的股票实时行情

现在很多免费的股票数据库,比如akshare,其实是从新浪财经或者东方财富网站上爬取下来的。如果能直接从新浪财经或者东方财富网站上爬取数据,可以获取更全面更即时的信息。 可以在ChatGPT中输入提示词如下: 写一段Python代码&…

chatgpt赋能python:用Python自动买卖股票-实现你的金融自由梦想

用Python自动买卖股票 - 实现你的金融自由梦想 随着数字化时代的不断发展,越来越多的人开始投资股票以实现财务自由。而对于投资股市的人来说,如何自动化交易是一个很重要的问题。Python自动买卖股票就是一种可行的方式。 什么是Python自动买卖股票 P…

chatgpt赋能python:Python交易股票:掌握交易技巧,开启财富增长之路

Python 交易股票:掌握交易技巧,开启财富增长之路 股票市场一直以来都是吸引人们收益的地方,不断变化的市场行情也让每一位投资者都不得不面对各种风险。然而,如果您懂得运用好 Python 来交易股票,就能够更好地理解市场…

【关于ChatGPT的30个问题】9、ChatGPT的准确性如何?/ By 禅与计算机程序设计艺术

9、ChatGPT的准确性如何? 目录 9、ChatGPT的准确性如何? ChatGPT的准确性评估

ChatGPT实用指南!!设计师必看!!

ChatGPT 最近真的太火了,每天都会在网上刷到关于它的各种讨论,身边的同事也已经在用它处理一些文字相关工作,不知道大家有没有用起来呢? 最近我在网上看很多大神分享的 ChatGPT 使用教程,发现自己之前对 ChatGPT 的认…

ChatGPT火出圈,80%的设计师无事可做

自从疫情过后,设计行业开始变得很凌乱。很多同行开始打价格战,设计岗位逐渐演变成了一种新型的流水线。在我国,不管什么行业,到最终都会演变成饱和状态。 用金融理论来说:供不应求,就赚钱,供过于…

ChatGPT Prompt工程:设计、实践与思考

作者 | 太子长琴 整理 | NewBeeNLP 大家好,这里是 NEewBeeNLP。ChatGPT 火爆出圈了,有些人惊叹于它的能力,当然也有部分人觉得也就那样。这就不得不提 Prompt 了,据说【相关文献1】,ChatGPT 效果好不好完全取决于你的…

如何用ChatGPT做设计?激发设计师们的灵感

伴随着人工智能技术的迅猛发展,AI 工具在设计领域中的应用也越来越广泛。 当前,诸如ChatGPT等 AI 工具不仅可以进行自然语言处理,还可以应用于图像、视频等多种媒体领域,为设计师们提供了丰富的应用场景。 使用Chatgpt&#xff1…

想要用 ChatGPT 设计游戏,资深设计师给出了忠告!

【CSDN 编者按】随着 ChatGPT 的进入到我们的视野,游戏设计师们开始蠢蠢欲动,想要借助这款工具创建一个虚拟世界,但是人工智能在游戏方面的创造却还面临挑战。在本文中,一位资深MMO设计师Damion Schubert结合自身的尝试过程&#…

ChatGPT的成功,源自数据策略的精巧设计

最近,OpenAI推出的ChatGPT火了。 60天月活破亿,迅速狂飙出圈。ChatGPT不仅刷爆了星尘君的朋友圈,也炸醒了国内外的科技圈、创投圈。 有人说ChatGPT相当于AI版瓦特蒸汽机,有人说ChatGPT让我们看到AI的未来,连微软联合创…

使用ChatGPT设计多选题

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

使用 ChatGPT 来设计系统时序图

前言 ChatGPT 的受欢迎程度不断增长,现在被广泛用于各种应用程序。作为一名全栈工程师,出于对技术的追求,使用 ChatGPT 来探索一些可能的使用场合,本文就来探索 ChatGPT 设计一个资产购买系统并画出 Mermaid 流程图,开…

用ChatGPT写2023高考语文作文(一):全国甲卷

题目 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。 这句话引发了你怎样的联想与思考?请写一篇文章。 要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得…

让ChatGPT来写今年的高考作文,会得几分?

使用最新的ChatGPT4模型,做2023年全国甲卷的高考作文。 作文考试题目如下 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。这句话引发了你怎样的联想与思考?请写一篇文章。 要求:选准角度,确定立意&#xff0…

2023年新课标I卷作文,5位人工智能考生(ChatGPT,文心一言,GPT4, ChatGLM-6b, ChatT5)来写作,看谁写得最好

大家好,我是微学AI,今天是2023年6月7日,一年一度的高考又来了,今年的高考作文题也新鲜出炉。今年是特殊的一年,有人说2023是AI的元年,这一年里有大语言模型的爆发,每天都有大模型的公布&#xf…

实用教学Prompt 提示词实战:如何用 ChatGPT 指导高考语文作文写作

又是一年高考季,牵动着广大学生和家长的心。7 日上午,语文科目考试结束。 今年高考语文共7套试卷:全国甲卷、全国乙卷、新课标Ⅰ卷、新课标Ⅱ卷、北京卷、天津卷、上海卷。 以高考语文作文题目来实践检验一下,如何用合适的提问词&…

2023高考第一天,用ChatGPT挑战全国卷作文,已达到双一流高校学生水平?

前言 2023年高考语文结束啦,今天我们用ChatGPT来挑战高考作文,一起来看看它的表现如何?ChatGPT突然爆火网络,它真的会取代人类的工作吗? 什么是ChatGPT? ChatGPT是由OpenAI开发的,OpenAI是一家…

ChatGPT大战高考作文,一起看看写的如何

文章目录 引言实操作文分析写作指导作文 文末福利:学生管理系统实现亮点 总结 引言 自从上次高考作文题目出来后,很多人在看到高考甲卷时都发出了感慨,的确,这次的题目的确很吸引人 人们因技术发展得以更好地掌控时间&#xff0c…

AI 大战高考作文!实测 ChatGPT、文心一言、通义千问等 8 款“神器”

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 今天中午十一点半,2023 年高考作文题目火热出炉,其中全国甲卷作文题引人深思: 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。 身处技…

ChatGPT写高考作文

又是一年一度高考时,又是一批学子奋笔考场,逐梦未来。 我们不用在考场里奋笔疾书,就在考场外欣赏一下AI写作水平吧。 作文 首先使用GPT-3写一下全囯甲卷作文 再看看GPT-4的作文水平 点评 从对比GPT-3和GPT-4的这两篇文章,我们…