ChatGPT炒股:爬取氢能行业企业名录

article/2024/9/7 19:17:25

全球氢能网有氢能源相关企业的列表,怎么全部爬取下来呢?

先看翻页规律:

http://h2.china-nengyuan.com/company/company_0.html

http://h2.china-nengyuan.com/company/company_1.html

http://h2.china-nengyuan.com/company/company_21.html

很简单,就是最后一个数字。

然后看每页的结构和企业信息。

然后在ChatGPT中输入提示词:

你是一个Python编程专家,要写一个爬取网页数据的程序。具体步骤如下:

打开网页http://h2.china-nengyuan.com/company/company_{pagenumber}.html,解析源代码,其中pagenumber的参数是从0到21;

定位页面中所有 class="table_row" 的table元素;

找到里面class="blue"的a元素,提取其titile值,写入excel表格第1列;

找到里面class="fgray2"的第1个td元素,提取其内容,写入excel表格第2列;

找到里面class="fgray2"的第2个td元素,提取其内容,去掉开头的“主营:”字符,写入excel表格第3列;

保存excel表格到F盘的“氢能源企业大全.xlxs”

注意:每一步都要输出信息

运行程序后,爬取到第14页时出错了,把错误信息发送给ChatGPT,回复如下:

根据错误提示,发现程序试图将一个包含非法字符的字符串写入excel表格。openpyxl库中的cell对象只能写入纯文本或数字,不能写入包含特殊字符的字符串。因此,需要对写入的字符串进行处理,去除其中的非法字符。

修改后的代码在写入excel表格前,通过remove_special_chars函数去除了字符串中的非法字符。同时,将去除开头的“主营:”字符的操作也改为了replace('主营', ''),避免了写入非法字符。

错误修正后,顺利爬取所有内容:

氢能源企业名录大全如下:


http://chatgpt.dhexx.cn/article/7jaoaFZq.shtml

相关文章

chatgpt赋能python:Python编程炒股软件:优秀的股票市场分析工具

Python 编程炒股软件:优秀的股票市场分析工具 Python 编程语言一直以来在数据分析和科学计算领域处于领先地位。由于它强大的数据处理能力和易于使用的编程语言特性,Python成为了许多股票市场分析工具的首选。 现在,越来越多的投资者使用Py…

【python量化】ChatGPT4 实现股票量化盯盘系统

如果你还不知道 ChatGPT 是什么 建议看这篇文章:ChatGPT 为什么这么火?它能干什么? 昨天,我,一个 python 小白,花了 2 个小时时间,让 ChatGPT4 帮我实现了一个股票量化盯盘系统。 开通 plus 会员…

ChatGPT炒股:从上市公司招股说明书中批量提取发明专利表格

上市公司招股说明书通常会详细列明公司的发明专利,而通过企业的发明专利可以了解企业未来的业务布局情况,怎么把这些发明专利列表都批量提取出来呢? 随机打开几个上市公司的招股说明书,可以看到发明专利这一内容,共同的特征是都有…

chatgpt赋能python:用Python做股票分析

用Python做股票分析 在当今的股市中,数据分析和预测已经变得十分重要。Python作为最流行的编程语言之一,不仅易于学习,还有非常强大的数据处理和分析能力。在本文中,我们将探讨如何用Python进行股票分析。 数据收集 要进行股票…

ChatGPT炒股:监控水泥等原材料价格每日变动情况

水泥、钢铁等大宗商品原材料价格对于很多企业的业绩影响较大,这些产品的价格变动情况需要高频监控,来评估企业未来业绩变动趋势。 下面以水泥网的水泥指数,来说明如何通过ChatGPT来编写Python程序,实现监控价格变动的功能。 打开…

ChatGPT炒股:从巨潮资讯网上批量下载特定主题的股票公告

巨潮资讯网是股票公告的指定披露渠道之一,上面有非常详细的A股股票公告内容。 现在,我们要获取2023-01-04~2023-07-04期间所有新三板公司中标题包含“2023年日常性关联交易”的公告。 首先从network中获取到真实网址:http://www.cninfo.com…

ChatGPT炒股:批量自动提取股票公告中的表格并合并数据

首先,在ChatGPT中输入提示词: 写一段Python代码: F盘文件夹“新三板 2023年日常性关联交易20230704”中很多个PDF文件,用 Tabula提取这些PDF文件中第1页中的第2个表格,然后保存到表格文件中,文件标题名和…

ChatGPT炒股:从股票招股说明书中批量提取竞争对手信息

股票招股说明书中都会提到上市公司的市场竞争情况和竞争对手。要研究企业,就必须仔细研究竞争对手。怎么将竞争对手这些信息批量从招股说明书中提取出来呢? 首先观察其规律: 有的是这样写的: 行业内的主要企业:浙江…

ChatGPT炒股:查询分析某个公募基金的持仓变化

如果很认同某个基金经理的投资理念,可以跟踪基金经理的持仓变化,可以获取一些投资的线索。手动操作也可以实现,但略微麻烦,如果利用ChatGPT写一个跟踪程序,就方便多了。 下面以汇丰晋信副总经理、投资总监、知名基金经…

ChatGPT炒股:自动批量下载choice每日热门研报

东方财富choice里面研究报告板块,每天更新研报几百篇,24小时热门研报也接近100篇。作为股票投资者,每天阅读最新热门研报,了解市场动态,是一个基本功。怎么可以自动批量下载这些24小时热门研报呢? 首先&…

ChatGPT炒股:自动批量下载萝卜投研网站上的股票研报

萝卜投研网站有很多的股票研究报告。 如果我们在chrome浏览器中打开了很多研报,该如何批量下载呢? 查看网页源代码,研报是pdf格式,下载链接也在源代码中,很好找。 下载方法是,用Selenium来接管已经运行的…

ChatGPT炒股:自动获取某只股票最新新闻报道

炒股,肯定要看某个股票的相关新闻,这是最基础的线上调研。百度新闻相对比较全面,如何通过ChatGPT来自动获取某个股票的百度新闻报道呢? 首先,在百度新闻搜索页面,观察翻页的规律: 第二页&#…

ChatGPT炒股:深度挖掘数据要素产业链股票

随着ChatGPT带动AI产业链股票火爆,数据要素作为其中重要一环,也被市场重视。 如何深度挖掘数据要素产业链股票呢? 国内已经成立好几家数据交易所,比如上海数据交易所,里面已经有很多挂牌的数据产品。如果能把所有已经…

ChatGPT炒股:自动批量下载特定主题的股票公告

很多财经网站、证券交易所等网站都有股票公告。有时候,我们需要从海量公告信息中查找特定信息。比如,查询所有股票2023年预计关联交易的内容,怎么自动批量下载呢? 下面以股转系统的新三板股票为例,来说明如何用ChatGP…

解读:ChatGPT在股票市场预测方面的应用

写在前面 ChatGPT的应用为股价预测领域带来了新的方法和思路。例如,通过结合自然语言处理和机器学习技术,可以从大量文本数据中提取有关股票市场的关键信息,进一步改进和创新预测模型;处理多源数据,如股票数据、新闻报…

利用chatGPT+剪映高效制作中英双语字幕(其它语言以此类推)

目 录 前 言 一、导出中文字幕 二、利用提示词在chatGPT上快速翻译 三、导入中英文字幕到剪映 四、展示效果 五、参考资料 前 言 ChatGPT可以帮助用户快速生成中英文对照的脚本,解决了在剪映中一个一个翻译中文的痛点,从而提高字幕制作的效率。这…

OpenAI Translator | 基于ChatGPT API全局翻译润色解析插件

简介 OpenAI Translator,一款基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用,使用 ChatGPT API 进行划词翻译和文本润色,借助了 ChatGPT 强大的翻译能力,帮助用户更流畅地阅读外语和编辑外语,允许跨 55 种…

OpenTranslator:一款基于ChatGPT API的翻译神器

这是一款使用 ChatGPT API 进行划词翻译和文本润色的浏览器插件。借助了 ChatGPT 强大的翻译能力,它将帮助您更流畅地阅读外语和编辑外语。 它能干啥 一. 可翻译 二. 可润色 三. 可总结 四. 可分析 五. 可解释程序代码 插件地址 OpenAI Translator 劝退声明 由…

基于 ChatGPT API 的划词翻译浏览器插件

OpenAI Translator 需要填入ChatGPT API 浏览器支持划词翻译 参考 openai-translator

【English】《trancy,一个用chatgpt翻译视频的神器,强烈推荐!》- 知识点目录

《trancy,一个用chatgpt翻译视频的神器,强烈推荐!》 应用名称: Trancy1. 支持网站 YouTube和Netflix 2. 安装步骤 Note: 如果安装之后,发现无法点击【知道了】的情况,将网页缩放之后,就可以…