ChatGPT实现HTML网页文本提取

article/2024/12/22 18:17:47

网页自动化工具

既然ChatGPT对于编程语言有非常强大的理解能力,那么它是否可以用来自动化地处理网页呢?答案是肯定的。ChatGPT可以使用机器学习算法来识别网页元素中的文本,并抽取出有用的信息。

例如我们提供一段层数比较多的相对来说较为复杂的 HTML 代码,如下图所示:

图中我们用红框标出的部分是需要抽取的文本,我们可以要求 ChatGPT 帮我们抽取出其中的文本,看看是否如我们期望的,只将红框中的部分抽取出来。如下图所示:

我们看到,ChatGPT成功地将红框中的文本抽取出来了,而且没有将 HTML 片段中

<img data-v-ae3ef2f2="" data-v-28d01aa9="" src="https://static001.infoq.cn/resource/image/c1/ab/c1a96a0372f54a63493051b05b3d5aab.png" alt="图片默认文字:马斯克开源Twitter算法!推荐机制正式公开,GitHub Star数已破万" class="article-image">

图片标签的默认显示文字抽取出来,可以说对于文本部分的识别成功率还是不错的,后续我们就可以基于这些抽取出来的文本进行进一步的处理了。

ChatGPT对于 HTML 的理解不仅仅在于文本的抽取,它可以识别整个 HTML 的结构,基于这个能力,我们就可以要求 ChatGPT 帮我们去实现一些更有趣的功能。比如我们希望通过输入文本指令,可以控制网页中的元素进行一些操作,例如点击、输入、滚动等等,那么我们可以通过 ChatGPT 对指令进行解析并根据预设的操作和要求,帮助我们按照模版生成相应的指令片段,这样我们后续就可以根据这些统一格式的指令片段进行解析并做相应的处理了。例如,我们可以先给ChatGPT设定一个prompt(提示),告诉他要做什么事情,按照什么模版进行输出:

你是一位浏览器页面自动化助手。你可以使用的Action包括:
openLink(元素href属性)
click(元素Id)你将收到一个需要执行的任务以及一段DOM字符串。你需要选择最合适的Action,你最多可以重试一次失败的操作。
下面是你收到任务后响应的例子:
<Thought>我应该点击添加购物车的按钮</Thought>
<Action>click(223)</Action>
你必须始终包含<Thought>和<Action>打开/关闭标签,否则你的响应将被标记为无效。

ChatGPT收到这个prompt后,就会对这个提示进行上下文设定并将自己对于该提示的理解输出。我们可以看看ChatGPT的理解对不对,如下图所示:

可以看到,ChatGPT成功的理解了我们为他设定的prompt,接下来我们就要测试一下他能不能正确执行我们的指令了。我们在输入框中输入如下内容:

用户发起了如下任务:
请打开文章链接下面是页面内容:
<div data-v-7ce5c5d7="" class="list">
<div data-v-28d01aa9="" data-v-7ce5c5d7="" article-item="" class="article-item image-position-right"><div data-v-28d01aa9="" item-main="" class="item-main"><div data-v-28d01aa9="" data-icon="" data-video="" class="image"><img data-v-ae3ef2f2="" data-v-28d01aa9=""
...

接下来看看ChatGPT如何应对这个任务,如下图所示:

我们看到,ChatGPT正确的识别出了HTML文本中

<a data-v-65bacb95="" data-v-28d01aa9="" com-article-title="" href="https://www.infoq.cn/news/3OOPEivwhT0gLcKP0Nwl" target="_blank" rel=""  class="com-article-title">

这个link标签中的href属性,并将其作为参数传入了openLink()函数中,并且按照我们设定的输出模版,将和正确的输出到页面上,这样我们就可以把这些统一格式的指令片段进行解析,然后按照需求做相应的处理了。

我们可以预见,这种利用ChatGPT实现的网页自动化技术,未来会有更多的应用和创新,可以使得基于网页的工具更加智能化,更加便捷,应用的场景也会越来越广泛。


http://chatgpt.dhexx.cn/article/iN1tuZTG.shtml

相关文章

【ChatGPT实战】5.使用ChatGPT自动化操作网页

在当今数字化的时代&#xff0c;网页已经成为了人们获取信息、娱乐、社交和购物等方面的主要途径。然而&#xff0c;随着我们对网页的需求和使用不断增加&#xff0c;我们也经常会面临着一些繁琐的网页操作&#xff0c;例如自动填充表单、自动化浏览和搜索等&#xff0c;这些操…

女子用ChatGPT交1000+男友,聊天按分钟收费,一周收入50万

量子位 | 公众号 QbitAI 注意看&#xff0c;这个女人叫卡琳&#xff0c;靠着GPT-4&#xff0c;她现在同时谈着1000男朋友。 对&#xff0c;我知道事情听上去有些离谱。就连GPT-4自己&#xff0c;都直呼“我一个AI都觉得非常不常见”。 但是先别急&#xff0c;因为更让人挠头的事…

安装chatgpt4free环境

pip3 install --index-url https://pypi.douban.com/simple -r requirements.txt 安装request报错解决办法 python -m pip install --upgrade pip 会继续报错&#xff0c;这里由于我们升级了pip&#xff0c;所以对应的镜像源也需要更换&#xff08;博主这里换成了清华的&…

在pycharm中使用chatgpt

目录 前言 一、插件安装 二、使用步骤 总结 前言 ChatGPT是目前最强大的AI&#xff0c;不仅能够聊天、写小说&#xff0c;甚至码代码也不在话下。 但是在国内要使用chatgpt很麻烦&#xff0c;国内一家团队开发了一款idea插件NexChatGPT&#xff0c;用数据代理的方式&…

技巧|使用Chatgpt练习多种类型口语

练雅思口语——其实练什么语言、什么形式的口语都可以。 ChatGPT作为一款聊天机器人&#xff0c;自然可以用于对练口语——只要你的输入和它的输出都变换为语音的形式即可。 一、语音插件 首先&#xff0c;谷歌搜索voice control for chatgpt&#xff0c;点击第一个chrome……

chatgpt赋能Python-python3_9怎么安装

Python 3.9&#xff1a;安装指南 如果你正在学习编程或者已经是一名程序员&#xff0c;那么一定会了解到Python这个编程语言。Python是一种高级编程语言&#xff0c;其强大的设计特点和易于操作的特性使其成为了开发人员的首选。Python 3.9已经发布了&#xff0c;它虽然不是Py…

Windows 10使用WSL部署Chatgpt_academic

目录 一、在windows10中安装Ubuntu系统 二、在Ubuntu系统中安装anaconda3和GPT_Academic 本文主要介绍windows10使用WSL安装Ubuntu系统&#xff0c;然后通过安装anaconda3来部署chatgpt学术版的整个过程。Chatgpt学术版用来做论文润色等任务还是挺不错的&#xff0c;但是是否…

安装油猴插件解决chatgpt报错问题

转载自Github Daily公众号 Something went wrong. If this issue persists please contact usthrough our help center at help. openai.com. 最近几天&#xff0c;相信大家都发现了 ChatGPT 一个问题&#xff0c;就是官网报错越来越频繁了。 当你需用 ChatGPT 来处理一些比较…

ChatGPT使用学习(二):ChatPaper安装到测试详细教程(一文包会)

ChatPaper 1.简介及功能2.前置准备3.开始使用-命令行4.开始使用-网页 1.简介及功能 ChatPaper是一种基于文本生成技术的研究论文&#xff0c;可以根据用户的输入进行智能回复和互动&#xff0c;具有类似于ChatGPT的功能。它可以根据关键字来获取相应的论文&#xff0c;并通过分…

「部署全流程」 中科院学术专业版chatGPT来啦

前言 上周末的时候&#xff0c;一位开发者将名为「ChatGPT Academic」的项目开源至 GitHub。 仅用了短短一两天&#xff0c;该项目 Star 数便增长到了 21k&#xff0c;成为 GitHub 上又一个基于 ChatGPT 构建的热门开源项目。 这个项目就是《中科院学术专业版 ChatGPT》。 …

chatgpt academic3.37安装教程(haust)

作者邮箱:634494816qq.com chatgpt academic能干啥&#xff1f;具体用法看官网 使用chatgpt academic前置条件&#xff1a; ①需xx上网 ②有key&#xff08;chatgpt官网注册账户即可免费获得&#xff09;&#xff08;注册教程在这&#xff0c;注意&#xff1a;无需付费&…

ChatGPT搭建语音智能助手

环境 python&#xff1a;3 ffmpeg:用于处理视频和语音 gradio:UI界面和读取语音 概述 我们的目的是做一个语音智能助手 下面我们开始 准备工作 下载Visual Studio Code Visual Studio Code 因为需要写python代码&#xff0c;用Visual Studio Code比较方便。 安装pytho…

【利用ChatGPT学习英语口语(包括如何安装插件的详细教程)】

内容目录 一、插入ChatGPT语音播放插件1. 打开谷歌浏览器——右上角三点——更多工具——扩展程序2. 点击扩展程序三个横杠——打开chrome 应用商店3. 搜索Voice Control for ChatGPT——点击如下图第一个——添加至Chrome——添加扩展程序4. 成功安装&#xff0c;打开ChatGPT有…

ChatGPT Plus用户专享:86款高效功能插件,详尽安装与使用全攻略

在前天的文章中&#xff0c;我们介绍了 ChatGPT 开放的全新模式 Web Browsing&#xff08;网页浏览&#xff09;&#xff0c;启用后 ChatGPT 就可以开始上网&#xff0c;收集最新的互联网资料进行作答。 其他关于chatgpt使用方面&#xff1a;请访问&#xff1a; 链接&#xf…

chatgpt小程序安装指引

chatgpt小程序安装指引 JAVA 创建数据库,名字随意,数据库编码为utf8mb4 导入sql文件,在renren-api/db目录下面 第一次导入数据的先执行chatgpt.sql文件,在根据日期先后顺序执行 已导入过的同志,根据更新已经更新日期来导入 后台管理默认账号密码为admin 修改application-de…

公有云和ChatGPT关系不大

前段时间要过年、休养身体&#xff0c;写长篇&#xff0c;所以公众号停更了两个月。 本文解释了AI云为什么不会成为云厂商的重要营收途径&#xff0c;延伸分析了一些云产品的本质。 1. 流量密码不是财富密码 这两个月才突然热议ChatGPT的朋友&#xff0c;其实技术嗅觉有点迟钝、…

关于chatGPT专栏

这边已经受到了限制&#xff0c;关于gpt的内容文章已经被下架了众多 所以我关于gpt的文章只能在微信公众号里面查看&#xff0c; 还有许多新的文章是在此平台没有发过的&#xff0c;所以想了解关于chatgpt的文章&#xff0c;可以关注我文章下面的公众号。

ChatGPT初步了解

ChatGPT 是 InstructGPT 的同级模型&#xff0c;它经过训练可以按照提示中的说明进行操作并提供详细的响应。 InstructGPT论文&#xff1a;https://arxiv.org/pdf/2203.02155.pdf InstructGPT怎么准备和标记数据集&#xff1a;https://harryliu.blog.csdn.net/article/detail…

chatgpt和openai RateLimit(api使用速率限制)介绍

OpenAI的API提供商在API使用方面有一些限制和规定&#xff0c;其中之一就是限制API的使用速率&#xff0c;以避免滥用和过度消耗资源。这种限制称为速率限制&#xff08;Rate Limit&#xff09;&#xff0c;是许多API服务提供商都采用的一种机制。 OpenAI的速率限制规定了每个…

ChatGPT的字数限制是什么?如果解决字数限制

字数限制和解决方案 ChatGPT的字数限制是什么&#xff1f; 当我们向ChatGPT提问&#xff0c;而碰巧这个问题的答案比较复杂&#xff0c;一两句话说不清出的时候&#xff0c;就会发现我们的答案输出到一半就中断了&#xff0c;大概是550个中文字左右。 同样的&#xff0c;如果…