最近火爆了的对话ChatGPT

article/2024/12/22 13:30:52

前言

相信最近小伙伴们已经被ChatGPT的惊艳效果刷屏了,之前笔者也介绍过一些对话方向的工作,感兴趣的小伙伴可以穿梭:

对话系统最新综述II https://zhuanlan.zhihu.com/p/446760658

在对话系统中建模意图、情感: https://zhuanlan.zhihu.com/p/468317109

对话模型背后可以做更多事: https://zhuanlan.zhihu.com/p/458097616

但今天要介绍的ChatGPT可以说是非常值得一看的,其不但能够回答日常的一些基本问题而且能够改代码修bug,关键是回答的什么之流畅通顺且严谨,强烈建议关注ChatGPT。

alt

而且其目前也支持中文,效果也是什么的惊艳!网上目前已经有许许多多有意思的case了,大家随便搜搜就可以看得到,比如 ChatGPT教学习知识图谱

更有甚者觉得其会颠覆现在已有的搜索引擎,其实单从效果来看其可以渗透的场景非常之多:搜索、客服、机器人等等。

其目前也是在短短的五天时间内迎来了百万用户的体验,这个效果突破也算是NLP业界一大幸喜之事了吧,很开心,哈哈哈

那么ChatGPT究竟做了什么才导致其有这么好的效果呢?让我们来看看吧~

链接:https://openai.com/blog/chatgpt/

方法

alt

ChatGPT主要的训练流程如上所示,主要包含三个阶段

  • 第一阶段

在GPT-3.5基础上训练一个加强版chat模型,其中GPT-3.5是一个很强的语言模型backbone,具体的做法就是从训练集中随机抽取一些prompt,然后由标注人员去根据prompt给出一个高质量合理的answer,于是乎就有了<prompt, answer>的pair高质量训练数据,以此来fine-tuning GPT-3.5。

  • 第二阶段

基于第一步训练好的模型,每当来一个prompt,模型就会产生n个answer(比如上图中是4个输出),然后此时又会请标注人员来为这n个answer的生成质量进行排序,可以看到这最后其实也是一份标注数据,基于这个标注数据就可以训练一个reward model,其实就是个打分模型,这个模型的目标就是尽可能给每个answer打的分数和人标注的相同,更具体的就是要体现出次优之分,比如上图标注的answer质量是D>C>A>B,那么reward model在给D的打分也有高于给C打的分。

  • 第三阶段

现在经过一二阶段,手头已经有了一个还不错的chat模型以及一个可以评判生成效果好坏的reward model模型,为了使得最终的模型效果更好,于是就可以让这两个模型或者说这两个阶段多循环几遍,循序渐进、彼此增益迭代、越来越好。

具体的方法,ChatGPT的研究者们采用的是强化学习RL,用第二阶段的粉丝作为奖励来更新第一阶段的chat模型,这也是为什么作者将第二阶段的模型称为reward model的原因。

  • 小结

到这里就全部介绍完了,是不是整个过程还是比较清晰且容易理解的,但是很难想象在标注这里ChatGPT究竟投入了多少!最后这个惊艳的效果笔者感觉很大一部分增益也是得益于这个reward model或者说这里源源不断的高质量标注数据,这个投入应该是巨大的。

ChatGPT目前存在的一些问题

研究员们同时也提出了一些ChatGPT目前的badcase

  • ChatGPT 有时会写出看似合理但不正确或荒谬的答案

研究员们认为要解决这个问题是具有一定挑战性的,因为(1)在强化学习训练期间,没有真真意义上的正确答案 (2) 因为在训练模型的时候为了保住生成结果的严谨性,导致模型比较谨慎,不敢多回答,其实一些问题本来可以大胆正确回答出来的 (3) 监督训练这一范式也会导致模型学偏,使得其更加偏向于学习标注人员自己知道的,而不是真真的。

  • ChatGPT 对输入的prompt很敏感

同样一个问题,可能前后稍加修改或者说微调,那么ChatGPT的反馈是大不一样的,有可能前一次是拒绝回答,后面稍微改一下输入,语义什么的都一样,但是ChatGPT就可以回答出来了。

  • ChatGPT 回答通常是过于冗长并过度使用某些短语

ChatGPT很喜欢用一些固定的短语,比如它会经常说它是OpenAI训练出来的语言模型,这其实和训练语料的偏置有关,比如其答案通常都很长的原因就是标注人员标注的好结果通常来说都是比较长的,因为在标注人员看来长一点的句子通常来说更全面、更让人理解。

  • ChatGPT 自己做主

理想情况下,当用户提问出模棱两可的问题时,模型的做法应该是去进一步询问确认出清晰的问题后再回答。但是现在的ChatGPT通常会自作主张的猜测用户的意图。

  • ChatGPT 安全内容问题

其实这也是对话领域的通病,就是怎么拒绝回答一些不友好话题的问题,目前其用了Moderation API来告警这些不安全的内容,但是可以预见的是还是会不可避免的有漏洞

总结

总的来说,虽然长路漫漫,但是看到这个现象级的效果升级,还是很开心的。其让相关的研究者看到了一丝曙光,也让一些之前基于AI的智能生活场景更可能早一点的到来。还有一点就是怎么把这么大的模型在线上成本降下来,让其真真能够落地服务千万家,也是一个很重要有意义的课题。

期待、共勉~

关注

欢迎关注,下期再见啦~

知乎,csdn,github,微信公众号

本文由 mdnice 多平台发布


http://chatgpt.dhexx.cn/article/47eui95S.shtml

相关文章

ChatGPT对话数据备份

ChatGPT对话数据备份 文章目录 ChatGPT对话数据备份1. 背景2. 其他&#xff08;失败的&#xff09;方法2.1 右键另存为2.2 直接copy html代码 3. 编写Javascript脚本3.1 思路过程3.2 安装教程3.3 使用说明3.4 最终效果 1. 背景 之前在ChatGPT更新时有好几天都无法查看过往对话…

ChatGPT教程之 01 什么是ChatGPT革命性的对话生成新工具

今天,我想揭开 ChatGPT 的神秘面纱——GANs*(生成对抗网络)的一个迷人的新应用程序,它在 AI 社区中引起了很大的轰动。 对于那些不熟悉 GAN 的人来说,它们是一种神经网络,它使用两个相互竞争的网络——一个生成器和一个鉴别器——来创建逼真的输出。生成器创建假输出,而…

ChatGPT API实现多轮对话的实战代码

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

聊聊ChatGPT是如何组织对话的

为什么要组织对话&#xff1f; 总所周知&#xff0c;ChatGPT的训练大致可分为下图中展示的几个阶段&#xff0c;其中&#xff0c;在Pretraining阶段&#xff0c;模型的训练数据是纯文本&#xff0c;目标是根据上文预测下一个token&#xff0c;而在后面的几个阶段中&#xff0c…

和ChatGPT的一番对话

试用了一下ChatGPT&#xff0c;问了几个问题&#xff0c;虽然对人工智能充满信心&#xff0c;但是ChatGPT给我的感觉还没有形成气候。TA的很多回答是基于一些网络信息进行的糅合&#xff0c;甚至只是简单的复制。不过&#xff0c;毕竟还是处在发展的初级阶段&#xff0c;存在一…

chatgpt这么火?前端如何实现类似chatgpt的对话页面

&#x1f4cb; 个人简介 &#x1f496; 作者简介&#xff1a;大家好&#xff0c;我是阿牛&#xff0c;全栈领域优质创作者&#x1f61c;&#x1f4dd; 个人主页&#xff1a;馆主阿牛&#x1f525;&#x1f389; 支持我&#xff1a;点赞&#x1f44d;收藏⭐️留言&#x1f4dd;…

实现chatgpt自然对话

1.概述 ChatGPT是当前自然语言处理领域的重要进展之一&#xff0c;通过预训练和微调的方式&#xff0c;ChatGPT可以生成高质量的文本&#xff0c;可应用于多种场景&#xff0c;如智能客服、聊天机器人、语音助手等。本文将详细介绍ChatGPT的原理、实战演练和流程图&#xff0c…

ChatGPT时代:ChatGPT全能应用一本通

引言 随着人工智能技术的不断发展和进步&#xff0c;我们进入了ChatGPT时代。ChatGPT是基于GPT架构的大型语言模型&#xff0c;它具备强大的自然语言处理和生成能力&#xff0c;使得我们能够进行更加自由、流畅的对话。作为ChatGPT的全能应用&#xff0c;它可以被视为一本通&a…

企业软件怎样利用ChatGPT?

文/明道云创始人任向晖 作为商业和科技话题的博主&#xff0c;不评论一下ChatGPT似乎是不应该的。毫无疑问&#xff0c;ChatGPT的出现已经远远超过了科技商业要闻的标准&#xff0c;它的革命性已经被飙速增长的用户所直接证明&#xff0c;以至于留给我们的问题只有两个&#xf…

ChatGPT有哪些应用场景?

&#x1f4d6; 作者简介&#xff1a;在职Java架构师&#xff0c;分享Java、架构相关知识 &#x1f4d6; 多年工作总结&#xff1a;Java学习路线总结&#xff0c;逆袭Java架构师 &#x1f4d6; 技术交流&#xff1a;定期更新Java硬核干货&#xff0c;不定期送书活动、助你实现技…

【分享】Github上有趣的ChatGPT应用源码与好用的ChatGPT插件

哈喽&#xff0c;大家好&#xff0c;我是木易巷&#xff01; 今天给大家分享几个Github上有趣的ChatGPT应用源码与好用的ChatGPT插件&#xff0c;一起来看看吧&#xff01; 一、Github上有趣的ChatGPT应用源码 1. ChatGPT 源码地址&#xff1a;https://github.com/lencx/Ch…

ChatGPT应用——充当 Linux 终端

我想让你充当 Linux 终端。我将输入命令&#xff0c;您将回复终端应显示的内容。我希望您只在一个唯一的代码块内回复终端输出&#xff0c;而不是其他任何内容。不要写解释。除非我指示您这样做&#xff0c;否则不要键入命令。当我需要用英语告诉你一些事情时&#xff0c;我会把…

ChatGPT应用场景: 基于对话生成的智能客服系统

关于ChatGPT&#xff0c;今天小编简单说下用在客服服务的要点。 ChatGPT可以用于开发基于对话生成的智能客服系统&#xff0c;帮助企业提供高效、便捷、满意的在线客服服务&#xff0c;从而提升客户体验和满意度。 以下是ChatGPT应用于智能客服系统的一些场景&#xff1a; 1.…

ChatGPT应用于软件测试中的切入口(干货!)

以上均为本人原创&#xff0c;转载请说明出处&#xff0c;谢谢&#xff01; 如果您觉得这篇文章还不错的话&#xff0c;请点击关注&#xff0c;转发&#xff0c;再看&#xff1b; 全是干货&#xff0c;话不多说 开搞&#xff01; 1. 测试想法生成器 可以使用ChatGPT技术&…

Edge加载weTab扩展,实现ChatGPT应用

1、找开Edge浏览器&#xff0c;点右上角三个点儿&#xff0c;如下图&#xff0c;再点【扩展】 2、在弹出的窗口中点【管理扩展】 我上这个中&#xff0c;上面已经存在【WeTab-免费ChatGPT新标签页】&#xff0c;说明我已经加载这个扩展项啦 3、再在弹出的扩展页中&#xff0c;…

ChatGPT-计算机应用新起点

ChatGPT是一款由OpenAI公司开发的大型语言模型&#xff0c;采用了GPT-3.5的架构&#xff0c;是目前最为先进的自然语言处理技术之一。该模型可以生成各种类型的自然语言文本&#xff0c;例如文章、对话、摘要等等&#xff0c;并可以理解语义和上下文&#xff0c;生成高质量的语…

ChatGPT 应用汇总及操作手册

汇总手册地址&#xff1a;https://www.mojidoc.com/05dbc-uvhdkr22fjazlowmiihngdoxvq-00b?continueFlag8f75ea3c60f02d7aee7fc531bc0ee944 GPT-3 相关 AI 工具汇总&#xff1a;共615 个 AI 技术落地的工具&#xff0c;包含了共 179 个使用场景&#xff0c;点击这里直接访问 h…

ChatGPT应用实践

运用ExcelPowerBIChatGPT&#xff0c;先让报表有形状&#x1f4b9;&#xff0c;再到“会说话”。全套方案在我的一亩三分地落地了。&#x1f60b;支持私有化部署且近乎零成本(非商用)。

ChatGPT应用与Python实战开发

最近什么最火一定是ChatGPT的AI技术&#xff0c;那什么语言最火呢&#xff0c;那一定是Python语言。这两个最火的语言在一起能擦出什么样的火花呢&#xff0c;来蚂蚁老师课堂学习新鲜出炉的课程吧&#xff0c;帮你解决一大部分的疑惑&#xff0c;感兴趣的小伙伴&#xff0c;查看…

chatgpt应用程序软件开发

作为一个语言模型&#xff0c;ChatGPT被用于各种应用程序和软件中&#xff0c;可以提供以下功能&#xff1a; 自然语言对话&#xff1a;ChatGPT可以与用户进行自然的、流畅的自然语言交互&#xff0c;从而帮助用户解决问题、获取信息或提供娱乐。 文本生成&#xff1a;…