OpenAI发布ChatGPT!手把手debug代码!

article/2025/4/20 7:48:12

卷友们好,我是rumor。

已经好久没看OpenAI的官网[1]了,但今天冥冥之中感觉受到了什么召唤,心想GPT4什么时候发布,莫名地就打开了,果然有料:

d955d740b2a035bebcd8e74725b90ce2.jpeg

试用:https://chat.openai.com/

它把魔抓又伸向对话了!来一起看看官方放出的case吧:

帮人Debug代码,并进行多轮询问:

d38ad5a6b7358d950df15e4690fddd52.jpeg

识别出危险问题并拒绝回答,但用户说明意图后给出了更好的回复:

015d088c676da3df29e7c5176886c8bf.jpeg

执行指令,甚至改很多遍也不生气:

f738e6fc0d3dad0d203ccc1954c21af1.jpeg

还有个指代消解的case太长就不放了,OpenAI在最后还拿InstructGPT做了对比,可以看到InstructGPT只是冰冷地执行指令,而ChatGPT则更有温度一些。

从上面的例子可以看到,对比今年其他厂的对话工作,ChatGPT有几项明显的优点:

  1. 基于GPT3.5,有着更多样的训练数据,别的我不知道,反正debug代码有点东西

  2. 强大的多轮上下文理解能力,从指代消解、写信的例子看出来的,如果对历史消息没有很好的记忆理解,可能就新起一个话题了

  3. 更像人。目前大部分模型都是直接回答,而ChatGPT显然跟用户有一个「Chat」的过程,比如debug代码的时候,上来先回复「很难说,再多给点信息」

更像人的对话策略,是很难做出来的,因为我们不知道怎么才算「像个人」。谷歌为了解决这个问题,曾经拆分出了一堆指标。

而这次OpenAI则是采用了和DeepMind Sparrow[2]一样的策略,既然不知道用哪些维度衡量对话的好坏,那直接基于用户的反馈去训练,让模型自己学就好了。

基于反馈的训练,那不就是宇宙的终点强化学习吗。

d2468da75af34b5481ce56fb8f60615e.jpeg

ChatGPT的制作分为如下几步:

  1. 用监督数据基于GPT3.5训练一个对话模型,训练数据是标注人员手把手写出来的

  2. 人工标注模型生成的多个结果,训练一个给对话回复打分的模型

  3. 用打分模型作为反馈,基于PPO算法训练一个对话模型

上面的步骤其实跟DeepMind的工作很像,也很直觉,但DeepMind额外针对黄赌毒对话做了些训练,目前还不知道ChatGPT是怎么实现的,不过以他们LM一把梭的性格,有可能全是数据堆出来的。。。

当然,ChatGPT还是有一些局限的,比如:

  1. 说一些不明所以毫无疑义的话

  2. 重复问相同的问题,或者轻微调整后答案变化很大

  3. 很啰嗦,从case里也看出来了,这主要是训练数据带来的偏差,标注同学会更倾向长句子

  4. 也不是所有模糊情况都会反问

  5. 有些黄赌毒问题还是没法识别,作者们在打算用API解决

目前,为了让大家给出更多的反馈,OpenAI顺势在11.30-12.30之间举行了一个反馈比赛[3],感兴趣的同学可以积极参与。

最后,让我们对应该过阵子就会发布的GPT4拭目以待吧!

参考资料

[1]

OpenAI Blog: https://openai.com/blog/

[2]

Building safer dialogue agents: https://www.deepmind.com/blog/building-safer-dialogue-agents

[3]

Feedback Contest: https://cdn.openai.com/chatgpt/ChatGPT_Feedback_Contest_Rules.pdf

9eb9e01168eb7c2b04cc2c20ea7ff8c6.jpeg


我是朋克又极客的AI算法小姐姐rumor

北航本硕,NLP算法工程师,谷歌开发者专家

欢迎关注我,带你学习带你肝

一起在人工智能时代旋转跳跃眨巴眼

「不会debug代码的模型不是好AI」1375eae85757ad9919be1f2cc7481f4a.png


http://chatgpt.dhexx.cn/article/2WFWm3NZ.shtml

相关文章

文心一言发布,你怎么看?chatGPT

百度全新一代知识增强大语言模型“文心一言”于2021年3月16日正式发布,作为一款自然语言处理技术,它引起了广泛的关注和讨论。 首先,文心一言是一款具有重大意义的自然语言处理技术。在人工智能领域,自然语言处理技术一直是一个难…

ChatGPT(GPT3.5) OpenAI官方API正式发布

OpenAI社区今天凌晨4点多发送的邮件,介绍了ChatGPT官方API的发布。官方介绍文档地址为“OpenAI API”和“OpenAI API”。 ChatGPT(GPT3.5)官方API模型名称为“gpt-3.5-turbo”和“gpt-3.5-turbo-0301”。API调用价格比GPT text-davinci-003模型便宜10倍。调用费用为…

Google发布ChatGPT竞品Bard

北京时间2月7日凌晨,谷歌CEO桑达尔皮查伊(Sundar Pichai)在万众瞩目之下突然发布了谷歌的下一代对话AI系统Bard(https://blog.google/technology/ai/bard-google-ai-search-updates/)。 从博客中可以看出,此…

复旦发布国内首个类ChatGPT模型!已开放内测申请,代码将于3月发布

Pine 萧箫 发自 凹非寺量子位 | 公众号 QbitAI 没想到,众人加班加点抢“中国版ChatGPT”热度时,首个国内类ChatGPT模型竟然已经发布了! 砸出这个重磅消息的,不是紧锣密鼓宣传的BAT大厂,也不是直接出手几亿的投资大V&am…

OpenAI发布ChatGPT:程序员瞬间不淡定了

OpenAI发布ChatGPT:程序员瞬间不淡定了 12月1日,OpenAI发布了针对对话场景优化的语言大模型ChatGPT。ChatGPT是InstructGPT的兄弟模型,可以以对话的形式与用户交互,这使得ChatGPT能够回答问题、承认错误、质疑假设、拒绝不当问题…

ChatGPT-4震撼发布

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。GPT-4, 相较于…

ChatGPT API使用介绍

1.概述 随着人工智能技术的不断发展,越来越多的AI产品被应用到各个领域,其中最具代表性的莫过于人工智能语言模型。语言模型是一种可以通过学习大量语言数据来预测文本或语音的技术,其应用范围十分广泛,如智能客服、机器翻译、语…

ChatGPT详细介绍原理

ChatGPT的介绍 ChatGPT全称为“chat Generative Pre-trained Transformer”,翻译成中文就是生成型预训练变换模型。它是美国公司OpenAl在2022年11月30日发布研发的聊天机器人程序,能用于问答、文本摘要生成、机器翻译、分类、代码生成和对话Al。「l是一…

ChatGPT探索系列之六:思考ChatGPT的未来发展趋势和挑战

文章目录 前言一、未来发展趋势1. ChatGPT重塑数据分析之道2. ChatGPT颠覆企业运用人工智能和机器学习的途径3. ChatGPT颠覆自动化商业流程4. ChatGPT引领企业决策迈向新纪元 二、ChatGPT掀开未来充满机遇和挑战的新篇章总结 前言 ChatGPT发展到目前,其实网上已经有…

ChatGPT 未来会造成大量职业的裁员和失业吗?

大家好,小编来为大家解答以下问题,一个有趣的事情,一个有趣的事情,今天让我们一起来看看吧! 1、chatGpt来自那个国家? ChatGPT是一种聊天机器人技术,它来自美国,由OpenAI公司开发。…

ChatGPT 未来会对游戏行业带来哪些影响?

ChatGPT的出现,为整个游戏行业带来了新的思考。 ChatGPT是由微软发布的一个大型语言模型,在被训练之后能够进行对话式文本生成,目前已在多个领域取得了不小的进展,包括聊天机器人、智能客服等。 作为一款大型语言模型&#xff0c…

程序员要失业了?风靡全网的ChatGPT,到底有什么厉害之处

最近ChatGPT非常火,小编也尝试了下,看下其具体能解决的问题。OpenAI发布的免费机器人对话模型ChatGPT,目前还是处于测试阶段。 用它自己的回答:ChatGPT是一个基于大型语言模型的聊天机器人。它使用自然语言处理技术,能…

(文末送18本ChatGPT扫盲书)从一路高歌到遭多国“封杀”,ChatGPT未来将是什么样子?

文末一口气赠书18本, 这次就让你high个够。 人工智能技术的发展已经逐渐改变了我们的生活和工作方式,其中,语言模型技术是近年来关注度很高的一个领域。在这个领域,ChatGPT是一个备受瞩目的产品,它不仅是一个聊天程序…

【文末送18本ChatGPT扫盲书】从一路高歌到遭多国“封杀”,ChatGPT未来将是什么样子?

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦。💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通…

ChatGPT未来会取代程序员吗?

前言 程序员更多的时间是在调试和修改代码,包括讨论需求同步信息等,然后才是写代码-时间占比最多也就是20%~30%左右,而更时间占比更多的80%左右需要程序员用独立思考能力和批判性思维进行工作,这是ChatGPT目前还做不到的地方。即…

ChatGPT是否会取代程序员:一场关于职业未来的讨论

ChatGPT是否会取代程序员: 一场关于职业未来的讨论 目录 ChatGPT是否会取代程序员: 一场关于职业未来的讨论导读一、ChatGPT简介二、ChatGPT的使用三、ChatGPT是否会取代程序员?四、观点与看法五、展望未来 导读 随着人工智能的迅猛发展,许多领域都受到…

OpenAI透露ChatGPT未来发展计划:要与人类价值保持一致

编|张倩、陈萍 源|机器之心 OpenAI 推出的 ChatGPT 非常强大,但依然存在一些问题,比如输出编造或带有偏见的内容、定制化程度低…… 在最新的一篇博客中,OpenAI 披露了他们未来的一些改进计划。 OpenAI 的使命是确保通…

ChatGPT商业前景如何?人工智能未来会如何发展?

ChatGPT不仅在互联网和多个行业引发人们的关注,在投资界还掀起了机构对人工智能领域的投资热潮。人工智能聊天程序ChatGPT在去年11月亮相之后,在推出仅两个月后,今年1月份的月活用户已达到了1亿,成为史上增长最快的消费者应用程序…

ChatGPT未来将是什么样子?《你好,ChatGPT》深度阐述

前言 人工智能技术的发展已经逐渐改变了我们的生活和工作方式,其中,语言模型技术是近年来关注度很高的一个领域。在这个领域,ChatGPT是一个备受瞩目的产品,它不仅是一个聊天程序,更是一个能够产生具有连贯性和逻辑性的…

ChatGPT 未来的前景以及发展趋势

当谈到ChatGPT的未来和发展趋势时,需要考虑人工智能技术以及文本生成和交互的迅速发展。在这方面,ChatGPT的前景非常有希望,因为它是一种迄今为止最先进的人工智能技术之一。 ChatGPT是一种基于机器学习的自然语言处理技术,它能够…