OpenAI透露ChatGPT未来发展计划:要与人类价值保持一致

article/2025/4/19 20:07:21

d2bf3f5f6eb794b4e5650ea32392a102.jpeg

编|张倩、陈萍 

源|机器之心

OpenAI 推出的 ChatGPT 非常强大,但依然存在一些问题,比如输出编造或带有偏见的内容、定制化程度低…… 在最新的一篇博客中,OpenAI 披露了他们未来的一些改进计划。

08edabb8e1eb72d1cf63b78cd03145c4.png

OpenAI 的使命是确保通用人工智能(AGI)惠及全人类。因此,我们对我们在实现 AGI 的过程中所构建的人工智能系统的行为,以及决定这种行为的方式进行了大量的思考。

自从我们推出 ChatGPT 以来,用户已经分享了他们认为有政治偏见、攻击性或其他令人反感的产出。在许多情况下,我们认为大家所提出的关切是合理的,并发现了我们系统的真正局限性,我们希望解决这些问题。

但与此同时,我们也看到了一些误解,这些误解与「我们的系统和政策如何共同塑造 ChatGPT 的输出」有关。

博客要点总结如下:

  • ChatGPT 的行为是如何形成的;

  • 我们计划如何改进 ChatGPT 的默认行为;

  • 我们想允许更多的系统定制;

  • 我们会努力让公众对我们的决策提出更多意见。

我们的首要任务

与普通软件不同,我们的模型是大规模的神经网络。它们的行为是从广泛的数据中学习的,而不是明确的编程。打个不那么恰当的比方,这个过程更类似于训练一只狗,而不是普通的编程。

首先,模型要经历一个「预训练」阶段。在这个阶段中,模型通过接触大量的互联网文本(以及大量的观点)来学习预测一个句子中的下一个词。接下来是第二个阶段,我们对模型进行「微调」,以缩小系统的行为范围。

截至目前,这个过程还不完善。有时,微调过程没有满足我们的意图(产生一个安全、有用的工具)和用户的意图(获得一个有用的输出以响应给定的输入)。随着 AI 系统变得越来越强大,改进我们使 AI 系统与人类价值保持一致的方法成为我们公司的首要任务。

两大步骤:预训练和微调

构建 ChatGPT 的两个主要步骤如下:

02408fc80d08d655cf3b00ad090e0319.png

首先,我们对模型进行 「预训练」,让它们预测包含互联网部分内容的大数据集的下一步是什么。它们可能会学习补全「她没有向左转,而是转到了__」这个句子。通过从数十亿的句子中学习,我们的模型掌握了语法、关于世界的许多事实,以及一些推理能力。他们还学会了这几十亿句子中存在的一些偏见。

然后,我们在一个范围更窄的数据集上对这些模型进行「微调」,这些数据集是由遵循我们提供的指南的人类评审员精心制作的。由于我们无法预测未来用户可能输入我们系统的所有信息,所以我们没有为 ChatGPT 将遇到的每一个输入编写详细的说明。

取而代之的是,我们在指南中概述了几个类别,我们的评审员用这些类别来审查和评价一系列示例输入的可能模型输出。然后,在使用过程中,模型从评审员的反馈中归纳出来,以便对特定用户提供的广泛的具体输入做出反应。

评审员的作用 & OpenAI 在系统开发中的策略

在某些情况下,我们可能会给我们的评审员提供关于某类输出的指导(例如,「不要完成非法内容的请求」)。在其他情况下,我们与评审员分享的指导是更高层次的(例如,「避免在有争议的话题中站队」)。重要的是,我们与评审员的合作不是一劳永逸的,而是一种持续的关系。在这种关系中,我们从他们的专业知识中学习了很多。

微调过程的很大一部分工作是与我们的审查员保持一个强大的反馈回路,这涉及到每周的会议,以解决他们可能有的问题,或对我们的指导进行进一步说明。这种反复的反馈过程是我们训练模型的方式,使其随着时间的推移越来越好。

解决偏见

对于 AI 系统,偏见问题由来已久,许多研究者对此表示担心。我们坚定地承诺会解决这一问题,并公开意图和进展。为了表达实际行动进展,我们在此分享了与政治和争议有关话题的部分指南。该指南明确指出评审员不应偏袒任何政治团体。尽管如此,偏见还是可能会出现。

a6583bab72bde3b170aaff208c2be2c7.png

指南地址:

https://cdn.openai.com/snapshot-of-chatgpt-model-behavior-guidelines.pdf

尽管分歧始终存在,但我们希望通过这篇博客以及一些指南,大家可以更深入地了解我们是如何看待偏见的。我们坚信科技公司必须负责任地制定出经得起审查的政策。

我们一直在努力提高这些指南的清晰度,基于从 ChatGPT 发布到目前为止所了解到的情况,我们将向评审员提供关于与偏见相关的潜在陷阱和挑战,以及有争议的数据和主题更清晰的说明。此外,作为正在进行的透明度计划的一部分,我们正在努力以不违反隐私规则和规范的方式共享有关评审员的汇总统计信息,因为这是系统输出中潜在偏见的另一个来源。

基于规则奖励和 Constitutional AI(原发人工智能方法)等进展之上,我们目前正在研究如何使微调过程更容易理解和可控。

未来发展方向:系统构建块

为了实现我们的使命,我们致力于确保更广大的人群能够使用 AI 和 AGI,并从中受益。我们认为要实现这些目标,至少需要三个构建块

1. 改进默认行为:我们希望 AI 系统做到开箱即用,让尽可能多的用户发现我们 AI 系统确实有用,并认为我们的技术理解并尊重他们的价值观。

为此,我们对研究和工程进行了投资,以减少 ChatGPT 对不同输入响应产生的微妙偏见。在某些情况下,ChatGPT 会拒绝输出应该输出的内容,而在某些情况下情况又相反,它输出了本不该输出的内容。我们相信,在这两个方面 ChatGPT 都有改善的可能。

此外,我们的 AI 系统在其他方面还有改进的空间,例如系统经常会「编造东西」,对于这一问题,用户反馈对改进 ChatGPT 非常宝贵。

2. 在广泛的范围内定义 AI 价值:我们相信 AI 应该成为对个人有用的工具,因此每个用户都可以根据一些限制条款进行定制使用。基于此,我们正在对 ChatGPT 的升级进行开发,以允许用户轻松自定义其行为。

这也意味着,一些人强烈反对的输出,对另一些人是可见的。实现这一平衡面临巨大的挑战,因为将定制化做到极致可能会导致有些人恶意使用我们的技术,以及盲目放大 AI 的性能。

因此,系统行为总会有一些限制。挑战在于定义这些界限是什么。如果我们试图自己做出所有这些决定,或者如果我们试图开发一个单一的、整体的 AI 系统,我们将无法履行「避免权力过度集中」的承诺。

3. 公共输入(默认值和硬性界限):避免权力过度集中的一种方法是让使用 ChatGPT 等系统或受其影响的人反过来能够影响系统规则。

我们认为,默认值和硬性界限这部分内容应该集中做出,虽然实施起来困难重重,但我们的目标是尽可能多地纳入更多观点。作为起点,我们以「red teaming」的形式寻求外部对我们技术的投入。我们最近还开始征求公众对 AI 教育的意见(我们正在部署的一个特别重要的环境)。

结论

结合上述三个构建模块,我们可以得出如下框架

370d70e0e1f74f6a06ec0bfd27863bf0.png

有时我们会犯错,但当我们犯错时,我们将进行学习并迭代模型和系统。此外,我们还要感谢 ChatGPT 用户等人员,让我们时刻记住责任、保持警惕,我们很高兴在未来几个月内分享更多关于在上述三个领域的工作。

原文链接:https://openai.com/blog/how-should-ai-systems-behave/

827eb52d0016cac89e2f7f179841fbe5.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群


http://chatgpt.dhexx.cn/article/SUBBUnXq.shtml

相关文章

ChatGPT商业前景如何?人工智能未来会如何发展?

ChatGPT不仅在互联网和多个行业引发人们的关注,在投资界还掀起了机构对人工智能领域的投资热潮。人工智能聊天程序ChatGPT在去年11月亮相之后,在推出仅两个月后,今年1月份的月活用户已达到了1亿,成为史上增长最快的消费者应用程序…

ChatGPT未来将是什么样子?《你好,ChatGPT》深度阐述

前言 人工智能技术的发展已经逐渐改变了我们的生活和工作方式,其中,语言模型技术是近年来关注度很高的一个领域。在这个领域,ChatGPT是一个备受瞩目的产品,它不仅是一个聊天程序,更是一个能够产生具有连贯性和逻辑性的…

ChatGPT 未来的前景以及发展趋势

当谈到ChatGPT的未来和发展趋势时,需要考虑人工智能技术以及文本生成和交互的迅速发展。在这方面,ChatGPT的前景非常有希望,因为它是一种迄今为止最先进的人工智能技术之一。 ChatGPT是一种基于机器学习的自然语言处理技术,它能够…

ChatGPT是未来吗?

ChatGPT自2022年11月份发布以来,获得了很多关注,最近GPT-4、文心一言陆续发布,也让大家有了更多的感受。这次再重新审视一下ChatGPT,谈谈未来到底是怎样的。 先拿出来ChatGPT官网对自己的一些说明: ChatGPT面临的主要…

从一路高歌到遭多国“封杀”,ChatGPT未来将是什么样子?

“IT有得聊”是机械工业出版社旗下IT专业资讯和服务平台,致力于帮助读者在广义的IT领域里,掌握更专业、更实用的知识与技能,快速提升职场竞争力。 点击蓝色微信名可快速关注我们! 人工智能技术的发展已经逐渐改变了我们的生活和工作方式&…

ChatGPT体验感受

对话人机 ------ 从Wechat 到 We chat with GPT 声明:本文未教授如何注册的ChatGPT, 仅记录与该语言模型的对话 文章目录 对话人机------ 从Wechat 到 We chat with GPT什么是ChatGPT?如何使用ChatGPT?错误的使用姿势正确的使用姿势另辟蹊径 Good news! 更多内容请看文末另…

“ChatGPT 互动体验:我做了一个可以在线使用的网站“

ChatGPT是什么? ChatGPT本质是一个应用在对话场景的语言模型,基于GPT3.5通过人类反馈的强化学习微调而来,能够回答后续问题、承认错误、质疑不正确的前提以及拒绝不适当的请求。 ALAPI 是什么? ALAPI 是国内的一个接口开发聚合平台&#xff…

分享ChatGPT初体验总结

ChatGPT是一种由OpenAI训练的大型语言模型。它的原理是基于Transformer架构,通过预训练大量文本数据来学习如何生成人类可读的文本,然后通过接受输入并生成输出来实现对话。 今天小编分享一些ChatGPT 真实有趣的示例 ,让大家体验一下ChatGPT…

在Jupyter Notebook,沉浸式体验ChatGPT

大家好,我是章北海mlpy 写代码,修Bug是 ChatGPT 目前最擅长的领域之一 今天向大家推荐一个刚刚开源的Python包 安装后可以直接在IPython和Jupyter Notebook中直接调用ChatGPT 随问随答,直接copy代码,有bug也能无缝衔接地修复。…

ChatGPT java体验

1.可以帮你实现设计模式模型 2.可以帮你优化代码&#xff0c;比如下面这段代码获取时间集合的方法 public List<Date> getDealTimeList(Integer showType){List<Date> timeList new ArrayList<>();Calendar cal new GregorianCalendar();cal.set(Calenda…

ChatGPT 大量封号,小白如何快速体验 ChatGPT(3)

根据 OpenAI 开放地区政策[1]&#xff0c;截止到 2023 年 4 月 10 号&#xff0c;ChatGPT 服务 不对中国的大陆、香港和澳门开放&#xff0c;因此大陆的小伙伴们无法直接体验最新的 AI 技术。 即便如此&#xff0c;有很多热心网友搭建了 ChatGPT 镜像网站&#xff0c;即把网站部…

技术沙龙 | 探索软件测试前沿技术及最佳实践,体验ChatGPT在测试领域中的应用

作为软件开发领域中至关重要的一环&#xff0c;软件测试的重要性日益凸显。然而&#xff0c;随着软件测试开发技术的不断发展&#xff0c;软件测试也面临着越来越多的挑战&#xff0c;为了更好地应对这些挑战&#xff0c;测试人社区将持续举办技术沙龙活动&#xff0c;为测试人…

体验ChatGPT后,陷入沉思...

1 前言 最近 chatGPT 爆火网络&#xff0c;ChatGPT 到底是什么&#xff0c;今天就一起了解和体验一下。 ChatGPT 是由OpenAI开发的一个人工智能聊天机器人程序&#xff0c;该程序使用基于GPT-3.5架构的大型语言模型并通过基于人类反馈强化学习进行训练。 模型在Microsoft Azure…

体验了下ChatGPT

对话1&#xff1a; 对话2&#xff1a; 从ChatGPT发布以来&#xff0c;相关的话题就不断出现在我关注的一些社区里。今天花了点时间体验下&#xff0c;聊聊自己的想法。 写作向来不是我的专长&#xff0c;有时候脑子里想的是一回事&#xff0c;写出来又是另外一回事&#xff…

体验ChatGPT在具体应用场景下的能力与表现——vuedraggable的move多次触发问题

当下人工智能模型在满天飞&#xff0c;今天拿一个具体的应用场景&#xff0c;来体验下ChatGPT的能力与表现&#xff0c;看看是否能解决实际问题。 顺便填一下之前遇到的一个具体的坑&#xff1a;vuedraggable的move多次触发问题。 背景 背景是这样的&#xff0c;实现低代码开…

自己不想动手,也想体验chatgpt怎么办?slack中添加Claude应用报错403?

大家好,我是雄雄,欢迎关注微信公众号:雄雄的小课堂 现在是:2023年4月16日21:58:50 前言 前两天,推荐了一篇文章:一步一步教你搭建自己的独享chatgpt,免费、无需科学上网,速度还快!!。群内好多人都按照教程实现了在slack中添加claude应用,开始愉快的使用AI智能了。 …

加入bing体验chatGPT大军中来吧,它来了!

1 第一步&#xff1a;加入候选名单 1、首先需要加入候选名单 https://www.microsoft.com/zh-cn/edge?formMA13FJ 2、下载最新的Edge浏览器、androd、iOS都有试用版本&#xff08;可以看到iOS加护当前已满&#xff09; 这里我下载的是dev版本&#xff0c;Canary版本由于是…

ChatGPT最新的体验方法

第一步&#xff0c;百度搜索csdn 第二步&#xff1a;打开第一个csdn网站 第三步&#xff1a; 点击chatGPT&#xff0c;输入你想沟通的内容 第四步&#xff1a;默默的感受chatGPT的强大和普遍。

计算机视觉研究院亲自体验ChatGPT的感受,太疯狂了!

关注并星标 从此不迷路 计算机视觉研究院 公众号ID&#xff5c;ComputerVisionGzq 学习群&#xff5c;扫码在主页获取加入方式 计算机视觉研究院专栏 作者&#xff1a;Edison_G 现在ChatGPT受到业内越来越多的关注&#xff0c;今天分享一些国内要实现该技术的难点&#xff0c;以…

ChatGPT实战100例 - (10) 提前体验ChatGPT的多模态绘图功能

文章目录 ChatGPT实战100例 - (10) 提前体验ChatGPT的多模态绘图功能一、需求与思路二、基本调教三、开始秀四、 总结 ChatGPT实战100例 - (10) 提前体验ChatGPT的多模态绘图功能 这个绘图其实比较基础&#xff0c;只能说是能显示个图吧 真要出图&#xff0c;隔壁 文心一言 秒杀…