ChatGPT 原来是这样工作的(上)

article/2024/12/22 5:12:38

大家好,我是技福的小咖老师。

ChatGPT 发布以来,蹿红的速度比马斯克设计的火箭还快。据报道,ChatGPT在开放试用的短短几天里,就吸引了超过 100 万互联网注册用户。ChatGPT如同是“搜索引擎+社交软件”的结合体,能够在实时互动的过程中获得问题的合理答案。

公众一直在玩ChatGPT,ChatGPT 实际是如何工作的呢?虽然其内部实现的细节尚未公布,但从最近的研究中,我们还是可以一窥其基本原理的。内容比较多我们分两次给大家讲解。

什么是ChatGPT ?

ChatGPT 是OpenAI的最新语言模型,是基于GPT-3.5(Generative Pre-trained Transformer 3.5)架构开发的对话AI模型。与许多大型语言模型类似,ChatGPT能够生成多种风格和不同目的的文本,但具有更高的精度、细节和连贯性。它代表了OpenAI大语言模型系列的下一代,它的设计重点是交互式对话

OpenAI使用RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习)技术对 ChatGPT 进行了训练,并且 使用监督学习和强化学习的组合来调优 ChatGPT。该方法在训练中使用了训练师的反馈,用以最小化有害、失真或是有偏见的内容输出。

 

大型语言模型中的能力与一致性

Capability vs Alignment in Large Language Models

alignment vs capability" can be thought of as a more abstract analogue of "accuracy vs precision

在机器学习时,模型的能力是指模型执行特定任务或任务集的能力。模型的能力通常通过以下方式进行评估:如何优化其目标函数,定义模型目标的数学表达式。例如,用于预测股票价格的而设计的模型,可能有一个目标函数,用于衡量模型预测的准确性。如果模型能够准确预测股票价格随时间的变化,那么它将被视为具有较高的执行能力的模型。

一致性关注的是我们实际上希望模型做什么。它提出的问题是“目标函数是否符合我们的意图”,并且基于模型的目标和行为,在多大程度上与我们人类的价值观和和期望一致。举个简单的例子,假设我们要训练一个鸟类分类器,把鸟类分类为“麻雀”或“知更鸟”,并使用对数损失为训练目标,尽管我们的最终目标是很高的分类精度。该模型可能具有较低的对数损失,即模型的能力较强,但精度较差,这就是一个不一致的例子。模型可以优化培训目标,但与我们的最终目标不一致。

然而,在实际应用中,这些模型的目的是执行某种形式的有价值的认知工作,这些模型的训练方式与我们希望使用它们的方式之间存在着明显的分歧。尽管从数学上讲,机器计算的单词序列的统计分布可能是一种高效的选择,但实际上,我们会通过选择最适合给定情境的文本序列来生成语言,并使用我们的背景知识和常识来指导这一过程。当语言模型用于需要高度信任或可靠性的应用程序(如对话系统或智能个人助理)时,这可能会成为一个问题。

虽然在过去几年里,这些基于大量数据训练的模型变得极为复杂、强大,但当应用于实际人们生活生产时,它们往往无法发挥出潜力。大型语言模型中的一致性问题通常表现为:

缺乏有效帮助

-- 没有遵循用户的明确指示。

虚构幻象

-- 模型会虚构不存在或错误的事实。

缺乏可解读性

-- 人们很难理解模型是如何得出特定决策或预测结果的。

训练内容偏见有

-- 经过有偏见、有害数据训练的语言模型,可能会在输出中重现这些数据,即使没有明确指示这样做。

但具体来说,一致性问题是从何处来的?它是语言模型的训练方式本身就容易产生不一致吗?

语言模型训练策略如何产生

How language model training strategies can produce misalignment

Next-token-prediction 和 masked-language-modeling 是用于训练语言模型的核心技术,例如:在第一种方法中,模型被赋予一系列单词(或“标记”,即部分单词)作为输入,并被要求预测序列中的下一个单词。假如给模型输入句子

"The cat sat on the"

它可能会预测下一个单词为「mat」、「chair」或「floor」,因为在前面的上下文中,这些单词出现的可能性很高;语言模型实际上能够预估输入内容前面的序列,每个可能使用的单词的可能性

masked-language-modeling 方法是 Next-token-prediction 的变体,其中输入句子中的一些词被替换为特殊标记,例如 [MASK]。然后,模型被要求预测应该插入的正确单词。如果给模型一个句子:

“The [MASK] sat on the ”

它可能会预测下一个单词是「cat」、「dog」, 或 「rabbit」。

这些目标函数的一个优点是,它允许模型学习语言的统计结构,例如常见的单词序列和单词用法模式。这通常有助于模型生成更自然更流畅的文本,并且是每个语言模型预培训阶段的一个重要步骤。

然而这些目标函数也可能导致问题,主要是因为模型不能区分重要错误和不重要错误。举个简单的例子,如果给模型输入句子:

"The Roman Empire [MASK] with the reign of Augustus."

它可能会预测 MASK 位置应该填入「began」或「ended」,因为这两个词的出现的可能性在之前都是很高的。

一般来说,这些训练策略可能会导致语言模型在一些更复杂的任务时不一致,因为一个模型仅被训练用来预测文本序列中的下一个词,可能不一定能学习到其含义的更高级表达。因此,该模型很难推广到需要更深入理解的语言任务。

研究人员和开发人员正在研究各种方法,来解决大型语言模型中的一致性问题。ChatGPT 基于最初的 GPT-3 模型,开始使用了人类反馈来指导学习过程,对其进行进一步的训练,来解决模型的不一致问题。所使用的具体技术就是前面提到的 RLHF。ChatGPT 是第一个将此技术用于实际生活模型的第一个案例

那么ChatGPT 是如何利用人类反馈来解决一致性问题的呢?咱们下期继续讲解

大家如果有想讨论的内容,欢迎留言!关注技福小咖,请帮忙点赞分享,您的支持是我们最大的动力!

参考内容:
How ChatGPT actually works


http://chatgpt.dhexx.cn/article/w7sga0CA.shtml

相关文章

给程序员的ChatGPT使用指南:优化工作流程的 3 种实用方法

ChatGPT for Coders: 3 Practical Ways to Optimise your Workflow 自从 ChatGPT 发布以来,我在互联网上看到了很多关于它对未来编程可能意味着什么的讨论。 肯定有很多“FUD”在那里传播,但它基本上归结为两个论点: 编程将继续有利可图&…

ChatGPT能承担哪些工作?

ChatGPT拥有高效的自然语言处理能力,它最容易取代的领域可能是:文本分类、聊天机器人、文本生成、问答系统、文字识别和自动翻译方面。最容易取代的职业可能是:客服人员、技术类、媒体类、教师、法律类、金融类。使相关的人员在工作生活中更加…

重磅!ChatGPT 网页版来啦!响应速度超快!

平替 ChatGPT 继公众号对接 ChatGPT 以来,经过大家的试用与提出的建议,上线、优化了诸多功能,使得我们的公众号几乎完美~ 在此之上,不负众望,五一假期掏粪三天三夜,平替 ChatGPT 网页版 已经上线&#xf…

2023 最新ChatGPT网页源码 无需KEY打开即用

买了些key放着也是放着,所以干脆集成到源码里面了,不需要大家输入key密钥就可以用,上传到宝塔搭建即可!

2023 网页chatgpt 最新模型 可自定义api

最新网页版chatgpt 支持自定义api 国内服务器,虚拟主机都支持搭建 chatgpt 最新模型 自定义api入口:域名/adminkey.php 直接把源码放到根目录即可运行

怎么看待ChatGPT封号这件事呢?

最近的ChatGPT大量封号,刷爆了全网,我的两个个人账号被封禁了,不知道大家最近有没有遇到相关的报错信息,要么就是检查你当前的浏览器配置,最后来一个access denied,要么直接就给你来一个当前的国家不支持。…

开源chatgpt网站源码 带完整搭建教程

分享一个开源版的chatgpt网站源码,功能强大,带完整的搭建教程。 春哥AI智能助理系统源码,是一款非常强大的人工智能对话系统,它可以陪你聊天,帮你写文章,帮你写论文,帮你写代码,帮你…

ChatGPT中文网页版带PHP接口源码

☑️ 品牌:ChatGPT ☑️ 语言:PHP ☑️ 类型:ChatGPT ☑️ 支持:PCWAP 🎉有需要的朋友记得关赞评,浏览底部查看!!! 🎉 ✨ 源码介绍 ChatGPT 中文网页版带PHP…

2023最新ChatGPT网页版源码V4.7.8版+新增回答复制功能/功能强大

正文: V4.7.8 优化公告弹出必须点击"我记住啦"才可以关闭 防止用户误触没看到公告 优化手机端输入框有时候不下滑BUG 修复后台KEY密钥自动增加BUG 新增是否开启前台客服按钮开关 新增回答复制功能 程序: wweorgs.lanzouu.com/ihg980wag13i 图片:

使用 Tampermonkey 插件流畅使用 ChatGPT 网页端教程

在本教程中,我们将详细介绍如何使用 Tampermonkey 插件改善您在浏览器中使用 ChatGPT 网页版的体验。由于某些原因,浏览器访问 ChatGPT 容易出现断开连接或报错的情况。使用 Tampermonkey,您可以运行一个用户脚本,解决这些问题&am…

一键部署你的私人 ChatGPT 网页版,这款开源应用太牛了

一键免费部署你的私人 ChatGPT 网页应用。 在线部署 准备好你的 OpenAI API Key,进入 https://vercel.com/new开始部署: 环境变量 本项目大多数配置项都通过环境变量来设置。 OPENAI_API_KEY (必填项):OpanAI 密钥&…

2023全新ChatGPT网页程序源码V4.2版本+支持用户付费套餐/有后台模块

正文: 4.2版本来了,优化新增了不少东西,安装简单 安装教程: 搭建宝塔 解析域名 上传程序至根目录 配置数据库信息:lib/config.php 导入数据库 PHP选择:7.3 访问网页即可! 配置APIKEY,登录网站后台自定义配置&#xff0c…

2023最新商业版ChatGPT网页版源码V3.9+支持用户付费/功能强大

正文: 3.9版本已经更新! 安装教程: 搭建宝塔 解析域名 上传程序至根目录 配置数据库信息:lib/config.php 导入数据库 PHP选择:7.3 访问网页即可! 配置APIKEY,登录网站后台自定义配置,不然网站无法使用! 网站…

2023最新ChatGPT网页版源码/支持付费购买套餐功能/UI也很不错

正文: 2.0版本的,前端模板已经更新了,之前那个太丑了,所以换成现在这样了 第一步-配置APIKEY:在"index.php"最顶部配置自己的APIKEY,不然网站无法使用! 第一步-配置数据库:lib/config.php 第三步-导入数…

最新ChatGPT网页版源码无需KEY/打开就能用

简介: 买了些key放着也是放着,所以干脆集成到源码里面了,不需要大家输入key密钥就可以用,上传到宝塔搭建即可! 云盘地址: http://zijieyunpan.cn/m2duvYSjvrC 阅览:

基于Vercel自建ChatGPT网页应用

因为平时我们在使用ChatGPT官方提供的网页应用的时候,总是经常访问不了,或者经常报错,越来越频繁,一旦你离开页面太久,再返回跟它对话的时候,就会出现如下报错等等。 An error occurred. If this issue per…

2023全新UI商业版ChatGPT网页版源码V4.7.7+支持Ai绘画

正文: 安装教程: 搭建宝塔 解析域名 上传程序至根目录 配置数据库信息:lib/config.php 导入数据库 PHP选择:7.3 访问网页即可! 配置APIKEY,登录网站后台自定义配置,不然网站无法使用! 网站后台地址/admin 默认账号:admi…

精心设计的ChatGPT网页版源码最聪明的镜像ChatGPT

demo软件园每日更新资源,请看到最后就能获取你想要的: 1.精心设计的 ChatGPT网页版源码 最聪明的镜像ChatGPT ChatGPT网页版源码 最聪明的镜像ChatGPT 支持GPT3.5turbo以及GPT4.0turbo的各种版本模型 精心设计的 UI,响应式设计,支持深色模式 极快的首…

ChatGPT网页版(基于SpringBoot和Vue)

目录 1.使用说明1.1 登录1.2 获取OpenAI KEY或User Token1.3 创建对话1.4 删除会话 1.使用说明 1.1 登录 登录http://chatgpt.alpacos.cn/ 1.2 获取OpenAI KEY或User Token 如果自己有OpenAI的token(sk-xxxx)的话,可以直接输入,点击右上角绑定按钮&am…

ChatGPT实现HTML网页文本提取

网页自动化工具 既然ChatGPT对于编程语言有非常强大的理解能力,那么它是否可以用来自动化地处理网页呢?答案是肯定的。ChatGPT可以使用机器学习算法来识别网页元素中的文本,并抽取出有用的信息。 例如我们提供一段层数比较多的相对来说较为…