类 ChatGPT 开源软件,开发者用的上吗?

article/2025/4/21 20:52:03

声明:本文是 Preethi Cheguri 所著文章《ChatGPT Equivalent Is Open-Source, But it Is of No Use to Developers》的中文译文。

原文链接:https://www.analyticsinsight.net/chatgpt-equivalent-is-open-source-but-it-is-of-no-use-to-developers/

类似于 ChatGPT 的软件现已开源,但这似乎对开发者们来说无用

第一个类似于 ChatGPT 的开源软件已经出现:这是一款基于谷歌 5,400 亿个参数的语言大模型 PaLM 架构,以及使用 RLHF(Reinforcement Learning from Human Feedback,即:使用强化学习的方法,利用人类反馈信号直接优化语言模型)的应用程序。“PaLM + RLHF” 复刻了 ChatGPT,并且现在已经开源,它是由负责逆向工程闭源 AI 系统(比如 Meta 发布的 Make-A-Video)的开发者,开发出来的一个功能类似于 ChatGPT 的文本生成模型。为了构建一个几乎可以完成 ChatGPT 任何任务的系统,包括起草电子邮件和代码提示,该系统结合了谷歌的语言大模型 PaLM 以及人类反馈强化学习(RLHF)的方法。

为什么这个“开源 ChatGPT”对开发人员没有用?

“PaLM + RLHF” 未经过预训练,换句话说:系统还没有接受网络上示例数据的必要训练,使其真正发挥作用。下载 “PaLM + RLHF” 后的体验感和使用 ChatGPT 时并不一致,“PaLM + RLHF” 需要生成该模型可以学习的千兆字节文本,然后找到能够处理训练需求的硬件。这是一个非常昂贵的过程,除非有资金雄厚的企业(或个人)专门去研究并供公众使用,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。

好消息是,复刻 ChatGPT 的其他几个项目发展迅速,包括研究团队 CarperAI 运营的项目。CarperAI 将与 OpenAI 研究小组 EleutherAI、初创公司 Scale AI 和 Hugging Face 合作,发布第一个由人类反馈训练的 “类-ChatGPT 即用型 AI 模型”。非营利组织 LAION 率先开展了一个使用最新的机器学习方法来复刻 ChatGPT 的项目,LAION 也为训练 Stable Diffusion 提供了初始数据集。那么使用了 RLHF 的 PaLM 应用程序能够做些什么?随着模型规模的扩大,跨活动的性能不断提高,新的机会也将出现。PaLM 可扩展到 5,400 亿个参数,相比之下,GPT-3 大约只有 1,750 亿个参数。

“ChatGPT” 与 “PaLM + RLHF”

带有人类反馈的强化学习是一种旨在更好地将语言模型与用户期望的目标保持一致的方法,同时也是 ChatGPT 与 “PaLM + RLHF” 都拥有的秘密武器。RLHF 需要使用包含提示的数据集微调语言模型,且该提示与人类志愿者预期模型将要表达的内容相匹配,例如:提示 “向 6 岁孩子解释机器学习”;回答 “机器学习是 AI 的一种形式……”。

“PaLM + RLHF” 中使用了 PaLM 语言模型。在反馈上述提示到改进后的模型中,由此生成多个回应,志愿者将每个回应由好到差进行排名,然后使用该排名来训练 “奖励模型”,此模型采用原始模型的回应并按偏好顺序对它们进行排序,然后过滤出给定提示的最佳答案。收集训练数据这个过程非常昂贵。

此外,训练过程也不便宜。PaLM 有 5,400 亿参数/语言模型组件,这些都是从训练数据中所习得的。而 2020 年的一项研究表明,开发一个只有 15 亿个参数的文本生成模型的费用可能高达 160 万美元。耗时三个月,训练了拥有 1,760 亿个参数的开源模型 Bloom,用了 384 个 Nvidia A100 GPU(每一个需要数千美金)。而运行 “PaLM + RLHF” 大小的训练模型同样也不简单。Bloom 需要配备装有大约八个 A100 GPU 的专用 PC。每年估计在单个的亚马逊网站服务实例上,运行 OpenAI 的文本生成 GPT-3(包含超过 1,750亿 个参数)的成本约为 87,000 美元。

结论:除非有资金雄厚的企业(或个人)投入训练,并公之于众,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。


免责声明:本文提供的信息仅代表作者/广告商的意见,而非投资建议——仅用于教育目的。通过阅读本文,文中信息并不构成 Analytics Insight 及团队的任何投资或财务建议。投资者应该寻求自己的独立财务或专业建议。在做出任何投资决定之前,请与财务顾问一起进行独立研究。Analytics Insight 和团队不对本文中提供的投资观点负责。


开源雨林围绕开源通识、开源使用、开源贡献三大方面构建知识体系,愿把长期积累的经验系统化分享给企业,在团队、机制、项目三方面提供合作,推动各企业更高效地使用开源、贡献开源,提升全行业开源技术与应用水平。

开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest ,欢迎通过 Pull Request 的形式贡献内容,通过 Issue 的形式展开讨论,共同维护开源雨林的内容。

欢迎关注“开源雨林”公众号,获取最新、最全的消息。


http://chatgpt.dhexx.cn/article/vWrcHnpA.shtml

相关文章

全球最大的 ChatGPT 开源替代品来了,支持 35 种语言,网友:不用费心买 ChatGPT Plus了!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 自去年 11 月 ChatGPT 面向公众测试以来,OpenAI 一直占据各大科技网站的头版头条,以及成为很多开发者工具的首选。ChatGPT 的落地不仅仅可以提供代码建议、总结长文本、回答问题…

全球最大的 ChatGPT 开源替代品来了!

本周赠书:《Elasticsearch数据搜索与分析实战》 出品 | CSDN(ID:CSDNnews)、整理 | 屠敏 自去年 11 月 ChatGPT 面向公众测试以来,OpenAI 一直占据各大科技网站的头版头条,以及成为很多开发者工具的首选。C…

中科院学术科研专用版 ChatGPT开源,斩获24.5K star

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 来自:新智元 最近,一位开发者在GitHub上开源的「科研工作专用ChatGPT」项目大受好评。论文润色、语法检查、中英互译、代码解释等等一键搞定。这个项目就是「中科院学术专业版 C…

ChatGPT开源模型3.5 API调用示例

调用开源api POSTMAN 这里我用的是postman,主要看请求头、body 、其它工具语言都是一致的 参数说明 地址 : https://api.openai.com/v1/chat/completions 请求方式 :post 请求头 : application/json Content-Type:ap…

前OpenAI团队打造ChatGPT开源平替来了!源代码、模型权重和训练数据集全部公开!...

来自:量子位排版:深度学习自然语言处理 公众号 ChatGPT的开源平替来了,源代码、模型权重和训练数据集全部公开。 它叫OpenChatKit,由前OpenAI研究员共同打造。 效果是这样儿的: 可以用简单的语言解释机器学习的概念&am…

ChatGPT 开源了第一款插件,都来学习一下源码吧!

3 月 23 日,OpenAI 又投出了一枚重磅炸弹:为 ChatGPT 推出插件系统! 此举意味着 ChatGPT 将迎来“APP Store”时刻,也就是围绕它的能力,形成一个开发者生态,打造出基于 AI 的“操作系统”! 插…

ChatGPT开源替代来了!参数量200亿,在4300万条指令上微调而成

OpenChatKit 是一个类 ChatGPT 开源工具包,内含一个 20B 参数量的大模型,而且该模型在 4300 万条指令上进行了微调。 转自《机器之心》 2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。 ChatGPT 功能…

ChatGPT开源平替来了,开箱即用!前OpenAI团队打造,GitHub刚发布就揽获800+星

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 丰色 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT的开源平替来了,源代码、模型权重和训练数据集全部公开。 它叫OpenChatKit,由前OpenAI研究员共同…

一大波 ChatGPT 开源项目,诞生了!

这是「进击的Coder」的第 764 篇技术分享 作者:小 G 来源:GitHubDaily “ 阅读本文大概需要 8 分钟。 ” 本月初 ChatGPT 问世,犹如平地惊雷般,在技术圈中引起了广泛讨论。 作为全球最大的开发者社区,GitHub 平台也在…

推荐 4个有趣实用的 ChatGPT 开源应用

以下是 4个有趣实用的基于 ChatGPT 的开源应用,让我们一起来探索吧! 1. ChatGPT 快捷键 ChatGPT Shortcut 是一个让你使用 ChatGPT 时生产力翻倍的快捷指令网站。你只需在该开源项目中复制提示词,稍加修改后发送给 ChatGPT,就能…

ChatGPT开源优秀项目推荐

作为一名开发者,总是希望能够找到一些优秀的开源项目来学习、使用和贡献。而随着人工智能技术的不断发展,ChatGPT作为一个开源的大型语言模型,已经成为了人们学习和开发自然语言处理应用的重要工具。在这篇技术博客中,我将向大家介…

ChatGPT 开源替代项目整理

项目作者 nichtdax 整理了 9 个开源的 ChatGPT 平替项目。接下来会一一介绍。 项目地址:https://github.com/nichtdax/awesome-totally-open-chatgpt PaLM-rlhf-pytorch 第一个项目是「PaLM-rlhf-pytorch」,项目作者为 Phil Wang。该项目是在 PaLM 架构之…

5 个令人惊艳的 ChatGPT 项目,开源了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 自 3 月初 Open AI 开放 ChatGPT API 以来,GitHub 上诞生的开源项目数量之多,着实让我应接不暇。 今天,我将着重挑选几个对日常工作、生活、学习帮助较大…

6 个令人惊艳的 ChatGPT 项目,开源了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 过去一周,技术圈的各个爆炸新闻,可以说是让我真正见证到了什么叫人间一日,AI 一年。 首先是 New Bing 对所有用户放开,注册即可用&#xff0…

开源版ChatGPT,30分钟训完,性能堪比GPT3.5!

转自:新智元 话说,ChatGPT 开源,是一件好事吗? 此前,OpenAI 不 Open 的事件,已经引发了坊间的诸多争议。 光放出基准和测试结果,不提供训练数据、成本、方法,是真的要「赢家通吃」了…

最近很火的ChatGPT究竟是什么?本文解释得非常全面,还通俗易懂

目录 01 ChatGPT是什么? 02 ChatGPT能做什么? 1)回答问题。 2)撰写文章。 3)总结提炼。 4)生成代码。 03 ChatGPT 的缺点和问题 04 ChatGPT的未来前景 1)搜索。 2)阅读…

知乎、百度会被ChatGPT取代吗?百度文心一言胜算如何

有人说ChatGPT革了知乎的命,这种看法是很直观能理解的,因为知乎上面有问题(题主),也有很多人回答问题,解决题主的疑惑,其实这种形式和ChatGPT的“一问一答”“知识分享”或“对话交流”很相像。…

如何让ChatGPT写出更符合知乎调性的文章

文 / 韩彬(微信公众号:量子论) 很多朋友疑问,怎么起的”量子论”这个不伦不类的名字。 这背后的故事,有必要做个解释。 最早时候,我们想起个与ChatGPT有关的名字,比如“ChatGPT学习指南”、“Ch…

2023最新商业版ChatGPT网站源码4.8.0+功能强大/新增一键安装

正文: 安装教程: 一台VPS 搭建宝塔 解析域名 上传程序至根目录 访问首页在线安装配置数据库 PHP版本选择:7.3 安装完成后访问网站首页即可! 配置APIKEY,登录网站后台自定义配置,不然网站无法使用! 网站后台地址/admin 默…

2023商业版ChatGPT网页版源码V4.4+有后台/功能配置多

正文: 4.4版本来了 V4.4 新增注册用户赠送次数自定义 修复前端密钥明文 V4.3 优化首页加载CSS 之前加载的时候div块会往左边跑 代码安全性逻加强 优化首页输入框换行过高的问题 安装教程: 搭建宝塔 解析域名 上传程序至根目录 配置数据库信息:lib/config.php 导入…