ChatGPT开源系列

article/2024/12/22 7:39:36

目录

进化树

从GPT-4 可以看出未来 LLM 的哪些趋势?未来的研发方向和优化策略是什么?

模型

Stanford Alpaca

可以借鉴的点

llama.cpp

验证阶段已完成

nebullvm-chatllama(待定)

可以借鉴的点

OpenChatKit

可以借鉴的点:

ChatGLM

可以借鉴的点

应用

QA系统

分类任务

其他任务


进化树

基础模型

GPT-4 之后

从GPT-4 可以看出未来 LLM 的哪些趋势?未来的研发方向和优化策略是什么?


 

1)闭源趋势

网友戏称 OpenAI 已沦为 Closed AI。毕竟从 GPT1 到 GPT-4,模型各类细节越来越闭源和黑盒,大模型战场的竞争因素决定了 GPT-4 类的第一梯度模型可能会越来越封闭,成为技术门槛。

2)「Self Instruct」模式

其核心是:中小模型+大模型生产指令数据的「LLaMA 7B + text-davinci-003」模式。中小参数的模型在成本上,是更靠近实际落地的方式。要知道 llama.cpp 可以在 Pixel 6 手机上运行。通过该模式精调过的 Alpaca,效果接近普通 GPT3.5。

3)模型结合

更多模态、更多形态结合 ChatGPT 类模型包括 Kosmos-1 和具身智能 PaLM-E,同时从听、说、看、触等全方位结合,形成类似真正智能体的概念。

4)模型加速和降低成本

这会是持续关注的方向,包括从训练、推理等多层面考量。


 


 

5)能力预测

这是很重要的方向。即用小模型来预测广泛大模型的能力,极大减少试错成本,提升训练效率。

6)开源评测框架

这对于 LLM 的评测具有重大意义,可以快速发现改进方向。

模型

Stanford Alpaca

基于LLaMA.

Alpaca是由Meta的LLaMA 7B微调而来的全新模型,仅用了52k数据,性能约等于GPT-3.5。关键是训练成本奇低,不到600美元。在8个80GB A100上训练了3个小时,不到100美元;生成数据(开放)使用OpenAI的API,500美元。

可以借鉴的点

  1. self-instruct

  1. 数据集示例
  2. 微调代码已放出,微调后的模型没有开源
  • 推理代码参考 官方
  • 中文能力不太行 已有自己的微调版本

推理代码可以参考 llama本身

llama.cpp

基于LLaMA.

在苹果M1/M2芯片上跑LLaMA,130亿参数模型仅需4GB内存,LeCun转赞

优势:c++编译

后续可以再尝试lora版本 有说效果更好 且模型效果更小

训练参考

lora原理

验证阶段已完成

  • 中文数据微调,验证方法可行性。
    • 具体做法:
      • 生成中文种子任务,让ChatGPT生成数据。用了10w的数据去微调

nebullvm-chatllama(待定)

基于LLaMA.

在做一个框架的事情 要集成各个模型进来

  1. 主要参考数据准备阶段
  2. 三阶段提供微调方法

微调脚本

3.推理模块还在开发中

可以借鉴的点

  1. 训练成本

  1. 数据集制作方法

OpenChatKit

基于GPT系列

  • 一个参数量达 20B 的开源模型,该模型基于 EleutherAI 的 GPT-NeoX-20B,在 4300 万条指令上进行了微调;
  • 一个参数量达 60 亿的审核模型(moderation model),可以帮模型过滤不当内容;
  • 一个可扩展的检索系统,可以帮模型检索维基百科等资源库,从而给出最新信息。

可以借鉴的点:

  1. 有训练模块
  2. 有推理模块
  3. 数据准备阶段。数据格式类似OpenAI

在社区中看到训练资源

ChatGLM

基于GLM (清华)

清华开源 千亿基座的对话模型开启内测,对应单卡版本开源

  1. 无官方微调模块,但有其他开源替代方案
  2. 有推理模块
  3. 低成本部署
  4. 数据样本参考开源的方式

可以借鉴的点

  1. 量化,低成本部署,单卡部署

租服务器

应用

qa结合embedding。azure

阿里opensearch 内容社区实现

QA系统

分类任务

有那么多的embedding为什么gpt那么优秀

其他任务


最难的是工程化(技术方案产品落地的的能力),怎么能更好的把各种技术栈堆叠在一起(可能一个功能背后是多个功能/技术栈的结合),且能够无缝连接(把技术点用产品的交互来实现,让用户用最少的理解/使用成本,完成复杂度较高的任务),最后实现一个很好的效果。


http://chatgpt.dhexx.cn/article/lcEwOPF9.shtml

相关文章

ChatGPT发展历程、原理、技术架构详解和产业未来

‍‍ 作者简介: 陈巍 博士,存算一体/GPU架构和AI专家,高级职称。中关村云计算产业联盟,中国光学工程学会专家,国际计算机学会(ACM)会员,中国计算机学会(CCF&…

IDE装上ChatGPT,这款编辑器真的做到可以自动写代码了!

介绍 Cursor 是集成了 GPT-4 的 IDE 工具,目前免费并且无需 API Key,支持 Win、Mac、Linux 平台,可以按要求生成代码,或者让 AI 帮助优化代码,分析代码。Cursor目前已经集成了openai的GPT-4,它或将彻底改变…

IDE + ChatGPT,这款编辑器真的做到可以自动写代码了

介绍 Cursor 是集成了 GPT-4 的 IDE 工具,目前免费并且无需 API Key,支持 Win、Mac、Linux 平台,可以按要求生成代码,或者让 AI 帮助优化代码,分析代码。Cursor目前已经集成了openai的GPT-4,它或将彻底改变…

全球最大ChatGPT开源平替来了!支持35种语言,写代码、讲笑话全拿捏

【导读】刚刚,LAION发布了世界最大ChatGPT开源平替——OpenAssistant。网友上手实测后,纷纷表示这是开源的胜利。 世界最大的ChatGPT平替来了! OpenAssistant是一个开源的对话模型,基于Pythia和LLaMA微调而来,主要用…

ChatGPT插件系统正式开放,不用写代码,人人都是程序员

整理 | 褚杏娟、核子可乐、凌敏 当地时间 3 月 23 日,OpenAI 宣布正式上线了以安全为核心的 ChatGPT 插件系统。OpenAI 插件将 ChatGPT 连接到第三方应用程序,之后 ChatGPT 便能够与开发人员定义的 API 进行交互,从而增强 ChatGPT 的功能并允…

【ChatGPT】使用 Cursor !其中集成了免费的 GPT-4 帮我写代码,写文章,聊天(ChatGPT)

官网是 cursor.so,下载后安装即可使用,无需科学上网。 Github: https://github.com/getcursor/cursor 现在速度又快还免费,只希望收费晚点来。 使用过程中如果一次回复的字数太多了会戛然而止,这时候跟他说“上面的代码没写完,请写完”就可以了。 目录 一、GPT-4在代码…

不敲代码用ChatGPT开发一个App

先说下背景,有一天我在想 ChatGPT 对于成熟的开发者来说已经是一个非常靠谱的助手了,身边也确实有很多同事把它作为一个离不开的助理担当。 但是如果我只是略微懂一点前端知识的新人,了解 HTML、CSS、JS 相关的知识,想开发一个安…

无需VPN,使用chatGPT帮助你写代码

如果你想要编写高效而有效的代码,ChatGPT将成为你最好的工具!ChatGPT是一种强大的自然语言生成技术,它可以为你提供关于编程的灵感和建议。使用ChatGPT,你只需输入一些简单的自然语言,就可以获得代码的建议和修改。无论…

与ChatGPT进行高效对话,生成想要的代码

Prompt Engine:释放创造力的新工具 Prompt EnginePrompt Engine的背景和目的简介背景目的 如何让 Codex 生成您想要的代码什么是prompt-engine-py安装简介架构图下面是PromptEngine类中可以用到的函数以及继承的函数 使用PromptEngine生成prompt使用CodeEngine生成p…

从ChatGPT出发:大模型与自然语言模型

目录 引言基石故事的开始:Transformer异姓兄弟:GPT、Bert与GPT-2GPTBertGPT-2 大力出奇迹:GPT3模型的进化:InstructGPT ChatGPT代码库TransformerGPT-2GPT-3InstructGPT 未来的工作安全性&有效性算力与标注代价的平衡 参考文献…

NLP:《ChatGPT: Optimizing Language Models for Dialogue一种优化的对话语言模型》翻译与解读

NLP:《ChatGPT: Optimizing Language Models for Dialogue一种优化的对话语言模型》翻译与解读 目录 《ChatGPT: Optimizing Language Models for Dialogue》翻译与解读 Abstract Samples 回答修改代码 回答道德问题 回答数学问题 回答如何写信 Methods 三…

ChatGPT的初步学习和认识

文章目录 (一) 使用ChatGPT的体验(二) ChatGPT的优缺点ChatGPT的优势包括:ChatGPT的缺点: (三) ChatGPT的功能 (一) 使用ChatGPT的体验 1)使用chatGPT进行学习,知识点整理 2) 使用chatgpt进行编程 3)请教…

从语言模型到ChatGPT,大模型训练全攻略

文|python 前言 你是否想过,为什么ChatGPT能够如此火爆呢?我认为这主要是因为ChatGPT提供了好玩、有用的对话式交互功能,能够为用户提供帮助,而不仅仅是依靠“大”模型的魅力。毕竟,GPT-3在2020年就已经推出…

ChatGPT:优化对话的语言模型

OpenAI 已经训练了一个名为 ChatGPT 的模型,它以对话方式进行交互。对话格式使 ChatGPT 可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。 今天主要测试了ChatGPT. C# 实现冒泡排序, using System;namespace BubbleSortExample {cl…

关于最近爆火的chatGPT大型语言模型人工智能介绍

1 chatGPT 简介 ChatGPT,一个由OpenAI训练的大型语言模型。被设计为能够理解和回答各种自然语言的问题,包括常见的知识性问题、技术问题、常见的语言问题以及其他各种主题。 chatGPT使用了大规模的神经网络,从海量的文本语料库中学习语言知识…

一文带你了解爆火的Chat GPT

* 导读 OpenAI近期发布聊天机器人模型ChatGPT,迅速出圈全网。它以对话方式进行交互。以更贴近人的对话方式与使用者互动,可以回答问题、承认错误、挑战不正确的前提、拒绝不适当的请求。高质量的回答、上瘾式的交互体验,圈内外都纷纷惊呼。 为…

midjourney ai与ChatGPT结合使用,大大提升返回结果准确率

最近在试用midjourney ai绘图,结合ChatGPT给到更多的特征来说明 如果只是单纯的提问,可能返回杂乱的图片. 提问时要把相关特征,风格,物件都要说清楚,ai才能识别得到,放几张体验照: 生成结束后将会出现两…

万字追溯ChatGPT各项能力的起源

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年1月份热门报告合集 ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 ChatGPT使用总结:150个ChatGPT提示此模板 ChatGPT数据集之谜 …

刚刚,我们和ChatGPT聊了聊边缘计算

ChatGPT是由美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。上线仅仅两个月,ChatGPT的活跃用户就突破一亿,掀起了新一轮人工智能浪潮。作为一款优秀智能聊天机器人模型,ChatGPT在很多事情上都有着独特的见解。今天&#x…

ChatGPT:如何使用正在改变一切的 AI 聊天机器人

转载自ChatGPT: How to use the AI tool thats changing everything | Digital Trends DownLoad 个人中心 ChatGPT 继续通过AI 生成的内容让互联网眼花缭乱,从一个新颖的聊天机器人转变为一项推动下一个创新时代的技术。不过,并不是每个人都参与其中&…